CosyVoice 2

Free.ai (self-hosted) · tts · ~500 ҳар бир clip · 4.3 дан 3 бу тоифадаги фойдаланувчилар
~500 ҳар бир clip

CosyVoice 2 a матндан-сўзга овоз томонидан Alibaba FunAudioLLM томонидан яратилган. Low-latency streaming TTS, cross-lingual voice cloning, real-time voice. да энг кучли. Free.ai GPU'ларда ўз-ўзидан жойлаштирилган — сизнинг кундалик токенларингизга қарши бепул ишлайди (500 токенлар ҳар бир клип учун). Apache 2.0 остида чиқарилган — Free.ai дан коммерциявий фойдаланишга рухсат берилган.

API орқали фойдаланиш
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"cosyvoice2","text":"hello world"}'
Ҳужжатлаштириш API калитини олиш

Кўп бериладиган саволлар

CosyVoice 2 кўплаб тилларни қўллаб-қувватлайди. Тўғри рўйхат двигателга боғлиқ; бу саҳифадаги шакл ҳар қандай матнни қабул қилади ва двигатель қўллаб-қувватланадиган тилларда кўрсатади. Агар сизга маълум тил керак бўлса, тўлиқ кўп тилли двигатель танлаш учун /voice/ ни кўринг.

Кўпгина двигателлар стандарт равишда Америка инглиз тилида ва инглиз тили бўлмаган тиллар учун минтақага мос акцент билан кўрсатади. Premium двигателлари акцент вариантларини кўрсатиши мумкин — таққослашни ўрнатиш учун намунани жойланг.

SSML қўллаб-қувватлаши двигательга қараб ўзгаради. Пауза, прозодия ва диққатга сазовор тегилар кўплаб премиум двигателларда ва баъзи ўз-ўзини бошқарувчиларида ҳурмат қилинади. Оддий матн доимо ишлайди — маркалаш талаб этилмайди.

TTS стримини premium моторларда /v1/tts/ API охиридаги stream=true орқали олиш мумкин. Бу саҳифадаги веб интерфейси тасвирлаш тугаганидан сўнг тўлиқ клипни қайтаради.

CosyVoice 2 ўз GPUларимизда ишлайди. Аввал сизнинг кундалик бепул пулингиздан чиқарилади. Бир марта тугаганидан кейин, тўловли токенлар $5 → 200,000 токендан бошланади. Ҳар бир характер учун тахминан ~5 токен, ҳар бир клип учун камида 100.

Веб интерфейсида бир марталик талаб учун 5000 гача белги. Умумий қисмлар учун (аудиокитобалар, тўлиқ боблар) /voice/audiobook/ ни фойдаланинг, бу автоматик равишда парчалар ва боғламаларни ҳосил қилади ёки API ни айланма тарзда чақиради.

Ҳа — /v1/tts/batch/га сатрлар рўйхатини POST қилинг ёки /workspace/даги иш жойи интерфейсини TTSни узунроқ қувурга боғлаш учун фойдаланинг (масалан, таржима → гапириш → боғлаш).

Ҳа — /v1/tts/га POST матнини model="CosyVoice 2" (ёки бу саҳифадаги slug) билан юборади. WAV ёки MP3 қайтаради. /api/ ни тўлиқ манба + SDK парчалари учун кўринг.

Бу саҳифа матндан сўзга, овозни клонлашдан эмас - овоз моторнинг стандарти. Товушни клонлаш учун (реквизит аудиони юклаш), /voice/clone/ ни кўринг, бу сизга овоз ҳуқуқини ёки аниқ ёзма рухсатни талаб қилади.

Ўз-ўзини бошқарувчи двигателлар Free.ai-га тегишли GPUларда ишлайди; бизнинг серверларимиздан ҳеч нарса чиқмайди. Premium двигателлари матнни DPA остида юқоридаги моделлар провайдерларига ўтказади. Биз сизнинг киритишларингизни ўқитмаймиз ва маълумотларни сотмаймиз.

Ҳа — Free.ai яратилган аудиони савдо мақсадларида фойдаланишга рухсат беради. Двигательнинг асосли лицензияси (Apache 2.0, MIT ёки ишлаб чиқарувчи шартлари) юқорида ва модел манба саҳифасида кўрсатилган; бу амалда овозли ёзувлар, рекламалар, подкастлар ва дастурларнинг барчаси доирада эканини англатади.

Ҳа — муваффақиятсиз ишлар манбага автоматик равишда қайтарилади (кунлик пул ёки тўлов теги). Агар қайтариш ўша кунда пайдо бўлмаса, contact@free.ai электрон почтасига хабар юборинг.

Free.aiни севасанми? Дўстларингга айт!

Бу саҳифани баҳолаш