CosyVoice 2

Free.ai (self-hosted) · tts · ~500 1 нче clip · 4.3 дан 3 бу категориядәге кулланучылар
~500 1 нче clip

CosyVoice 2 — a тексттан сөйләмгә Alibaba FunAudioLLM тарафыннан төзелгән. РФ су реестры мәгълүматлары: П-Я-Шор-Я. Self-hosted on Free.ai GPUs — runs free against your daily token pool (500 tokens клип өчен). Released under Apache 2.0 — commercial use permitted on Free.ai.

API аша куллану
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"cosyvoice2","text":"hello world"}'
Документация API ключын алу

Кайвакыт бирелә торган сораулар

CosyVoice 2 күп телләрне яклый. Тиздән исемлек двигательгә бәйле; бу биттәге форма теләсә нинди текстны кабул итә һәм двигатель аның яклаган телләрендә күрсәтәчәк. Әгәр сезгә аерым тел кирәк булса, тулы күп-двигательле сайлаучыны /voice/ битендә күрегез.

Күп кенә программалаштыру телләре гадәттәгечә Америка инглиз телен күрсәтә, ә инглиз телен түгел, ә җирле диалектны күрсәтә. Premium программалаштыру телләре диалектлар вариантларын күрсәтә ала — чагыштыру өчен үрнәк куегыз.

SSMLне яклау двигательдән двигательгә үзгәрә. Пауза, прозодия һәм басым тегилары күпчелек премиум двигательләрдә һәм кайбер үз-үзен тотучы двигательләрдә хөрмәт ителә. Гадәти текст һәрвакыт эшли — маркировка кирәкми.

ТТС агымы премиум моторларда /v1/tts/ API тәмамлану урыны аша stream=true белән бар. Бу биттәге веб интерфейсы рендеринг тәмамлангач тулы клипны кайтара.

CosyVoice 2 безнең үз график процессорларыбызда эшли. Башта сезнең көн саен буш булган запасыгыздан генерацияләнә. Ачылганнан соң, түләүле уенчыклар $5 → 200,000 уенчыклардан башлана. Һәр символ өчен якынча ~5 уенчык, һәр клип өчен кимендә 100 уенчык.

Веб-интерфейста бер сорауга 5000 символга кадәр. Озынрак өлешләр өчен (аудиокитаплар, тулы бүлекләр), /voice/audiobook/ кулланыгыз, ул автоматик рәвештә кисәкләр һәм бәйләнешләр ясый, яки API-ны кабатлап чакыра.

Yes — POST a list of strings to /v1/tts/batch/, or use the workspace UI at /workspace/ to chain TTS into a longer pipeline (e.g., translate → speak → stitch).

Әйе — /v1/tts/ адресына POST тексты белән model="CosyVoice 2" (яки бу биттәге slug) җибәрелә. WAV яки MP3 форматында кайтарыла. /api/ адресын карагыз тулырак мәгълүмат өчен + SDK фрагментлары.

Бу бит җөмләдән сүзгә күчерү, тавыш клонлаштыру түгел — тавыш моторның төп параметры. тавыш клонлаштыру (аудио файлны күчерү) өчен /voice/clone/ битенә карагыз, бу сезгә тавыш хокукларын яки язмача рөхсәтне таләп итә.

Үз-үзен тотучы моторлар Free.ai-га караган график процессорларда эшли; безнең серверлардан берни дә чыкмый. Премиум моторлар текстны безнең DPA нигезендә модель бирүчеләргә бирә. Без сезнең кертемнәрне өйрәнмибез һәм мәгълүматны сата алмыйбыз.

Әйе — Free.ai генерацияләнгән аудионы коммерция максатларында кулланырга рөхсәт итә. Моторның нигезендә булган лицензия (Apache 2.0, MIT яки сатучы шартлары) югарыда һәм модельнең сылтама битендә күрсәтелә; бу практикада тавыш яздыру, реклама, подкастлар һәм кулланмалар өчен дә кулланыла.

Әйе — хаталы эшне автоматик рәвештә чыганакка кире кайтару (көн саен җыелган яки түләүле буш урыннар). Әгәр кире кайтару шул ук көнне күренмәсә, contact@free.ai адресына электрон хат җибәрегез.

Free.aiне яратасызмы?

Бу битне бәяләү