CosyVoice 2
Free.ai (self-hosted)
·
tts
·
~500 _Göçür clip
·
4.3
_Gün 3 bu katydaky ulanyjylar
metinde-söz-ediş ses by Alibaba FunAudioLLM Low-latency streaming TTS, cross-lingual voice cloning, real-time voice.-da iň güýçli Free.ai GPUs üstünde öz-özüne-hosting — siziň gündelik token pool (500 tokens klip üçin) garşy azat işleýär. Apache 2.0 astynda çykaryldy — Free.ai-de söwda ulanmak üçin rugsat berildi.
API arkaly ullan
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"cosyvoice2","text":"hello world"}'
Senedler
API Adyny Al
Gynançly Soraglar
CosyVoice 2 dilleriň giň bir sanawyny goldaýar. Tam sanawy enjamdan baglydyr; bu sahypadaky forma her bir metin kabul eder we enjam onuň goldaýan dillerinde render eder. Eger belli bir dile zerurlyk bar bolsa doly köp-enjam saýlaýjy üçin /voice/ gör.
Enjamyň köpüsi öň bellenen ýaly Amerikaly-Amerikanly inçeni we inçe däl diller üçin region-dogry aksentni görkezýär. Premium enjam aksent çeşmelerini görkezip biler - deňeşdirmek üçin bir mysal goşuň.
SSML goldawy motordan motora üýtgeýär. Dur, prosody, we emphasis taglar köp premium motorlarda we birnäçe öz-özüne-hosting edenlerde hormatlanýar. Saý metin her wagt işleýär — hiç bir marks gerek däl.
TTS öwürmek premium enjinlerde /v1/tts/ API soň noktasy bilen stream=true arkaly elýeterlidir. Bu sahypadaky web UI renderleme tamamlanandan soň doly klipi gaýtarýar.
CosyVoice 2 öz GPUs-da işleýär. Önümçilik siziň her günki boş puldan öňe çekýär. Bir gezek tükenenden, tölegli tokeni $5 → 200,000 tokeni bilen başlaýar. Her bir karakter üçin ~5 tokeni, klip üçin iň az 100.
Web UI-de islegde 5000 karaktere çenli. Uzak parçalar üçin (audiokitablar, doly bölümler), /voice/audiobook/ ullan, ol awtomatiki bölüp we birikdir, ýa-da API'yi bir döwre çagyr.
Eý — POST bir meňzeşlik sanawyny /v1/tts/batch/'e, ýa-da TTS'i uzaga geçirmek üçin /workspace/'de iş meýdança UI'den peýdalanyp git (m.a., terjime et → gürle → örüm).
Eý — POST metin /v1/tts/ bilen model="CosyVoice 2" (ýa bu sahypadaky slug). WAV ýa MP3 gaýtarýar. Eň doly referans + SDK snippets üçin /api/ gör.
Bu sahypa ses klonlamak däl, metinde-söz klonlamak - ses enjamyň öň bellenen sesidir. Ses klonlamak üçin (referens audio ýüklemek), /voice/clone/ gör, bu ýa ses haklaryny özleşdirmek ýa-da belli bir ýazmaça ylalaşmak talap edýär.
Öz-özüni-hosting enjinler Free.ai-owned GPUs üstünde işleýär; hiç zat biziň serwerlerimizden çykmaýar. Premium enjinler metinleri biziň DPA astynda upstream model providers'e geçirýär. Biz siziň girişleriňize öwrenişmän we maglumat satmaýan.
Eý — Free.ai döreden sesiň söwdaly ulanmak hukugyny berer. Enjamyň aşakdaky lisenziýasy (Apache 2.0, MIT, ýa-da satyjy şertleri) üste we model referans sahypasynda görkezilýär; praktiki taýdan bu sesli, reklama, podkast, we programmalaryň ählisi içerdedir.
Eý — batly bolmadyk işleriň otomatik gaýdyşyny çeşmä (günlik pool ýa-da tölegli tokeni) kabul et. Eger gaýdyş aňşy günde görünmese, contact@free.ai e-poçta iber.