Cartesia Sonic 3 (real-time)
Free.ai
·
tts
·
~500 tl> token bawat clip
·
4.3
mula sa 3 Mga gumagamit ng kategoryang ito
Ang Cartesia Sonic 3 (real-time) ay isang a at > text-to-speech boses. Ang mga ito ay: 1.
> Gamitin sa pamamagitan ng API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/cartesia/sonic-3","text":"hello world"}'
API Dokumentasyon
> Kumuha ng API Key
Mga Madalas Itanong
Ang eksaktong listahan ay depende sa engine; ang form sa pahinang ito ay tumatanggap ng anumang teksto at ang engine ay magrerender sa mga suportadong wika. Tingnan ang /voice/ para sa buong multi-engine picker kung kailangan mo ng isang partikular na wika.
> Karamihan sa mga engine ay nagpapakita ng neutral-American English sa pamamagitan ng default at isang rehiyon-angkop na accent para sa mga di-Ingles na wika. Premium engine ay maaaring mag-expose accent variants - i-paste ang isang sample upang ihambing.
SSML suporta ay nag-iiba sa pamamagitan ng engine. Pause, prosody, at emphasis tags ay pinarangalan sa karamihan ng mga premium engine at sa ilang mga self-hosted mga. Plain text palaging gumagana — walang markup na kinakailangan.
Ang streaming TTS ay magagamit sa premium engine sa pamamagitan ng /v1/tts/ API endpoint na may stream=true. Ang web UI sa pahinang ito ay nagbabalik ng buong clip kapag natapos ang pagrender.
Ang Cartesia Sonic 3 (real-time) ay isang premium na TTS engine. Ang gastos ay umaayon sa bilang ng mga character — karaniwang ~30 token bawat character. $1 ang nagkakahalaga ng 750,000 token, kaya ang isang $5 pack ay sumasaklaw sa sampu-sampung libong mga character.
Para sa mas mahabang mga piraso (audiobooks, buong kabanata), gamitin ang /voice/audiobook/ na chunks at stitches awtomatikong, o tumawag sa API sa isang loop.
Ang mga ito ay maaaring maging mga karaniwang mga salita (tulad ng "pag-ibig" o "pag-ibig") o mga salitang may iba't ibang kahulugan (tulad ng "pag-ibig" o "pag-ibig").
tl> Oo — POST teksto sa /v1/tts/ na may modelo =" Cartesia Sonic 3 (real-time) "(o ang slug sa pahinang ito). Bumalik WAV o MP3. Tingnan ang /api/ para sa buong sanggunian + SDK snippets.
Ang pahinang ito ay teksto-sa-pagsasalita, hindi cloning ng boses — ang boses ay default ng engine. Para sa cloning ng boses (pag-upload ng isang reference audio), tingnan ang /voice/clone/, na nangangailangan sa iyo na maging may-ari ng mga karapatan sa boses o magkaroon ng malinaw na nakasulat na pahintulot.
> Self-hosted engine tumatakbo sa Free.ai-ari GPUs; wala ay umaalis sa aming mga server. Premium engine ipasa ang teksto sa upstream modelo provider sa ilalim ng aming DPA. Hindi namin tren sa iyong mga input at hindi ibenta ang data.
Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.
> Oo — nabigo trabaho auto-refund sa pinagmulan (araw-araw pool o bayad na token). Kung ang isang refund ay hindi lumitaw sa parehong araw, email contact@free.ai.