Kokoro TTS (premium endpoint)
Free.ai
·
tts
·
~500 tokens per clip
·
4.3
dari 3 pengguna kategori ini
Kokoro TTS (premium endpoint) adalah a suara teks-ke-tutusan. Dilalui melalui model luaran — ~500 token setiap klip (50% markup melebihi kos aliran atas).
Guna melalui API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/kokoro-tts","text":"hello world"}'
Dokumentasi API
Dapatkan Kekunci API
Soalan Lazim
Kokoro TTS (premium endpoint) menyokong pelbagai bahasa. Senarai tepat bergantung pada enjin; borang pada halaman ini menerima sebarang teks dan enjin akan mengekspresikan dalam bahasa yang disokong. Lihat /voice/ untuk pemilih enjin berbilang penuh jika anda memerlukan bahasa tertentu.
Kebanyakan enjin mengekspresikan bahasa Inggeris Amerika neutral secara lalai dan sebutan yang sesuai dengan kawasan untuk bahasa bukan Inggeris. Enjin premium mungkin memaparkan varian sebutan - tampal contoh untuk membandingkan.
Sokongan SSML berlainan mengikut enjin. Tag jeda, prosodi, dan penekanan dihormati pada kebanyakan enjin premium dan beberapa enjin yang dihost sendiri. Teks biasa sentiasa berfungsi — tiada penanda diperlukan.
Strim TTS tersedia pada enjin premium melalui titik akhir /v1/tts/ API dengan stream=true. UI web pada halaman ini mengembalikan klip penuh apabila render selesai.
Kokoro TTS (premium endpoint) adalah enjin TTS premium. Kosnya berskala dengan bilangan aksara — biasanya ~30 token per aksara. $1 membeli 750,000 token, jadi pakej $5 merangkumi puluhan ribu aksara.
Sehingga 5,000 aksara per permintaan pada UI web. Untuk bahagian yang lebih panjang (buku audio, bab penuh), gunakan /voice/audiobook/ yang memotong dan menjahit secara automatik, atau panggil API dalam lilitan.
Ya — POST senarai rentetan ke /v1/tts/batch/, atau guna UI ruangkerja pada /workspace/ untuk rantai TTS ke dalam paip yang lebih panjang (cth, menterjemah → bercakap → stitch).
Ya — POST teks ke /v1/tts/ dengan model="Kokoro TTS (premium endpoint)" (atau slug pada halaman ini). Kembalikan WAV atau MP3. Lihat /api/ untuk rujukan penuh + snippet SDK.
Halaman ini adalah teks-ke-tutur, bukan klon suara — suara adalah piawai enjin. Untuk klon suara (memuat naik audio rujukan), lihat /voice/clone/, yang memerlukan anda mempunyai hak suara atau mempunyai kebenaran tertulis yang jelas.
Enjin sendiri-hosting berjalan pada GPU milik Free.ai; tiada apa yang meninggalkan pelayan kami. Enjin premium menghantar teks kepada pembekal model atas aliran di bawah DPA kami. Kami tidak melatih pada input anda dan tidak menjual data.
Ya — Free.ai memberi kebenaran penggunaan komersial audio yang dijana. Lesen enjin yang mendasari (Apache 2.0, MIT, atau terma pembekal) dipaparkan di atas dan pada halaman rujukan model; dalam praktik ini bermakna suara, iklan, podcast, dan aplikasi semuanya dalam skop.
Ya — kerja gagal auto-pulangkan ke sumber (pool harian atau token dibayar). Jika pengembalian tidak muncul pada hari yang sama, emel contact@free.ai.