Sesame CSM-1B
Free.ai (self-hosted)
·
tts
·
~500 žetony na žetony clip
Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
Použití přes API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"csm-1b","text":"hello world"}'
Dokumentace API
Získat API klíč
Často kladené otázky
Sesame CSM-1B podporuje širokou škálu jazyků. Přesný seznam závisí na motoru; formulář na této stránce přijímá jakýkoliv text a motor bude vykreslovat ve svých podporovaných jazycích. Podívejte se na /voice/ pro plný multimotorový sběrač, pokud potřebujete konkrétní jazyk.
Většina motorů vykreslí neutrální-americkou angličtinu standardně a region-vhodné akcent pro non-anglické jazyky. Premium motory mohou vystavit varianty akcentu vložit vzorek k porovnání.
Podpora SSML se liší podle motoru. Pauza, prosody, a důraz značky jsou vyznamenány na většině prémiových motorů a na několika samo-hostované ty. Jednoduchý text vždy funguje? není nutné značkování.
Streamování TTS je k dispozici na prémiových motorech přes cíl /v1/tts/ API stream=true. Web UI na této stránce vrací celý klip, jakmile rendering skončí.
Sesame CSM-1B běží na našich vlastních GPU. Generace čerpá z vašeho každodenního volného bazénu jako první. Jakmile vyčerpán, placené žetony začínají na $5 → 200,000 žetonů. Zhruba ~5 žetonů na znak, minimálně 100 na klip.
Až 5 000 znaků na žádost na webovém UI. Pro delší kusy (audiobooky, úplné kapitoly), použijte /voice/audiobook/ který bloky a stehy automaticky, nebo volejte API v smyčce.
Ano POST seznam řetězců na /v1/tts/batch/, nebo použijte pracovní prostor UI v /workspace/ k řetězu TTS do delšího potrubí (např., přeložit → mluvit → oko).
Ano POST text na /v1/tts/ s modelem="Sesame CSM-1B" (nebo slimák na této stránce). Vrací WAV nebo MP3. Viz /api/ pro plné odkazy + SDK úryvky.
Tato stránka je text-to-speech, ne hlas klonování? hlas je výchozím motorem. Pro klonování hlasu (nahrávání referenčního zvuku), viz /voice/clone/, který vyžaduje, abyste buď vlastnit hlasová práva nebo mít výslovný písemný souhlas.
Autohostované motory běží na Free.ai vlastních GPU; nic nenechává naše servery. Premium motory přecházejí text na přední poskytovatele modelů pod naší DPA. Netrénujeme na vašich vstupech a neprodáváme data.
Ano Free.ai poskytuje komerční využití generovaného zvuku. Základní licence motoru (Apache 2.0, MIT, nebo podmínky prodeje) je uvedena výše a na modelové referenční stránce; v praxi to znamená hlasové, reklamy, podcasty, a aplikace jsou všechny in-scope.
Ano, neúspěšné pracovní nabídky auto-refundace ke zdroji (denní bazén nebo placené žetony). Pokud se náhrada neukáže ve stejný den, email contact@free.ai.