Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 жетон/ секунд clip · 4.3 одан 3 санаттағы пайдаланушылар
~500 жетон/ секунд clip

Sesame CSM-1B — a мәтін- дыбысComment Sesame жасаған. 1995 жылы «Бесінші арна» (қаз. Free.ai ГБ-қа дейінгі графикалық процессорларда өздігінен хостталған — күнделікті токендеріңізге қарсы тегін жұмыс істейді (500 токендері Клип үшін). Released under Apache 2.0 — commercial use permitted on Free.ai.

API арқылы қолдану
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
API құжаттамасы API кілтін алу

Жиі қойылатын сұрақтар

Sesame CSM-1B көптеген тілдерді қолдайды. Тізімнің толықтығы тетігіне байланысты; бұл беттегі пішін кез келген мәтіндерді қабылдайды, ал тетігі қолдайтын тілдерді көрсетеді. Егер тіл керек болса, көп- тетігін таңдау үшін / voice / дегенді қараңыз.

Көптеген тетігі әдетті түрде бейтарап американдық ағылшын тілін көрсетеді, ал ағылшын емес тілдер үшін жергілікті акцентті қолданады. Premium тетігі акценттің басқа түрлерін көрсете алады, салыстыру үшін мысалды орналастырыңыз.

SSML қолдауы тетігіне байланысты. Pause, prosody, emphasis тегтері көбінесе жоғары деңгейлі тетіктерде және кейбір жеке хостта қолданылады. Кәдімгі мәтін әрқашан жұмыс істейді - тегтеу қажет емес.

TTS- тың ағыны /v1/ tts/ API- нің endpoint арқылы stream=true параметрімен premium тетігінде қол жетімді. Бұл беттегі веб- интерфейс рендеринг аяқталғанда толық клипти қайтарады.

Sesame CSM-1B біздің өз графикалық процессорымызда орындалады. Алдымен күнделікті бос қорыңыздан жиналады. Қорыңыз біткен соң, төлемді жетондар $5 → 200,000 жетоннан басталады. Әрбір символ үшін шамамен ~5 жетон, клип үшін кемінде 100 жетон.

Веб интерфейсінде бір сұраныс 5000 таңбаға дейін. Ұзын фрагменттер үшін (аудиокітап, толық тараулар) /voice/audiobook/ дегенді қолданыңыз, ол автоматты түрде бөліп, біріктіреді, немесе API-ны цикл бойынша шақырыңыз.

Yes — /v1/tts/batch/ дегенге жолдар тізімі POST, немесе /workspace/ дегендегі жұмыс кеңістігінің UI-ін пайдаланып, TTS-ті ұзақ конвейерге жалғау (мысалы, translate → speak → stitch).

Иә — / v1/ tts / дегенге POST мәтінін model=" Sesame CSM-1B "мен (немесе осы беттегі slug- пен) жібереді. WAV не MP3 файлын қайтарады. Толық сілтеме + SDK фрагменттері үшін / api / дегенді қараңыз.

Бұл бет мәтіннен сөйлеуге ауысу, дауысты клондау емес - дауыс тетігінің әдетті параметрі. Дауысты клондау (басқа дауысты жүктеу) үшін /voice/clone/ дегенге қараңыз, бұл үшін дауыс құқығы немесе жазбаша рұқсат қажет.

Өзінің тетігі Free.ai- ге тиесілі графикалық процессорларда жұмыс істейді; ештеңе серверімізден кетпейді. Premium тетігі мәтіндерді DPA- ның негізінде модель провайдерлеріне береді. Біз сіздің енгізіміңізді оқытпаймыз және деректерді сатпаймыз.

Иә — Free.ai генерацияланған аудионы коммерциялық пайдалануға рұқсат береді. Тетігінің негізі лицензиясы (Apache 2.0, MIT немесе өндірушінің шарттары) үстінде және үлгі сілтеме бетінде көрсетіледі; практикада бұл дыбыс жазу, жарнама, подкасттар және қолданбалар барлығы қолданылады дегенді білдіреді.

Иә — орындалмаған тапсырмалар автоматты түрде қайтарылсын (күнделікті жинақ немесе төленетін жетондар). Егер қайтару сол күні көрінбесе, contact@free.ai эл. поштасына хабарлаңыз.

Free.ai-ды ұнатасыз ба? Достарыңызға хабарлаңыз!

Парақты бағалау