Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 бирдик clip · 4.3 _Жаңылоо 3 категориядагы колдонуучулары
~500 бирдик clip

Sesame CSM-1B - a текст-сөзгө, Sesame тарабынан курулган. Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads. боюнча эң күчтүү. Free.ai ГПУда өзүнчө жайгаштырылган — сиздин күн сайынгы токендердин пулу менен акысыз иштей алат (500 токендер Клип үчүн). Apache 2.0 лицензиясы менен чыгарылат — коммерциялык колдонууга Free.aiде уруксат берилген.

API аркылуу колдонуу
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
Документация API ачкычын алуу

Кайсы убакта суроолор берилет

Sesame CSM-1B колдогон тилдердин саны көп. Тез арада тизме иштелип чыккан программага жараша өзгөрөт; бул барактагы форма каалаган текстти кабыл алат жана программа колдогон тилдердин тизмесин көрсөтөт. Эгерде сизге конкреттүү тил керек болсо, анда /voice/ дегенди караңыз.

Көпчүлүк программалык камсыздоо стандарттуу түрдө нейтралдуу америкалык англис тилин жана англис эмес тилдер үчүн регионго ылайыктуу акцентти көрсөтөт. Premium программалык камсыздоолору акценттин варианттарын көрсөтө алышат — салыштыруу үчүн мисалды киргизиңиз.

SSML колдоосу движоктун түрүнө жараша өзгөрөт. Пауза, прозодия жана басым тегдери көпчүлүк премиум движоктарда жана кээ бир жеке уюмдарда колдонулат. Текст дайыма иштей берет — маркировка талап кылынбайт.

Транслирование TTS доступно на премиум-двигателях через /v1/tts/ API endpoint with stream=true. Веб-интерфейс на этой странице возвращает полный клип после завершения отображения.

Sesame CSM-1B биздин өз графикалык процессорлорубузда иштейт. Генерациялоо биринчи кезекте сиздин күн сайынгы акысыз топтомдоруңуздан башталат. Ачылуудан кийин, төлөнүүчү токендер $5 → 200,000 токендерден башталат. Бир символ үчүн болжол менен ~5 токен, бир клип үчүн минимум 100.

Веб-интерфейсте бир суроого 5000 символго чейин. Узак тексттер үчүн (аудиокитептер, толук бөлүктөр) /voice/audiobook/ колдонуп, автоматтык түрдө бөлүктөрдү жана бөлүктөрдү бириктирүү, же APIни цикл менен чакыруу.

Да — POST строктардын тизмесин /v1/tts/batch/'ге, же иштетүү чөйрөсүнүн интерфейсин /workspace/'де колдонуп, TTS'ди узун каналга бириктирүү (мисалы, translate → speak → stitch).

Да — текст POST /v1/tts/ менен model="Sesame CSM-1B" (же бул барактагы slug). WAV же MP3 форматында кайтарылат. Толук шилтеме + SDK фрагменттери үчүн /api/ дегенди караңыз.

Бул барак текст-в-слов, үн-клонирование эмес — үн - бул двигательдин стандарты. Сөз-клонирование (загрузка справочного аудио) - это /voice/clone/, для которого требуется либо владение правом на голос, либо письменное разрешение.

Өзүнө-өзү кызмат көрсөткөн двигатели работают на Free.ai-собственных GPU; ничто не покидает наши серверы. Премиум-двигатели передают текст нашим DPA подрядчикам. Мы не тренируем ваши вводные данные и не продаем данные.

Да — Free.ai генерацияланган аудиону коммерциялык максатта колдонууга уруксат берет. Двигательдин негизи болгон лицензия (Apache 2.0, MIT же дилердин шарттары) жогоруда жана моделдин шилтеме бетинде көрсөтүлөт; практикада бул үн жаздыруу, жарнама, подкасттар жана тиркемелерди колдонууга уруксат берет.

Да — неудачные задания автоматически возвращаются источнику (ежедневному пулу или оплаченным токенам). Если возврат не появится в тот же день, отправьте электронное письмо на адрес contact@free.ai.

Free.aiди сүйөсүңбү? Досторуңа айт!

Бул барактын баасын берүү