AI Voice — Sesame CSM-1B

Коммерцияле куллану өчен 380 — өч урынлы җөп сан. Су билгесе юк Күзәтү кирәкми
Модель:
+ GPT-5, Claude, Gemini
ТТС моторы Үз-үзен тоту Apache 2.0
Sesame CSM-1B — Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
0 символ ~0 очко
Сыйфатлар саны белән бәяләр шкаласы
Сүзләр төзелә...

Ни өчен Sesame CSM-1B Ничек уйлыйсыз?

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

Бу терминның берничә мәгънәсе бар: Сэмюэл Смит Сэмюэл Смит (ингл. Samuel Smith) — АКШ язучысы, «Семьюэл Смит» романы авторы.

Кайчан кулланырга Sesame CSM-1B

Аудиокитаплар

Бертөрле тон белән озын формадагы сөйләм. Бер вакытта бер бүлекне урнаштырыгыз, WAV яки MP3 форматында төшерегез, һәм тыштан берләштерегез.

Подкастлар

Кыска ачылу буферлары һәм рекламалар. Энергияне саклау өчен тизлекне көйләгез, кечкенә файллар өчен MP3 форматына күчегез.

Иң яхшы

Телефон системасы сораулары. Студия сыйфатындагы чыганак, тавыш таланты белән резервлау, яздыру яки NDAсыз.

Мөмкинлекләр

Күзләре начар күрүче һәм дислексик укучылар өчен язма эчтәлек белән беррәттән аудионы да өсти аласыз. Бу теләсә кайсы биткә кертелә.

Мәсәлән

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

Сатып алу

Графика процессорларында үз-үзеңне тоту. Генерация көн саен сезнең бушлай фондтан беренче булып ала; ул беткәч, түләүле иконкалар пакетлары $5 → 200 000 иконкадан башлана. Һәр символ өчен якынча ~5 иконка, һәр клип өчен кимендә 100 иконка.

Төп модельгә сылтама → · Барлык TTS тавышларын карау → · 2 тавышны бер-берсенә чагыштыру →

Тәгәрмәч параметрлары
Нәтиҗәләр
Көньяк-көнбатышта утрау белән чиктәш. Get More Tokens
Want better results? Премиум модельләр (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Free.aiне яратасызмы?

Рефераль сылтама алу өчен теркәлегез һәм һәр дус өчен 25 000 очко алыгыз.

Аннары тагын? Sign up free for 10,000 tokens
Бушлай теркәлү

Сезнең сорауыгыз эшкәртелә...

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio …

Ничек кулланырга AI Voice — Sesame CSM-1B

1
Кергән мәгълүматны кертегез

Мәкаләне кертегез, файлны куегыз яки сез теләгәнне аңлатыгыз. Счет кирәкми.

2
Җитештерү өчен кликлау

2000 елдан башлап, ул үзенең иң яхшы уеннарын уенчылар белән уртаклаша.

3
Өчпочмаклы

Сезнең нәтиҗәләрне төшерегез, күчерегез яки уртаклашыгыз. Үзегез һәм коммерция өчен бушлай.

Бу инструментны API аша куллану

Бу инструментны үз кодыгыздан автоматлаштырыгыз. OpenAI-га туры килгән REST ахыры, Bearer-токен аутентификациясе, өстәмә SDK кирәкми. Токеннар бәясе веб интерфейска туры килә.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — Sesame CSM-1B — FAQ

Sesame CSM-1B supports a wide range of languages. The exact list depends on the engine; the form on this page accepts any text and the engine will render in its supported languages. See /voice/ for the full multi-engine picker if you need a specific language.

Most engines render neutral-American English by default and a region-appropriate accent for non-English languages. Premium engines may expose accent variants — paste a sample to compare.

SSML support varies by engine. Pause, prosody, and emphasis tags are honored on most premium engines and on a few self-hosted ones. Plain text always works — no markup required.

Streaming TTS is available on premium engines via the /v1/tts/ API endpoint with stream=true. The web UI on this page returns the full clip once rendering finishes.

Sesame CSM-1B runs on our own GPUs. Generation draws from your daily free pool first. Once depleted, paid tokens start at $5 → 200,000 tokens. Roughly ~5 tokens per character, minimum 100 per clip.

Up to 5,000 characters per request on the web UI. For longer pieces (audiobooks, full chapters), use /voice/audiobook/ which chunks and stitches automatically, or call the API in a loop.

Yes — POST a list of strings to /v1/tts/batch/, or use the workspace UI at /workspace/ to chain TTS into a longer pipeline (e.g., translate → speak → stitch).

Yes — POST text to /v1/tts/ with model="Sesame CSM-1B" (or the slug on this page). Returns WAV or MP3. See /api/ for full reference + SDK snippets.

This page is text-to-speech, not voice cloning — the voice is the engine's default. For voice cloning (uploading a reference audio), see /voice/clone/, which requires you to either own the voice rights or have explicit written consent.

Self-hosted engines run on Free.ai-owned GPUs; nothing leaves our servers. Premium engines pass text to upstream model providers under our DPA. We do not train on your inputs and do not sell data.

Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.

Yes — failed jobs auto-refund to the source (daily pool or paid tokens). If a refund does not show up the same day, email contact@free.ai.

10 000 дән артык фәнни хезмәт авторы.

Акчасыз исәп-хисапны булдыру

Кредит картасы кирәкми

Сез бу ярдәмчегә ничек бәя бирер идегез?

4.3/5 from 3 ratings

Free.aiне яратасызмы?