AI Voice — Sesame CSM-1B

سوداګريزه کارونه 380+ ماډلونه هېڅ اوبه نښه هېڅ ننوت اړين نه دی
:ډول
+ GPT-5, Claude, Gemini
ټټس انجن ځان کوربه Apache 2.0
Sesame CSM-1B — Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
0 لوښه ۰ توکي
د لوښه شمېر سره د لګښت کچونه
... وينا جوړول کيږي

څه کوي Sesame CSM-1B څرنګه غږيږي؟

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

د پورته بکس سره هڅه وکړئ: سلام، زما نوم سم دی، او زه دا نمونه د غږ ښودلو لپاره لولم. - دا د کانوني TTS ډیمو جملې ده.

کله کارول Sesame CSM-1B

غږيز کتابونه

د دوامداره ږغ سره اوږده بڼه. په یوه وخت کې یو فصل واچوئ، د WAV یا MP3 په توګه ډاونلوډ کړئ، او بهر یې واچوئ.

پوډکاسټ پېلونه

د انرژۍ لپاره سرعت تنظیم کړئ، د کوچنیو فایلونو لپاره MP3 ته بڼه بدل کړئ.

IVR + غږیز برېښنالیک

د تلیفون سیسټم سپارښتنې. د سټوډیو کیفیت محصول پرته له بلنې، ریکارډ کولو، یا د غږ مهارتونو سره NDAs.

لاسرسی

د ټیټ لید او dyslexic لوستونکو لپاره د لیکلي محتوا سره سم غږ اضافه کړئ. په هرې پاڼې کې ولولئ.

مثالونه

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

نرخونه

نسل لومړی د خپل ورځني وړیا حوض څخه راځي؛ کله چې دا بهر راځي، د تادیې توکو بسته په $ 5 کې پیل کیږي → 200,000 توکو. په هر شخصیت کې ~ 5 توکو، لږترلږه 100 په هر کلیپ کې.

بشپړه بېلګه → · ټول غږونه TTS وګورﺉ → · 2 غږونه سره پرتله کړئ →

ژور غوراوي
پایله
.ټېکېنونه کم دي Get More Tokens
Want better results? د برياليتوب ماډلونه (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Free.ai مینه؟ خپل ملګرو ته ووایاست!

سپړنه وکړئ د حوالې لینک ترلاسه کولو او د هر ملګري لپاره د 25,000 توکو ترلاسه کولو لپاره.

نور غواړﺉ؟ Sign up free for 10,000 tokens
د وړيا لپاره راجستر شئ

...ستاسو غوښتنه بهير کيږي

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio …

څنګه کارول AI Voice — Sesame CSM-1B

1
خپل ننوت وليکﺉ

ليکنه وليکﺉ، دوتنه رالېښﺉ، يا هغه څه وټاکﺉ چې غواړﺉ. هېڅ ګڼون نه اړين دی.

2
جوړولو ته کېکاږﺉ

زموږ AI ستاسو غوښتنه په ثانیو کې د غوره خلاص سرچینې ماډلونو په کارولو سره پروسس کوي.

3
رالېښل & ونډول

ډاونلوډ، کاپي، یا ستاسو د پایلو شریکول. د شخصي او سوداګریزو کارونې لپاره وړیا.

دا توکي په API کارول

د خپل کوډ څخه دا وسیله اتومات کړئ. د OpenAI-متوافق REST پای ټکی، د بارر-ټوکن اېټ، اضافي SDK ته اړتیا نلري. د توکن لګښتونه د ویب انٹرفیس سره مطابقت لري.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — Sesame CSM-1B — FAQ

Sesame CSM-1B supports a wide range of languages. The exact list depends on the engine; the form on this page accepts any text and the engine will render in its supported languages. See /voice/ for the full multi-engine picker if you need a specific language.

Most engines render neutral-American English by default and a region-appropriate accent for non-English languages. Premium engines may expose accent variants — paste a sample to compare.

SSML support varies by engine. Pause, prosody, and emphasis tags are honored on most premium engines and on a few self-hosted ones. Plain text always works — no markup required.

Streaming TTS is available on premium engines via the /v1/tts/ API endpoint with stream=true. The web UI on this page returns the full clip once rendering finishes.

Sesame CSM-1B runs on our own GPUs. Generation draws from your daily free pool first. Once depleted, paid tokens start at $5 → 200,000 tokens. Roughly ~5 tokens per character, minimum 100 per clip.

Up to 5,000 characters per request on the web UI. For longer pieces (audiobooks, full chapters), use /voice/audiobook/ which chunks and stitches automatically, or call the API in a loop.

Yes — POST a list of strings to /v1/tts/batch/, or use the workspace UI at /workspace/ to chain TTS into a longer pipeline (e.g., translate → speak → stitch).

Yes — POST text to /v1/tts/ with model="Sesame CSM-1B" (or the slug on this page). Returns WAV or MP3. See /api/ for full reference + SDK snippets.

This page is text-to-speech, not voice cloning — the voice is the engine's default. For voice cloning (uploading a reference audio), see /voice/clone/, which requires you to either own the voice rights or have explicit written consent.

Self-hosted engines run on Free.ai-owned GPUs; nothing leaves our servers. Premium engines pass text to upstream model providers under our DPA. We do not train on your inputs and do not sell data.

Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.

Yes — failed jobs auto-refund to the source (daily pool or paid tokens). If a refund does not show up the same day, email contact@free.ai.

د 10,000 ټوکنونو لپاره وړیا راجستر کړئ

وړيا حساب جوړ کړئ

د کریډیټ کارډ نه اړین

تاسو به دا توکي څنګه درجه بندي کړئ؟

4.3/5 from 3 ratings

Free.ai مینه؟ خپل ملګرو ته ووایاست!