AI Voice — Sesame CSM-1B

تجارتی استعمال ٹھیک ہے ماڈل کوئی واٹرمارک نہیں کوئی سائن اپ کی ضرورت نہیں
ماڈل:
+ GPT-5, Claude, Gemini
TTS انجن خود مہمان Apache 2.0
Sesame CSM-1B — Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
0 حروف ~0 ٹوکن
حروف شماري کے ساتھ قيمتي سکولز
بات بنائی جارہی ہے...

کیا کرتا ہے Sesame CSM-1B جیسے آواز؟

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

اوپري باکس کو آزمائيں: سلام، میرا نام سم هے اور میں آواز کو د ليل کرنے کے ليے اس نمونے کو پڑھ رہا هے ۔

استعمال کرنے کے لیے کب Sesame CSM-1B

آڈیو کتابیں

مسلسل آواز کے ساتھ طويل شکل کی نريشن۔ ایک وقت میں ایک باب کو پسٹ کريں، WAV يا MP3 کے طور پر ڈائون لوڈ کريں اور باہري طور پر سٹک کريں

پوڈکاسٹ

مختصر کھولنے کے بامپرز اور اد-ریڈز توانائي کے ليے رفتار کو ترتيب د یں، چھوٹي فائلن کے ليے MP3 پر فارمٹ-سوچ کريں

وائٹ میل

فون-سیسٹم پروموشنز. بیکنگ، ریکارڈنگ، یا آواز کی صلاحیت کے ساتھ NDAs کے بغیر سٹوڈیو-کیولیٹ آؤٹپوٹ.

رسائی

کم نظر اور dyslexic پڑھنے والوں کے ليے لکھي مواد کے ساتھ آ ڊيو شامل کريں

مثالی جملے

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

قیمت

خود-ہوسٹ کیا گیا ہمارے GPUs پر. نسل آپ کے روزانہ مفت پول سے پہلے ڈرائنگ کرتا ہے؛ ایک بار کہ باہر چلتا ہے، ادا توکن پک $5 سے شروع ہوتا ہے → 200,000 توکن. تقریباً ~5 توکن ہر کردار، کم سے کم 100 ہر کلیپ.

پورا ماڈل حوالہ → · تمام TTS آوازیں دیکھيں → · دو آوازوں کو برابر ميں ملا ئيں →

اعلیٰ اختیارات
نتيجہ
ٹوکن کم چل رہا ہے. Get More Tokens
Want better results? پرائم ماڈل (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Free.ai سے محبت؟ اپنے دوستوں کو بتاؤ۔

ساین اپ ایک حوالہ لینک حاصل کرنے اور ہر دوست کے لئے 25,000 ٹوکنز کمانے کے لئے.

زیادہ چاہتے ہیں؟ Sign up free for 10,000 tokens
مفت میں رجسٹر کریں

آپ کی درخواست پر عمل کررہا ہے...

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio …

استعمال کيونکر کريں AI Voice — Sesame CSM-1B

1
آپ کا انٹاپ داخل کریں

متن ٹائپ کریں، فائل اپ لوڈ کریں، یا جو کچھ آپ چاہتے ہیں اس کی وضاحت کریں۔ کوئی اکاؤنٹ ضروری نہیں ہے۔

2
جنائز کريں

ہماری AI بہترین کھلے-اصل ماڈل کے استعمال سے سیکنڈ میں آپ کی درخواست کو پروسیسنگ کرتا ہے۔

3
ڈاؤن لوڈ اور تقسیم کریں

آپ کا نتيجہ ڈائون لوڈ، کاپي، يا شیئر کريں. ذاتي اور تجارتي استعمال کے ليے مفت

اس ٹول کو API کے ذریعے استعمال کریں

آپ کے اپنے کوڈ سے اس ٹول کو خودکار کريں. OpenAI-مطابق REST انتہا پوائنٹ، bearer-token auth، کوئی اضافي SDK ضرورت نہیں. token کی قیمت ويب انٹرفیس سے ملتی ہے.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — Sesame CSM-1B — FAQ

Sesame CSM-1B supports a wide range of languages. The exact list depends on the engine; the form on this page accepts any text and the engine will render in its supported languages. See /voice/ for the full multi-engine picker if you need a specific language.

Most engines render neutral-American English by default and a region-appropriate accent for non-English languages. Premium engines may expose accent variants — paste a sample to compare.

SSML support varies by engine. Pause, prosody, and emphasis tags are honored on most premium engines and on a few self-hosted ones. Plain text always works — no markup required.

Streaming TTS is available on premium engines via the /v1/tts/ API endpoint with stream=true. The web UI on this page returns the full clip once rendering finishes.

Sesame CSM-1B runs on our own GPUs. Generation draws from your daily free pool first. Once depleted, paid tokens start at $5 → 200,000 tokens. Roughly ~5 tokens per character, minimum 100 per clip.

Up to 5,000 characters per request on the web UI. For longer pieces (audiobooks, full chapters), use /voice/audiobook/ which chunks and stitches automatically, or call the API in a loop.

Yes — POST a list of strings to /v1/tts/batch/, or use the workspace UI at /workspace/ to chain TTS into a longer pipeline (e.g., translate → speak → stitch).

Yes — POST text to /v1/tts/ with model="Sesame CSM-1B" (or the slug on this page). Returns WAV or MP3. See /api/ for full reference + SDK snippets.

This page is text-to-speech, not voice cloning — the voice is the engine's default. For voice cloning (uploading a reference audio), see /voice/clone/, which requires you to either own the voice rights or have explicit written consent.

Self-hosted engines run on Free.ai-owned GPUs; nothing leaves our servers. Premium engines pass text to upstream model providers under our DPA. We do not train on your inputs and do not sell data.

Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.

Yes — failed jobs auto-refund to the source (daily pool or paid tokens). If a refund does not show up the same day, email contact@free.ai.

10,000 ٹوکنوں کے لئے مفت میں رجسٹر

مفت اکاؤنٹ بنائیں

کوئی کریڈٹ کارڈ نہیں

آپ اس ٹول کو کیسے درجہ دیں گے؟

4.3/5 from 3 ratings

Free.ai سے محبت؟ اپنے دوستوں کو بتاؤ۔