Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 ٽوڪنز clip · 4.3 کان 3 ھن صنف جا صارفين

ڳالھائڻ لاءِ متن

آواز

رفتار

~500 ٽوڪنز clip

Sesame CSM-1B a متن- کان- ڳالھائڻ واري آواز جي ٺهيل Sesame. Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads. تي تمام مضبوط. Free.ai GPUs تي پاڻمرادو ميزبان - توهان جي روزاني ٽوڪين پول (500 ٽوڪين ڪلپ) جي خلاف مفت هلندو آهي. Apache 2.0 تحت جاري ڪيو ويو — Free.ai تي تجارتي استعمال جي اجازت.

API ذريعي استعمال ڪريو

OpenAI-compatible REST API. هڪ ڪَچ پيدا ڪريو ۽ ھن ماڊل کي سيڪنڊن ۾ سڏيو.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'

API دستاویز API ڪوڊ حاصل ڪريو

اھڙا ماڊل

Bark TTS

Cartesia Sonic 3 (real-time)

ElevenLabs Multilingual v2

ElevenLabs Turbo v2.5

Inworld TTS

Orpheus TTS

Parler TTS Large

PlayAI v3 TTS

سڀني ماڊلن جو برائوزنگ →

گھڻا پڇيل سوال

Sesame CSM-1B ڪيتريون ئي ٻوليون سپورٽ ڪري ٿو. صحيح فهرست انجن تي منحصر آهي؛ هن صفحي تي فارم ڪوبه متن قبول ڪري ٿو ۽ انجن ان جي مدد ڪيل ٻولين ۾ رنڊڪ ڏيندو. جيڪڏهن توهان کي ڪا خاص ٻولي جي ضرورت آهي ته مڪمل ملٽي انجن چونڊيندڙ لاءِ /voice/ ڏسو.

گھڻا انجنيئر اڻ سڌي اميرڪيءَ انگريزي کي اڻ سڌي طرح ۽ غير انگريزي ٻولين لاءِ علائقي جي مناسب ڌيان کي ڏيکاريندا آھن. پريميئم انجنيئر ڌيان جي قسمن کي ظاهر ڪري سگھن ٿا - مثال کي مقابلي لاءِ چٽيو.

SSML جو مددگار انجنيئر جي لحاظ کان مختلف آهي. وقفو، پروسيڊي، ۽ زور ڏيڻ وارا ٽيگ اڪثر پرائمري انجنيئرن ۽ ڪين ڪين پاڻ مھمان ڪيلن تي سرانجام ڏنا ويندا آھن. عام متن هميشه ڪم ڪندو آھي - ڪو به مارڪ اپ جي ضرورت نه آھي.

TTS جي اسٽريمنگ پرائمري انجنيئرن تي /v1/tts/ API endpoint سان گڏ stream=true ذريعي دستياب آهي. ھن صفحي تي ويب UI مڪمل ڪلپ واپس ڪري ٿو جڏھن رندرنگ مڪمل ٿئي ٿو.

Sesame CSM-1B اسان جي پنهنجي GPUs تي هلندو آهي. نسل پهرين توهان جي روزاني مفت پول مان نڪتل آهي. هڪ ڀيرو ختم ٿي، ادا ڪيل ٽوڪنز $5 → 200,000 ٽوڪنز تي شروع ٿيندا آهن. تقريبن ~5 ٽوڪنز هر ڪردار، گهٽ ۾ گهٽ 100 هر ڪلپ.

ويب UI تي هر درخواست تي 5000 تائين ڪارڪن. ڊگهن ٽڪرن (آڊيو ڪتاب، مڪمل باب) لاءِ ، /voice/audiobook / استعمال ڪريو جيڪو خودڪار طور تي ٽڪرا ۽ سٽون ڪري ٿو ، يا API کي لوپ ۾ سڏيو.

ها — /v1/tts/batch/ ڏانهن سٽين جي قائمة پوسٽ ڪريو، يا /workspace/ تي ڪم جي جاءِ UI استعمال ڪريو TTS کي ڊگهي پائپ لائن ۾ ڳنڍڻ لاءِ (مثال طور، ترجمو → ڳالهائڻ → سٽ).

ھائو — /v1/tts/ ڏانهن POST متن ماڊل="Sesame CSM-1B" سان (يا ھن صفحي تي سلگ). WAV يا MP3 موٽائي ٿو. مڪمل حوالن + SDK snippets لاءِ /api/ ڏسو.

هي صفحو متن کان ڳالھائڻ وارو آهي، آواز جي کلوننگ نه — آواز انجنيئر جو ڊفالٽ آهي. آواز جي کلوننگ (اڃا به هڪ حوالو آڊيو اپ لوڊ ڪرڻ) لاءِ ، ڏسو /voice/clone/، جنهن لاءِ توهان کي يا ته آواز جا حق هجڻ گهرجن يا واضح لکيل رضامندي هجڻ گهرجي.

پاڻ کي ميزبان ڪندڙ انجنيئر Free.ai-جي مالڪ GPUs تي هلندا آهن؛ اسان جي سرورز تي ڪابه شيءِ نه ڇڏيندي. پريميئم انجنيئر اسان جي DPA تحت مٿين ماڊل مهيا ڪندڙن کي متن موڪليندا آهن. اسان توهان جي انپٽ تي تربيت نه ڪندا آهيون ۽ ڊيٽا نه وڪرو ڪندا آهيون.

ھائو — Free.ai پيدا ڪيل آڊيو جو تجارتي استعمال ڏئي ٿو. انجنيئر جو لاڳاپيل لائسنس (آپاچي 2.0، MIT، يا وينڊر شرط) مٿي ۽ ماڊل حوالي صفحي تي ڏيکاريل آهي؛ عملي طور ان جو مطلب آواز، اشتهار، پوڊ ڪاسٽ، ۽ ايپليڪيشنون سڀ شامل آهن.

ھائو — ناڪام ڪمن کي خودڪار طور ذريعن (ڏينهن جو پول يا ادا ڪيل ٽوڪنز) ڏانهن موٽايو وڃي. جيڪڏھن موٽائڻ وڳي ڏينھن نه اچي ته اي ميل contact@free.ai.

Sesame CSM-1B

API ذريعي استعمال ڪريو

اھڙا ماڊل

گھڻا پڇيل سوال

ڪھڙيون ٻوليون Sesame CSM-1B سان ڳنڍيل آھن؟

Sesame CSM-1B کي ڪو سڃاڻپ وارو ڌڙ آهي ڇا؟

ڇا مان SSML کي Sesame CSM-1B سان استعمال ڪري سگهان ٿو؟

Sesame CSM-1B اسٽريمنگ کي سپورٽ ڪري ٿو ڇا؟

Sesame CSM-1B جي قيمت ڪهڙي آهي؟

Sesame CSM-1B جي وڌ ۾ وڌ متن جي ڊگهه ڇا آھي؟

Sesame CSM-1B کي ڇا مان باچ ۾ هلائي سگهان ٿو؟

Sesame CSM-1B لاءِ ڪو API موجود آهي؟

Sesame CSM-1B سان آواز کي کلون ڪرڻ لاءِ مون کي اجازت جي ضرورت آھي؟

Sesame CSM-1B سان ڳجھائيءَ بابت ڇا؟

Sesame CSM-1B آؤٽپوٽ تجارتي استعمال لاءِ محفوظ آهي؟

جيڪڏھن Sesame CSM-1B ناڪام ٿئي ته مون کي واپسي ملي سگھي ٿي؟

10,000 مفت ٽوڪنز حاصل ڪريو

انتظار ڪريو - 10K مفت ٽوڪنز حاصل ڪريو!

وڌيڪ گھرو ٿا؟