Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 ٽوڪنز clip · 4.3 کان 3 ھن صنف جا صارفين
~500 ٽوڪنز clip

Sesame CSM-1B a متن- کان- ڳالھائڻ واري آواز جي ٺهيل Sesame. Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads. تي تمام مضبوط. Free.ai GPUs تي پاڻمرادو ميزبان - توهان جي روزاني ٽوڪين پول (500 ٽوڪين ڪلپ) جي خلاف مفت هلندو آهي. Apache 2.0 تحت جاري ڪيو ويو — Free.ai تي تجارتي استعمال جي اجازت.

API ذريعي استعمال ڪريو
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
API دستاویز API ڪوڊ حاصل ڪريو

گھڻا پڇيل سوال

Sesame CSM-1B ڪيتريون ئي ٻوليون سپورٽ ڪري ٿو. صحيح فهرست انجن تي منحصر آهي؛ هن صفحي تي فارم ڪوبه متن قبول ڪري ٿو ۽ انجن ان جي مدد ڪيل ٻولين ۾ رنڊڪ ڏيندو. جيڪڏهن توهان کي ڪا خاص ٻولي جي ضرورت آهي ته مڪمل ملٽي انجن چونڊيندڙ لاءِ /voice/ ڏسو.

گھڻا انجنيئر اڻ سڌي اميرڪيءَ انگريزي کي اڻ سڌي طرح ۽ غير انگريزي ٻولين لاءِ علائقي جي مناسب ڌيان کي ڏيکاريندا آھن. پريميئم انجنيئر ڌيان جي قسمن کي ظاهر ڪري سگھن ٿا - مثال کي مقابلي لاءِ چٽيو.

SSML جو مددگار انجنيئر جي لحاظ کان مختلف آهي. وقفو، پروسيڊي، ۽ زور ڏيڻ وارا ٽيگ اڪثر پرائمري انجنيئرن ۽ ڪين ڪين پاڻ مھمان ڪيلن تي سرانجام ڏنا ويندا آھن. عام متن هميشه ڪم ڪندو آھي - ڪو به مارڪ اپ جي ضرورت نه آھي.

TTS جي اسٽريمنگ پرائمري انجنيئرن تي /v1/tts/ API endpoint سان گڏ stream=true ذريعي دستياب آهي. ھن صفحي تي ويب UI مڪمل ڪلپ واپس ڪري ٿو جڏھن رندرنگ مڪمل ٿئي ٿو.

Sesame CSM-1B اسان جي پنهنجي GPUs تي هلندو آهي. نسل پهرين توهان جي روزاني مفت پول مان نڪتل آهي. هڪ ڀيرو ختم ٿي، ادا ڪيل ٽوڪنز $5 → 200,000 ٽوڪنز تي شروع ٿيندا آهن. تقريبن ~5 ٽوڪنز هر ڪردار، گهٽ ۾ گهٽ 100 هر ڪلپ.

ويب UI تي هر درخواست تي 5000 تائين ڪارڪن. ڊگهن ٽڪرن (آڊيو ڪتاب، مڪمل باب) لاءِ ، /voice/audiobook / استعمال ڪريو جيڪو خودڪار طور تي ٽڪرا ۽ سٽون ڪري ٿو ، يا API کي لوپ ۾ سڏيو.

ها — /v1/tts/batch/ ڏانهن سٽين جي قائمة پوسٽ ڪريو، يا /workspace/ تي ڪم جي جاءِ UI استعمال ڪريو TTS کي ڊگهي پائپ لائن ۾ ڳنڍڻ لاءِ (مثال طور، ترجمو → ڳالهائڻ → سٽ).

ھائو — /v1/tts/ ڏانهن POST متن ماڊل="Sesame CSM-1B" سان (يا ھن صفحي تي سلگ). WAV يا MP3 موٽائي ٿو. مڪمل حوالن + SDK snippets لاءِ /api/ ڏسو.

هي صفحو متن کان ڳالھائڻ وارو آهي، آواز جي کلوننگ نه — آواز انجنيئر جو ڊفالٽ آهي. آواز جي کلوننگ (اڃا به هڪ حوالو آڊيو اپ لوڊ ڪرڻ) لاءِ ، ڏسو /voice/clone/، جنهن لاءِ توهان کي يا ته آواز جا حق هجڻ گهرجن يا واضح لکيل رضامندي هجڻ گهرجي.

پاڻ کي ميزبان ڪندڙ انجنيئر Free.ai-جي مالڪ GPUs تي هلندا آهن؛ اسان جي سرورز تي ڪابه شيءِ نه ڇڏيندي. پريميئم انجنيئر اسان جي DPA تحت مٿين ماڊل مهيا ڪندڙن کي متن موڪليندا آهن. اسان توهان جي انپٽ تي تربيت نه ڪندا آهيون ۽ ڊيٽا نه وڪرو ڪندا آهيون.

ھائو — Free.ai پيدا ڪيل آڊيو جو تجارتي استعمال ڏئي ٿو. انجنيئر جو لاڳاپيل لائسنس (آپاچي 2.0، MIT، يا وينڊر شرط) مٿي ۽ ماڊل حوالي صفحي تي ڏيکاريل آهي؛ عملي طور ان جو مطلب آواز، اشتهار، پوڊ ڪاسٽ، ۽ ايپليڪيشنون سڀ شامل آهن.

ھائو — ناڪام ڪمن کي خودڪار طور ذريعن (ڏينهن جو پول يا ادا ڪيل ٽوڪنز) ڏانهن موٽايو وڃي. جيڪڏھن موٽائڻ وڳي ڏينھن نه اچي ته اي ميل contact@free.ai.

Free.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!

ھن صفحي کي تصنيف ڪريو