Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 توکي په clip · 4.3 له 3 د دې ټولۍ کارن
~500 توکي په clip

Sesame CSM-1B د a ليکنه-په-وينا غږ لخوا جوړ شوی Sesame. په Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads. کې تر ټولو قوي. په Free.ai GPUs کې ځان کوربه - ستاسو د ورځني ټوکن پوټ (500 ټوکنونه په کلپ کې) په وړاندې وړیا چلیږي. د Apache 2.0 لاندې خپور شوی - د سوداګرۍ کارولو لپاره اجازه ورکړل شوې Free.ai.

د API له لارې کارول
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
لاسوندونه API کيلۍ ترلاسه کول

ډېرې پوښتنې

Sesame CSM-1B د ژبو د پراخه لړ ملاتړ کوي. د دقیق لیست د انجن پورې اړه لري؛ په دې مخ کې فورمه هر متن مني او انجن به په خپلو ملاتړو ژبو کې راشي. د بشپړ څو-انجن غوره کونکي لپاره / غږ / وګورئ که تاسو ځانګړې ژبه ته اړتیا لرئ.

ډیری انجنونه د غیر انګلیسي ژبو لپاره د غیر انګلیسي ژبې او سیمه ایزې مناسبې اشارې سره د غیر انګلیسي ژبې سره بې طرفه امریکایی انګلیسي کوي. د پریمیم انجنونه ممکن د اشارې ډولونه څرګند کړي - د پرتله کولو لپاره نمونې رامینځته کړئ.

د SSML ملاتړ د انجن لخوا توپیر لري. د وقفې، پروسیسي، او ټینګار ټیګونه د ډیری پریم انجنونو او د څو ځان کوربه شويو باندې شرف لري. ساده متن تل کار کوي - هیڅ مارکپ ته اړتیا نشته.

د TTS د / v1 / tts / API پای ټکي له لارې د پریم انجنونو سره د جریان = ریښتیا سره شتون لري. په دې پاڼه کې د ویب UI د بشپړ کلیپ بیرته راستنولو وروسته بشپړیږي.

Sesame CSM-1B زموږ په خپلو GPUs کې چلیږي. نسل لومړی ستاسو د ورځني وړیا حوض څخه راځي. کله چې مینځ ته راشي، د تادیې توکي په $ 5 کې پیل کیږي → 200,000 توکي. په هر ډول ~ 5 توکي په هر شخصیت کې، لږترلږه 100 په هر کلیپ کې.

د ویب UI په هر غوښتنلیک کې تر 5,000 پورې کرکټرونه. د اوږدو ټوټو لپاره (آډیو کتابونه، بشپړ فصلونه)، د / ویلو / آډیو کتاب / کارولو لپاره چې په اتوماتيک ډول ټوټې او ستچونه، یا په لوپ کې API ته زنګ ووهئ.

هو - د / v1 / tts / batch / ته د تارونو لیست پوسټ کړئ ، یا د / workspace / کې د کاري ځای UI وکاروئ ترڅو TTS په اوږده پایپ لاین کې زنجیره کړي (د بیلګې په توګه ، ژباړه → خبرې کول → ستچ).

هو - د / v1 / tts / سره د ماډل سره د متن پوسټ کول "Sesame CSM-1B" (یا په دې پاڼه کې د سلګ). د WAV یا MP3 بیرته راستنیږي. د بشپړ حوالې + SDK snippets لپاره / api / وګورئ.

دا مخ د ليکنې نه د وينا لپاره دی، د غږ د نقلولو نه — غږ د انجن تلواله ده. د غږ د نقلولو لپاره (د مرجع غږ پورته کول)، وګورئ /voice/clone/، چې تاسو ته اړتيا لري چې يا د غږ حقونه ولرئ يا واضح ليکل شوې موافقه ولرئ.

د ځان کوربه انجنونه د Free.ai-شتون لرونکي GPUs پرمخ ځي؛ هیڅ شی زموږ سرور نه پریږدي. د پریمیم انجنونه زموږ د DPA لاندې د پورته ماډل چمتو کونکو ته متنونه لیږدوي. موږ ستاسو د انټرنیټونو پراساس روزنه نه کوو او معلومات نه پلوري.

هو - Free.ai د تولید شوي غږ سوداګریز کارولو ته اجازه ورکوي. د انجن اساسي جواز (Apache 2.0، MIT، یا د پلورونکي شرایط) پورته او د ماډل حوالې پاڼه کې ښودل کیږي؛ په عمل کې دا معنی لري چې ویزوورز، اعلانونه، پوډکاسټونه او غوښتنلیکونه ټول په ساحه کې دي.

هو - ناکام شوي دندې سرچینې ته اتومات بیرته راستنیدنه (هره ورځ د اوبو یا تادیه شوي توکي). که چیرې بیرته راستنیدنه په ورته ورځ نه ښکاري، بریښنالیک contact@free.ai.

Free.ai مینه؟ خپل ملګرو ته ووایاست!

دا مخ کچول