Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 simboliai clip · 4.3 nuo 3 šios kategorijos vartotojai
~500 simboliai clip

{lead__is} _BAR_FREERI_PH_Srities___ {kategorija__sukurta} {source}. Stipriausi Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads.. Savarankiškas Free.ai GPU – bėga nemokamai nuo savo kasdienių žetonų baseinas ({tpm__markes} per klipą). Išleista pagal Apache 2.0 – komercinis naudojimas leidžiamas Free.ai.

Naudoti per API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
API dokumentacija Gauti API raktą

Dažnai užduodami klausimai

Sesame CSM-1B palaiko platų kalbų spektrą. Tikslus sąrašas priklauso nuo variklio; šiame puslapyje pateikta forma priima bet kokį tekstą, o variklis bus atvaizduojamas palaikomomis kalbomis. Visam daugelio variklių parinkėjui, jei reikia konkrečios kalbos, žiūrėkite /balsą/.

Dauguma variklių pagaminti neutralaus Amerikos anglų pagal nutylėjimą ir regiono tinkamai akcentas ne anglų kalba. Premium varikliai gali atskleisti akcento variantus — įklijuoti bandinį palyginti.

SSML palaikymas priklauso nuo variklio. Pauzė, prozodija, ir pabrėžti žymės yra pagerbtas daugumai premium variklių ir keliems savarankiškai įdarbintiems. Paprastas tekstas visada veikia – nereikia žymėti.

Srautas TTS yra priemoka varikliuose per /v1/tts/ API baigtis su srautu = tiesa. Web UI šiame puslapyje grąžina visą klipą, kai piešimas baigiasi.

Sesame CSM-1B veikia mūsų pačių GPU. Generacija gauna iš jūsų kasdienio nemokamo baseino pirmas. Kai išeikvotas, mokami žetonai prasideda $5 → 200,000 žetonų. Maždaug ~5 žetonai vienam charakteriui, mažiausiai 100 vienam klipui.

Iki 5,000 simbolių užklausai žiniatinklyje UI. Daugiau vienetų (audiobooks, pilni skyriai), naudoti /balsas/audiobook / kuris chunks ir dygsniai automatiškai, arba skambinti API kilpoje.

Taip — Padėkite eilučių sąrašą /v1/tts/partija/, arba naudoti darbalaukio UI ne /workspace/ grandin TTS į ilgesnį vamzdyną (pvz, versti → kalbėti → dygsnio).

Taip — Point text to /v1/tts/ with model="Sesame CSM-1B" (arba šliaužinys šiame puslapyje). Grįžta WAV arba MP3. Visas nuoroda + SDK fragmentai.

Šis puslapis yra tekstas-to-speech, o ne balso klonavimas - balsas yra variklio nutylėjimas. Dėl balso klonavimo (įkeliama nuoroda garso), pamatyti / balso/klono/, kuris reikalauja, kad jūs turite balso teises arba turėti aiškų raštišką sutikimą.

Savarankiškai valdomi varikliai veikia Free.ai GPU; niekas nepalieka mūsų serverių.Premium varikliai perduoti tekstą pirminių modelių teikėjams pagal mūsų DPA. Mes netreniruojame jūsų įvesties ir neparduodame duomenis.

Taip — Free.ai suteikia komercinį išgeneruoto garso naudojimą. Variklio pagrindinė licencija (Apache 2.0, MIT, arba pardavėjo terminai) rodoma aukščiau ir modelio informaciniame puslapyje; praktiškai tai reiškia, kad skambesiai, skelbimai, podcast, ir programos yra visi į-scenarijus.

Taip – nepavykę darbai auto-grąžinti šaltiniui (dienos baseinas arba mokami žetonai). Jei grąžinamoji išmoka neatrodo tą pačią dieną, rašykite adresu@free.ai.

Like this tool? Share it!

Įvertinti šį puslapį