Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 tokens per clip

Tekst za izgovor

Glas

Brzina

~500 tokens per clip

Sesame CSM-1B — Apache 2.0. Model konverzacijskog govora dizajniran za nisko-latentni, realno-vremenski glas. Izlaz 24 kHz, zvuči najbolje sa kratkim referenčnim kontekstnim zvukom. Samo-hosted na Free.ai za /voice/realtime/ alat.

Korištenje putem API

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'

API dokumentacija Pribavi API ključ

Često postavljana pitanja

Sesame CSM-1B podržava širok raspon jezika. Tačna lista zavisi od mašine; obrazac na ovoj stranici prihvaća bilo koji tekst i mašina će prikazati na podržanim jezicima. Pogledajte /voice/ za potpuni višejezični birač ako vam je potreban određeni jezik.

Većina motora po zadanim postavkama renderiraju neutralni američki engleski i regionalno prikladan naglasak za ne-engleski jezik. Premium motori mogu prikazati varijante naglaska - zalijepite uzorak za usporedbu.

Podrška za SSML varira od motora do motora. Oznake za pauzu, prozodiju i naglasak poštuju se na većini premium motora i na nekoliko samohostirajućih. Običan tekst uvijek radi — nije potrebno označavanje.

Streaming TTS je dostupan na premium mašinama preko /v1/tts/ API krajnje tačke sa stream=true. Web korisničko sučelje na ovoj stranici vraća cijeli isječak nakon završetka renderiranja.

Sesame CSM-1B radi na našim vlastitim GPU-ovima. Generacija prvo crpi iz vašeg dnevnog slobodnog fonda. Kad se iscrpi, plaćeni žetoni počinju od $5 → 200.000 žetona. Otprilike ~5 žetona po liku, minimum 100 po isječku.

Do 5.000 znakova po zahtjevu na web UI. Za dulje dijelove (audioknjige, cijela poglavlja), koristite /voice/audiobook/ koji se automatski dijeli i spaja, ili zove API u petlji.

Da — POST lista nizova znakova u /v1/tts/batch/, ili koristite radni prostor UI na /workspace/ da lansira TTS u duži cjevovod (npr., translate → speak → stitch).

Da — POST tekst u /v1/tts/ sa model="Sesame CSM-1B" (ili slug na ovoj stranici). Vraća WAV ili MP3. Pogledajte /api/ za potpunu referencu + SDK isječke.

Ova stranica je za pretvorbu teksta u govor, a ne za kloniranje glasa — glas je zadani u motoru. Za kloniranje glasa (učitavanje referentnog zvuka), pogledajte /voice/clone/, za što je potrebno da posjedujete prava na glas ili da imate eksplicitni pisani pristanak.

Samohosted motori rade na Free.ai-vlastitim GPU-ovima; ništa ne napušta naše servere. Premium motori prenose tekst na izvorne davaoce modela pod našim DPA. Mi ne treniramo na vašim ulazima i ne prodajemo podatke.

Da — Free.ai dozvoljava komercijalnu upotrebu generiranog zvuka. Osnovna licenca motora (Apache 2.0, MIT, ili uvjeti proizvođača) prikazani su iznad i na referentnoj stranici modela; u praksi to znači da su voiceoveri, reklame, podcasti i aplikacije svi u opsegu.

Da — neuspjeli zadaci automatski se vraćaju izvoru (dnevni fond ili plaćeni tokeni). Ako se povrat ne pojavi istog dana, pošaljite e-mail na contact@free.ai.

Sesame CSM-1B

Često postavljana pitanja

Koji je jezik Sesame CSM-1B pokriva?

Da li Sesame CSM-1B ima prepoznatljiv naglasak?

Mogu li koristiti SSML sa Sesame CSM-1B?

Da li Sesame CSM-1B podržava streaming?

Koliko košta Sesame CSM-1B po isječku?

Koja je maksimalna dužina teksta za Sesame CSM-1B?

Mogu li pokrenuti Sesame CSM-1B u seriji?

Da li postoji API za Sesame CSM-1B?

Da li mi treba dozvola da kloniram glas sa Sesame CSM-1B?

Šta je sa privatnošću kod Sesame CSM-1B?

Da li je Sesame CSM-1B izlaz siguran za komercijalnu upotrebu?

Mogu li dobiti povrat novca ako Sesame CSM-1B ne uspije?

Dobijte 10.000 besplatnih žetona

Čekajte - Uzmite 10K besplatnih žetona!

Hoćeš još?