Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 tokens per clip
~500 tokens per clip

Sesame CSM-1B — Apache 2.0. Model konverzacijskog govora dizajniran za nisko-latentni, realno-vremenski glas. Izlaz 24 kHz, zvuči najbolje sa kratkim referenčnim kontekstnim zvukom. Samo-hosted na Free.ai za /voice/realtime/ alat.

Korištenje putem API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
API dokumentacija Pribavi API ključ

Često postavljana pitanja

Sesame CSM-1B podržava širok raspon jezika. Tačna lista zavisi od mašine; obrazac na ovoj stranici prihvaća bilo koji tekst i mašina će prikazati na podržanim jezicima. Pogledajte /voice/ za potpuni višejezični birač ako vam je potreban određeni jezik.

Većina motora po zadanim postavkama renderiraju neutralni američki engleski i regionalno prikladan naglasak za ne-engleski jezik. Premium motori mogu prikazati varijante naglaska - zalijepite uzorak za usporedbu.

Podrška za SSML varira od motora do motora. Oznake za pauzu, prozodiju i naglasak poštuju se na većini premium motora i na nekoliko samohostirajućih. Običan tekst uvijek radi — nije potrebno označavanje.

Streaming TTS je dostupan na premium mašinama preko /v1/tts/ API krajnje tačke sa stream=true. Web korisničko sučelje na ovoj stranici vraća cijeli isječak nakon završetka renderiranja.

Sesame CSM-1B radi na našim vlastitim GPU-ovima. Generacija prvo crpi iz vašeg dnevnog slobodnog fonda. Kad se iscrpi, plaćeni žetoni počinju od $5 → 200.000 žetona. Otprilike ~5 žetona po liku, minimum 100 po isječku.

Do 5.000 znakova po zahtjevu na web UI. Za dulje dijelove (audioknjige, cijela poglavlja), koristite /voice/audiobook/ koji se automatski dijeli i spaja, ili zove API u petlji.

Da — POST lista nizova znakova u /v1/tts/batch/, ili koristite radni prostor UI na /workspace/ da lansira TTS u duži cjevovod (npr., translate → speak → stitch).

Da — POST tekst u /v1/tts/ sa model="Sesame CSM-1B" (ili slug na ovoj stranici). Vraća WAV ili MP3. Pogledajte /api/ za potpunu referencu + SDK isječke.

Ova stranica je za pretvorbu teksta u govor, a ne za kloniranje glasa — glas je zadani u motoru. Za kloniranje glasa (učitavanje referentnog zvuka), pogledajte /voice/clone/, za što je potrebno da posjedujete prava na glas ili da imate eksplicitni pisani pristanak.

Samohosted motori rade na Free.ai-vlastitim GPU-ovima; ništa ne napušta naše servere. Premium motori prenose tekst na izvorne davaoce modela pod našim DPA. Mi ne treniramo na vašim ulazima i ne prodajemo podatke.

Da — Free.ai dozvoljava komercijalnu upotrebu generiranog zvuka. Osnovna licenca motora (Apache 2.0, MIT, ili uvjeti proizvođača) prikazani su iznad i na referentnoj stranici modela; u praksi to znači da su voiceoveri, reklame, podcasti i aplikacije svi u opsegu.

Da — neuspjeli zadaci automatski se vraćaju izvoru (dnevni fond ili plaćeni tokeni). Ako se povrat ne pojavi istog dana, pošaljite e-mail na contact@free.ai.

Volite Free.ai?

Ocijeni ovu stranicu