Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 tokens pr. clip

Tekst der skal tales

Stemme

Hastighed

~500 tokens pr. clip

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

Brug via API

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'

API- dokumentation Hent API- nøgle

Ofte stillede spørgsmål

__FREAI_PH_name__ understøtter en bred vifte af sprog. Den nøjagtige liste afhænger af motoren; formularen på denne side accepterer enhver tekst og motoren vil gengive i sine understøttede sprog. Se / stemme / for den fulde multi- motorvælger, hvis du har brug for et bestemt sprog.

De fleste motorer gør neutral-amerikansk engelsk som standard og en region-passende accent for ikke-engelske sprog. Premium motorer kan udsætte accent varianter! indsætte en prøve til at sammenligne.

SSML-support varierer af motor. Pause, prosody, og vægt tags er hædret på de fleste premium motorer og på et par selv-hostet dem. Plain tekst altid fungerer ingen markup kræves.

Streaming TTS er tilgængelig på premium motorer via /v1/tts/ API endpoint med stream=true. Web UI på denne side returnerer det fulde klip, når rendering finish.

__FREAI_PH_name__ kører på vores egne GPU'er. Generation trækker fra din daglige gratis pool først. Når udtømmet, betalte tokens starter på $ 5 → 200.000 tokens. Robust ~ 5 tokens per tegn, minimum 100 per klip.

Op til 5.000 tegn pr anmodning på web UI. For længere stykker (lydbøger, fulde kapitler), brug /voice/audiobook / som bidder og sting automatisk, eller ring til API i en løkke.

Ja! POST en liste over strenge til /v1/tts/batch/, eller brug arbejdsområde UI på /workspace / at kæde TTS i en længere pipeline (f.eks oversætte → tale → sting).

Ja! POST tekst til /v1/tts/ med model="__FREAI_PH_name_" (eller kuglen på denne side). Returnerer WAV eller MP3. Se / api/ for fuld reference + SDK stumper.

Denne side er tekst- til- tale, ikke stemmekloning! stemmen er motorens standard. For stemmekloning (oploade en reference lyd), se /voice/clone /, som kræver, at du enten ejer stemmen rettigheder eller har eksplicit skriftligt samtykke.

Selv-hostede motorer kører på Free.ai-ejede GPU'er; intet forlader vores servere. Premium motorer sender tekst til opstrøms modeludbydere under vores DPA. Vi træner ikke på dine indgange og sælger ikke data.

Ja! Free.ai giver kommerciel brug af genereret lyd. Motorens underliggende licens (Apache 2.0, MIT, eller sælger vilkår) er vist ovenfor og på modellen reference side; i praksis betyder dette voiceovers, annoncer, podcasts, og apps er alle i-scope.

Ja! fejlede job automatisk refundere til kilden (daglig pool eller betalte tokens). Hvis en refusion ikke vises samme dag, e-mail kontakt@free.ai.

Sesame CSM-1B

Ofte stillede spørgsmål

Hvilke sprog dækker __FREAI_PH_name___?

Har __FREAI_PH_name__ en genkendelig accent?

Kan jeg bruge SSML med __FREAI_PH_name__?

Støtter __FREAI_PH_name__ streaming?

Hvor meget koster __FREAI_PH_name__ pr. klip?

Hvad er den maksimale tekstlængde for __FREAI_PH_name__?

Kan jeg køre __FREAI_PH_name__ i batch?

Er der en API for __FREAI_PH_name__?

Skal jeg have samtykke til at klone en stemme med __FREAI_PH_name__?

Hvad med privatlivets fred med __FREAI_PH_name__?

Er __FREAI_PH_name__ output sikkert til kommerciel brug?

Kan jeg få en refusion, hvis __FREAI_PH_name__ mislykkes?

Få 10.000 gratis tokens

Vent! Få 10K gratis tokens!

Vil du have mere?