Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 tokens pr. clip
~500 tokens pr. clip

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

Brug via API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
API- dokumentation Hent API- nøgle

Ofte stillede spørgsmål

__FREAI_PH_name__ understøtter en bred vifte af sprog. Den nøjagtige liste afhænger af motoren; formularen på denne side accepterer enhver tekst og motoren vil gengive i sine understøttede sprog. Se / stemme / for den fulde multi- motorvælger, hvis du har brug for et bestemt sprog.

De fleste motorer gør neutral-amerikansk engelsk som standard og en region-passende accent for ikke-engelske sprog. Premium motorer kan udsætte accent varianter! indsætte en prøve til at sammenligne.

SSML-support varierer af motor. Pause, prosody, og vægt tags er hædret på de fleste premium motorer og på et par selv-hostet dem. Plain tekst altid fungerer ingen markup kræves.

Streaming TTS er tilgængelig på premium motorer via /v1/tts/ API endpoint med stream=true. Web UI på denne side returnerer det fulde klip, når rendering finish.

__FREAI_PH_name__ kører på vores egne GPU'er. Generation trækker fra din daglige gratis pool først. Når udtømmet, betalte tokens starter på $ 5 → 200.000 tokens. Robust ~ 5 tokens per tegn, minimum 100 per klip.

Op til 5.000 tegn pr anmodning på web UI. For længere stykker (lydbøger, fulde kapitler), brug /voice/audiobook / som bidder og sting automatisk, eller ring til API i en løkke.

Ja! POST en liste over strenge til /v1/tts/batch/, eller brug arbejdsområde UI på /workspace / at kæde TTS i en længere pipeline (f.eks oversætte → tale → sting).

Ja! POST tekst til /v1/tts/ med model="__FREAI_PH_name_" (eller kuglen på denne side). Returnerer WAV eller MP3. Se / api/ for fuld reference + SDK stumper.

Denne side er tekst- til- tale, ikke stemmekloning! stemmen er motorens standard. For stemmekloning (oploade en reference lyd), se /voice/clone /, som kræver, at du enten ejer stemmen rettigheder eller har eksplicit skriftligt samtykke.

Selv-hostede motorer kører på Free.ai-ejede GPU'er; intet forlader vores servere. Premium motorer sender tekst til opstrøms modeludbydere under vores DPA. Vi træner ikke på dine indgange og sælger ikke data.

Ja! Free.ai giver kommerciel brug af genereret lyd. Motorens underliggende licens (Apache 2.0, MIT, eller sælger vilkår) er vist ovenfor og på modellen reference side; i praksis betyder dette voiceovers, annoncer, podcasts, og apps er alle i-scope.

Ja! fejlede job automatisk refundere til kilden (daglig pool eller betalte tokens). Hvis en refusion ikke vises samme dag, e-mail kontakt@free.ai.

Love this tool? Share it!

Bedøm denne side