CosyVoice 2

Free.ai (self-hosted) · tts · ~500 polletter per clip · 4.3 från 3 användare i denna kategori
~500 polletter per clip

CosyVoice 2 är {artikel} {kategori} byggd av Alibaba FunAudioLLM. Starkast på Low-latency streaming TTS, cross-lingual voice cloning, real-time voice.. Självvärdig på Free.ai GPUs – körs gratis mot din dagliga tokenpool (500 tokens per klipp). Släppt under Apache 2.0 – tillåten kommersiell användning på Free.ai.

Använd via API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"cosyvoice2","text":"hello world"}'
API-dokumentation Hämta API- nyckel

Vanliga frågor

CosyVoice 2 stöder ett brett spektrum av språk. Den exakta listan beror på motorn. Formuläret på den här sidan accepterar alla texter och motorn kommer att visa på sina språk som stöds. Se /voice/ för den fullständiga multimotorväljaren om du behöver ett specifikt språk.

De flesta motorer ger neutral-amerikanska engelska som standard och en region-lämplig accent för icke-engelska språk. Premium motorer kan exponera accent varianter - klistra in ett prov för att jämföra.

SSML stöd varierar beroende på motor. Pause, prosody, och betoning taggar hedras på de flesta premium motorer och på några självvärdiga. Enkel text fungerar alltid - ingen markering krävs.

Streaming TTS är tillgänglig på premium motorer via /v1/tts/ API endpoint med stream=true. Webben UI på denna sida returnerar hela klippet när rendering avslutas.

CosyVoice 2 körs på våra egna GPU. Generation drar från din dagliga gratis pool först. När utarmat, betalas polletter börjar på $ 5 → 200.000 polletter. Grovt ~5 polletter per karaktär, minst 100 per klipp.

Upp till 5000 tecken per begäran på webben UI. För längre stycken (audioböcker, fullständiga kapitel), använd /voice/audiobook/ som delar och stygn automatiskt, eller ring API i en loop.

Ja — POST en lista med strängar till /v1/tts/batch/, eller använd arbetsytan UI på /workspace/ för att kedja TTS till en längre pipeline (t.ex., översätta → tala → stygn).

Ja – POST text till /v1/tts/ med modell="CosyVoice 2" (eller snigel på denna sida). Returnerar WAV eller MP3. Se /api/ för fullständig referens + SDK snippets.

Den här sidan är text-till-tal, inte röstkloning – rösten är motorns standard. För röstkloning (uppladdning av ett referensljud), se /voice/clone/, vilket kräver att du antingen äger rösträttigheterna eller har ett uttryckligt skriftligt samtycke.

Self-hosted motorer körs på Free.ai-ägda GPUs; ingenting lämnar våra servrar. Premium motorer passerar text till uppströms modellleverantörer under vår DPA. Vi tränar inte på dina ingångar och säljer inte data.

Ja — Free.ai beviljar kommersiell användning av genererat ljud. Motorns underliggande licens (Apache 2.0, MIT, eller leverantörstermer) visas ovan och på modellens referenssida; i praktiken betyder detta röstövergångar, annonser, podcasts, och appar är alla i-scope.

Ja — misslyckades jobb automatisk återbetalning till källan (dagligen pool eller betalade polletter). Om en återbetalning inte visas samma dag, e-post kontakt@free.ai.

Love this tool? Share it!

Betygsätt denna sida