AI Voice — Sesame CSM-1B

Përdorimi komercial OK 380+ modele Pa shenjë uji Nuk është e nevojshme regjistrimi
Modeli:
+ GPT-5, Claude, Gemini
Motori TTS Vetë-pritur Apache 2.0
Sesame CSM-1B — Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
0 gërma ~a
Shkalla e kostos me numrin e gërmave
Duke gjeneruar fjalën...

Çfarë do të thotë kjo? Sesame CSM-1B Si tingëllon?

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

Provoni kutinë e sipërme me: Përshëndetje, emri im është Sam, dhe unë po lexoj këtë shembull për të demonstruar zërin. — kjo është fjalia e zakonshme TTS demo.

Kur të përdoret Sesame CSM-1B

Audiobooks

Narracioni i gjatë me ton të qëndrueshëm. Ngjite një kapitull në një kohë, shkarko si WAV ose MP3, dhe lidh jashtë.

Podcast intro

Hapje të shkurtra dhe reklama të lexueshme. Rregullo shpejtësinë për energji, ndrysho formatin në MP3 për file më të vogla.

IVR + postë zërore

Sistemi telefonik të kërkon, me cilësi studioje, pa rezervim, regjistrim, apo NDA me talentin e zërit.

Açesibiliteti

Shto audion së bashku me përmbajtjen e shkruar për lexuesit me paaftësi të shikimit dhe dyslexic. Shto në çdo faqe.

Shembull frazash

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

Çmimi

Gjenerati i parë tërheq nga rezerva juaj e përditshme e lirë; sapo të përfundojë, paketat e token-ëve të paguar fillojnë nga $5 → 200,000 token-ë. Rreth ~5 token-ë për karakter, minimum 100 për klip.

Referenca e plotë e modelit → · Shiko të gjitha zërat TTS → · Krahaso dy zëra njëri-tjetrin →

Mundësitë e avancuara
Rezultati
Tokenët po i mbaron. Get More Tokens
Want better results? Modelet Premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Të pëlqen Free.ai?

Regjistrohu për të marrë një lidhje referuese dhe fiton 25,000 token për mik.

Do më shumë? Sign up free for 10,000 tokens
Regjistrohu

Duke përpunuar kërkesën tuaj...

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio …

Si të përdorësh AI Voice — Sesame CSM-1B

1
Shkruaj

Shkruaj tekst, ngarko një file, ose përshkruaj atë që do. Nuk duhet asnjë llogari.

2
Kliko për të krijuar

AI jonë e përpunon kërkesën tuaj në sekonda duke përdorur modelet më të mira të burimit të hapur.

3
Shkarko dhe nda

Shkarko, kopjo ose ndaje rezultatin tënd. Pa pagesë për përdorim personal dhe komercial.

Përdor këtë mjet nëpërmjet API

Automatizo këtë mjet nga kodi juaj. Pika e fundit REST e përshtatshme me OpenAI, autentifikimi me token e bartësit, nuk kërkohet SDK shtesë. Kostot e token-it përputhen me interfaqen web.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — Sesame CSM-1B — FAQ

Sesame CSM-1B supports a wide range of languages. The exact list depends on the engine; the form on this page accepts any text and the engine will render in its supported languages. See /voice/ for the full multi-engine picker if you need a specific language.

Most engines render neutral-American English by default and a region-appropriate accent for non-English languages. Premium engines may expose accent variants — paste a sample to compare.

SSML support varies by engine. Pause, prosody, and emphasis tags are honored on most premium engines and on a few self-hosted ones. Plain text always works — no markup required.

Streaming TTS is available on premium engines via the /v1/tts/ API endpoint with stream=true. The web UI on this page returns the full clip once rendering finishes.

Sesame CSM-1B runs on our own GPUs. Generation draws from your daily free pool first. Once depleted, paid tokens start at $5 → 200,000 tokens. Roughly ~5 tokens per character, minimum 100 per clip.

Up to 5,000 characters per request on the web UI. For longer pieces (audiobooks, full chapters), use /voice/audiobook/ which chunks and stitches automatically, or call the API in a loop.

Yes — POST a list of strings to /v1/tts/batch/, or use the workspace UI at /workspace/ to chain TTS into a longer pipeline (e.g., translate → speak → stitch).

Yes — POST text to /v1/tts/ with model="Sesame CSM-1B" (or the slug on this page). Returns WAV or MP3. See /api/ for full reference + SDK snippets.

This page is text-to-speech, not voice cloning — the voice is the engine's default. For voice cloning (uploading a reference audio), see /voice/clone/, which requires you to either own the voice rights or have explicit written consent.

Self-hosted engines run on Free.ai-owned GPUs; nothing leaves our servers. Premium engines pass text to upstream model providers under our DPA. We do not train on your inputs and do not sell data.

Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.

Yes — failed jobs auto-refund to the source (daily pool or paid tokens). If a refund does not show up the same day, email contact@free.ai.

Regjistrohu falas për 10,000 token

Krijo një profil të ri

Nuk kërkohet karta e kreditit

Si do ta vlerësoni këtë mjet?

4.3/5 from 3 ratings

Të pëlqen Free.ai?