AI Voice — Sesame CSM-1B

व्यावसायिक प्रयोग ठीक छ 380+ नमूनाहरू वाटरमार्क छैन साइन अप आवश्यक छैन
नमूना:
+ GPT-5, Claude, Gemini
TTS इन्जिन स्व-होस्ट गरिएको Apache 2.0
Sesame CSM-1B — Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
0 क्यारेक्टर ~0 टोकन
क्यारेक्टर गणनासँग लागत मापन गर्दछ
भाषण सिर्जना गर्दैछ...

के गर्छ Sesame CSM-1B जस्तो आवाज?

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

माथिको बाकस प्रयोग गर्नुहोस्: नमस्ते, मेरो नाम सैम हो, र म आवाज प्रदर्शन गर्न यो नमूना पढ्दै छु। — त्यो क्याननिकल TTS डेमो वाक्यांश हो।

प्रयोग गर्ने बेला Sesame CSM-1B

अडियो पुस्तकहरू

एकै प्रकारको टोनसँग लामो-रूपको कथा। एक पटकमा अध्याय टाँस्नुहोस्, WAV वा MP3 को रूपमा डाउनलोड गर्नुहोस्, र बाह्य रूपमा स्टिच गर्नुहोस्।

पोडकास्ट परिचय

छोटो खोल्ने बम्पर र विज्ञापन-पढ्छ। ऊर्जाको लागि गति समायोजन, साना फाइलहरूको लागि MP3 मा ढाँचा-स्विच।

IVR + आवाज मेल

फोन-प्रणाली प्रोम्ट्स। एक बुकिंग बिना स्टुडियो-गुणवत्ता निर्गत, रेकर्डिङ, वा आवाज प्रतिभा संग एनडीए।

पहुँचता

कम दृष्टि र dyslexic पाठकहरूका लागि लिखित सामग्रीहरूसँगै अडियो थप्नुहोस्। कुनै पनि पृष्ठमा ड्रप-इन।

नमूना वाक्यांश

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

मूल्याङ्कन

हाम्रो GPUs मा आत्म-होस्ट. पुस्ता आफ्नो दैनिक निःशुल्क पूल पहिलो बाट तान्दछ; एक पटक त्यो बाहिर चल्छ, भुक्तानी टोकन प्याक $5मा सुरु → 200,000 टोकन. लगभग ~5प्रति वर्ण टोकन, न्यूनतम 100 प्रति क्लिप.

पूरा नमूना सन्दर्भ → · सबै TTS आवाजहरू हेर्नुहोस् → · २ आवाजहरू किनारा-द्वारा-किनार तुलना गर्नुहोस् →

उन्नत विकल्प
परिणाम
टोकनहरू कम चलिरहेका छन् । Get More Tokens
Want better results? प्रिमियम नमूनाहरू (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ प्रेम Free.ai? आफ्नो साथीहरूलाई भन्नुहोस्!

सिफारिस लिङ्क प्राप्त गर्न र कमाउन साइन अप 25,000 प्रति मित्र टोकन.

अझै चाहनुहुन्छ? Sign up free for 10,000 tokens
निःशुल्क दर्ता गर्नुहोस्

तपाईँको अनुरोध प्रक्रिया गर्दैछ...

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio …

कसरी प्रयोग गर्ने AI Voice — Sesame CSM-1B

1
तपाईँको आगत प्रविष्ट गर्नुहोस्

पाठ टाइप गर्नुहोस्, फाइल अपलोड गर्नुहोस्, वा तपाईँले चाहेको कुरा वर्णन गर्नुहोस् । खाता आवश्यक छैन ।

2
सिर्जना गर्नुहोस्

हाम्रो AI सबै भन्दा राम्रो खुला स्रोत मोडेल प्रयोग गरेर सेकेन्डमा आफ्नो अनुरोध प्रक्रियाहरू.

3
डाउनलोड र साझेदारी गर्नुहोस्

डाउनलोड, प्रतिलिपि, वा आफ्नो परिणाम साझेदारी। व्यक्तिगत र व्यावसायिक प्रयोगको लागि निःशुल्क।

API मार्फत यो उपकरण प्रयोग गर्नुहोस्

आफ्नो कोड देखि यो उपकरण स्वचालित. OpenAI-संगत REST अन्त बिन्दु, बोक्ने-टोकन auth, कुनै अतिरिक्त SDK आवश्यक. टोकन लागत वेब इन्टरफेस मिल्यो.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — Sesame CSM-1B — FAQ

Sesame CSM-1B supports a wide range of languages. The exact list depends on the engine; the form on this page accepts any text and the engine will render in its supported languages. See /voice/ for the full multi-engine picker if you need a specific language.

Most engines render neutral-American English by default and a region-appropriate accent for non-English languages. Premium engines may expose accent variants — paste a sample to compare.

SSML support varies by engine. Pause, prosody, and emphasis tags are honored on most premium engines and on a few self-hosted ones. Plain text always works — no markup required.

Streaming TTS is available on premium engines via the /v1/tts/ API endpoint with stream=true. The web UI on this page returns the full clip once rendering finishes.

Sesame CSM-1B runs on our own GPUs. Generation draws from your daily free pool first. Once depleted, paid tokens start at $5 → 200,000 tokens. Roughly ~5 tokens per character, minimum 100 per clip.

Up to 5,000 characters per request on the web UI. For longer pieces (audiobooks, full chapters), use /voice/audiobook/ which chunks and stitches automatically, or call the API in a loop.

Yes — POST a list of strings to /v1/tts/batch/, or use the workspace UI at /workspace/ to chain TTS into a longer pipeline (e.g., translate → speak → stitch).

Yes — POST text to /v1/tts/ with model="Sesame CSM-1B" (or the slug on this page). Returns WAV or MP3. See /api/ for full reference + SDK snippets.

This page is text-to-speech, not voice cloning — the voice is the engine's default. For voice cloning (uploading a reference audio), see /voice/clone/, which requires you to either own the voice rights or have explicit written consent.

Self-hosted engines run on Free.ai-owned GPUs; nothing leaves our servers. Premium engines pass text to upstream model providers under our DPA. We do not train on your inputs and do not sell data.

Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.

Yes — failed jobs auto-refund to the source (daily pool or paid tokens). If a refund does not show up the same day, email contact@free.ai.

10,000 टोकनहरूको लागि निःशुल्क साइन अप गर्नुहोस्

खाता सिर्जना गर्नुहोस्

क्रेडिट कार्ड आवश्यक छैन

तपाईँले यो उपकरणलाई कसरी दर दिनुहुन्छ?

4.3/5 from 3 ratings

प्रेम Free.ai? आफ्नो साथीहरूलाई भन्नुहोस्!