AI Voice — Sesame CSM-1B

상업적 사용 OK 380+ 모델 워터마크 없음 가입이 필요하지 않습니다
모델:
+ GPT-5, Claude, Gemini
TTS 엔진 셀프 호스팅 Apache 2.0
Sesame CSM-1B — Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
0 문자 ~0 토큰
문자 수를 사용한 비용 측정
음성 생성 중...

뭐가 Sesame CSM-1B 뭐라고 들리시나요?

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

위의 상자를 다음과 같이 써보세요: 안녕하세요, 제 이름은 샘이고, 음성을 시연하기 위해 이 샘플을 읽고 있습니다. — 이것이 기본 TTS 데모 문구입니다.

사용할 때 Sesame CSM-1B

오디오북

한 번에 한 장씩 붙여넣고, WAV 또는 MP3로 다운로드하고, 외부에서 스티치합니다.

팟캐스트 소개

에너지를 위해 속도를 조정하고, 작은 파일을 위해 MP3로 포맷을 전환하십시오.

IVR + 음성 메일

음성 능력자와의 예약, 녹음 또는 NDA 없이 스튜디오 품질의 출력.

접근성

시각 장애 및 난독증 독자를 위해 글과 함께 오디오를 추가하세요.

샘플 문장

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

가격

첫째, 일일 무료 풀에서 토큰을 뽑아 넣습니다. 토큰이 다 떨어지면 유료 토큰 팩은 $5 → 200,000 토큰으로 시작합니다. 캐릭터당 대략 ~5 토큰, 클립당 최소 100 토큰입니다.

전체 모델 참조 → · 모든 TTS 음성 보기 → · 2개의 음성을 나란히 비교 →

고급 옵션
결과
토큰이 부족해요 Get More Tokens
Want better results? 프리미엄 모델 (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

가입 추천 링크를 얻을 수 있으며 친구 당 25,000 토큰을 적립합니다.

더 먹고 싶어? Sign up free for 10,000 tokens
무료로 가입하세요

귀하의 요청을 처리 중...

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio …

사용 방법 AI Voice — Sesame CSM-1B

1
입력을 입력하십시오

텍스트를 입력하거나 파일을 업로드하거나 원하는 내용을 설명하세요. 계정이 필요하지 않습니다.

2
생성하기를 클릭하십시오

당사의 AI는 최고의 오픈 소스 모델을 사용하여 몇 초 만에 요청을 처리합니다.

3
다운로드 및 공유

다운로드, 복사 또는 결과를 공유. 개인 및 상업용 무료.

API를 통해 이 도구를 사용

이 도구를 자신의 코드로 자동화하세요. OpenAI 호환 REST 엔드포인트, 베어러 토큰 인증, 추가 SDK 필요 없음. 토큰 비용은 웹 인터페이스와 일치합니다.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — Sesame CSM-1B — FAQ

Sesame CSM-1B supports a wide range of languages. The exact list depends on the engine; the form on this page accepts any text and the engine will render in its supported languages. See /voice/ for the full multi-engine picker if you need a specific language.

Most engines render neutral-American English by default and a region-appropriate accent for non-English languages. Premium engines may expose accent variants — paste a sample to compare.

SSML support varies by engine. Pause, prosody, and emphasis tags are honored on most premium engines and on a few self-hosted ones. Plain text always works — no markup required.

Streaming TTS is available on premium engines via the /v1/tts/ API endpoint with stream=true. The web UI on this page returns the full clip once rendering finishes.

Sesame CSM-1B runs on our own GPUs. Generation draws from your daily free pool first. Once depleted, paid tokens start at $5 → 200,000 tokens. Roughly ~5 tokens per character, minimum 100 per clip.

Up to 5,000 characters per request on the web UI. For longer pieces (audiobooks, full chapters), use /voice/audiobook/ which chunks and stitches automatically, or call the API in a loop.

Yes — POST a list of strings to /v1/tts/batch/, or use the workspace UI at /workspace/ to chain TTS into a longer pipeline (e.g., translate → speak → stitch).

Yes — POST text to /v1/tts/ with model="Sesame CSM-1B" (or the slug on this page). Returns WAV or MP3. See /api/ for full reference + SDK snippets.

This page is text-to-speech, not voice cloning — the voice is the engine's default. For voice cloning (uploading a reference audio), see /voice/clone/, which requires you to either own the voice rights or have explicit written consent.

Self-hosted engines run on Free.ai-owned GPUs; nothing leaves our servers. Premium engines pass text to upstream model providers under our DPA. We do not train on your inputs and do not sell data.

Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.

Yes — failed jobs auto-refund to the source (daily pool or paid tokens). If a refund does not show up the same day, email contact@free.ai.

10,000 토큰을 무료로 등록하세요

무료 계정 만들기

신용카드 필요 없음

이 도구를 어떻게 평가하시겠습니까?

4.3/5 from 3 ratings

Love this tool? Share it!