AI Voice — Sesame CSM-1B

商用OK 380+モデル 透かしなし 登録は不要
モデル:
+ GPT-5, Claude, Gemini
音声翻訳エンジン セルフホスティング Apache 2.0
Sesame CSM-1B — Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
0 文字 ~0 個のトークン
文字数のあるコストスケール
音声を生成中...

何を Sesame CSM-1B どうだ?

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

上のボックスに こう入力してみてください: Hello, my name is Sam, and I am reading this sample to demonstrate the voice. — これが標準的な TTS デモフレーズです。

使用時期 Sesame CSM-1B

オーディオブック

音色が一貫した長い形式のナレーション。一度に一章を貼り付け、WAV または MP3 としてダウンロードし、外部で編集します。

ポッドキャストのイントロ

短いオープニングバンパーとアドリード エネルギーのために速度を調整し、小さいファイルのためにフォーマットをMP3に切り替えます。

電話応答システム

電話システムのプロンプト スタジオの質の出力 予約なし 録音なし 声優との 非公開契約なし

アクセシビリティ

視覚障害者や難読者のための音声を文字のコンテンツに追加します。どのページにもドロップインできます。

例文

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

価格

私たちのGPUで自分でホストします。生成は最初に毎日のフリープールから引く。それが使い切れば、有料のトークンパッケージは$5から始まります。20万トークン。約5トークン/キャラクター、クリップあたり最低100。

モデルリファレンス → · すべての TTS 音声を表示 → · 2 つの音声を並べて比較 →

追加オプション
結果
証券が足りない Get More Tokens
Want better results? プレミアムモデル (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

紹介リンクを得て 友達1人につき25,000トークンを稼ぐために

もっと欲しい? Sign up free for 10,000 tokens
無料登録

ご要望を処理中...

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio …

使い方 AI Voice — Sesame CSM-1B

1
入力を入力

テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。

2
クリックして生成

私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。

3
ダウンロードと共有

結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。

このツールを API で使用

あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — Sesame CSM-1B — FAQ

Sesame CSM-1B supports a wide range of languages. The exact list depends on the engine; the form on this page accepts any text and the engine will render in its supported languages. See /voice/ for the full multi-engine picker if you need a specific language.

Most engines render neutral-American English by default and a region-appropriate accent for non-English languages. Premium engines may expose accent variants — paste a sample to compare.

SSML support varies by engine. Pause, prosody, and emphasis tags are honored on most premium engines and on a few self-hosted ones. Plain text always works — no markup required.

Streaming TTS is available on premium engines via the /v1/tts/ API endpoint with stream=true. The web UI on this page returns the full clip once rendering finishes.

Sesame CSM-1B runs on our own GPUs. Generation draws from your daily free pool first. Once depleted, paid tokens start at $5 → 200,000 tokens. Roughly ~5 tokens per character, minimum 100 per clip.

Up to 5,000 characters per request on the web UI. For longer pieces (audiobooks, full chapters), use /voice/audiobook/ which chunks and stitches automatically, or call the API in a loop.

Yes — POST a list of strings to /v1/tts/batch/, or use the workspace UI at /workspace/ to chain TTS into a longer pipeline (e.g., translate → speak → stitch).

Yes — POST text to /v1/tts/ with model="Sesame CSM-1B" (or the slug on this page). Returns WAV or MP3. See /api/ for full reference + SDK snippets.

This page is text-to-speech, not voice cloning — the voice is the engine's default. For voice cloning (uploading a reference audio), see /voice/clone/, which requires you to either own the voice rights or have explicit written consent.

Self-hosted engines run on Free.ai-owned GPUs; nothing leaves our servers. Premium engines pass text to upstream model providers under our DPA. We do not train on your inputs and do not sell data.

Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.

Yes — failed jobs auto-refund to the source (daily pool or paid tokens). If a refund does not show up the same day, email contact@free.ai.

1万枚のトークンで無料登録

無料アカウントを作成

クレジットカードは必要ありません

このツールをどう評価しますか?

4.3/5 from 3 ratings

Love this tool? Share it!