Kokoro TTS (premium endpoint)
Free.ai
·
tts
·
~500 1個あたりのトークン数 clip
·
4.3
ここから 3 このカテゴリーのユーザーは
Kokoro TTS (premium endpoint)はa,テキストから音声に変換するである。 外部モデルを経由してルーティングされる - ~500トークン クリップごとに (アップストリームコストの50%マークアップ)。
API を使う
よくある質問
Kokoro TTS (premium endpoint)は多くの言語をサポートします。正確なリストはエンジンに依存します。このページのフォームはどんなテキストでも受け入れ、エンジンはサポートされている言語でレンダリングします。特定の言語が必要な場合は、 /voice/ を参照して、完全なマルチエンジン選択ツールを見てください。
ほとんどのエンジンは標準で中立的なアメリカ英語を表示し、英語以外の言語は地域に適したアクセントを表示します。プレミアムエンジンはアクセントの変種を表示する場合があります。比較のためにサンプルを貼り付けてください。
SSML サポートはエンジンによって異なります。休止、韻律、強調タグはほとんどのプレミアムエンジンと少数のセルフホストされたエンジンで尊重されます。プレーンテキストはいつでも機能します。マークアップは必要ありません。
ストリーミング TTS は、 /v1/tts/ API エンドポイントで stream=true を使用してプレミアムエンジンで利用できます。このページのウェブ UI は、レンダリングが終了したら、クリップ全体を返します。
Kokoro TTS (premium endpoint)はプレミアムのTTSエンジンです。コストは文字数に応じて変化します。通常、文字ごとに約30個のトークンが必要です。$1で75万個のトークンを購入できます。5ドルのパッケージは数万文字をカバーします。
ウェブ UI 上の要求ごとに最大 5,000 文字まで。長い部分 (オーディオブック、全章) の場合は、自動的にチャンクとステッチを行う /voice/audiobook/ を使用するか、ループで API を呼び出す。
はい — /v1/tts/batch/に文字列のリストを POST するか、 /workspace/のワークスペース UI を使って TTS を長いパイプラインに連結する(例えば、translate → speak → stitch)。
はい — /v1/tts/ に model="Kokoro TTS (premium endpoint)" (またはこのページの slagg) を POST します。WAV または MP3 を返します。詳細な参照と SDK スニペットは /api/ を参照してください。
このページはテキストから音声へのクローンではなく、音声はエンジンのデフォルトです。音声クローン(参照音声をアップロード)については、 /voice/clone/ を参照してください。これには、音声権の所有者か、明示的な書面の同意が必要です。
自己ホストエンジンは Free.ai 所有の GPU 上で動作します。何もサーバから出て行きません。プレミアムエンジンは DPA の下でテキストをアップストリームモデルプロバイダに渡します。私たちはあなたの入力を訓練しませんし、データを売りません。
Free.aiは生成されたオーディオの商用利用を許可します。エンジンの基本ライセンス (Apache 2.0、MIT、またはベンダーの条件) は上部とモデル参照ページに表示されます。実際には、これはボイスオーバー、広告、ポッドキャスト、アプリケーションがすべて範囲内に含まれるということです。
はい — 失敗したジョブは自動的にソースに返金されます (日々のプールまたは支払いトークン) 。返金が同日に現れない場合は contact@free.ai にメールしてください。