STT Online

商用OK 380+モデル 透かしなし 登録は不要
モデル:
+ GPT-5, Claude, Gemini
オーディオやビデオファイルをアップロードするか、URLを貼り付けてタイムスタンプ付きの清潔な転写を取得します。スピーカーダイアリゼーション、SRT/VTT字幕エクスポート、自動検出の100以上の言語。クリップの長さに合わせてコストを正確にスケールします。Whisper large-v3とParakeet (自己ホスト)、プライム WizperとElevenLabs STTで動作します。

オーディオ/ビデオをドラッグして落とすか、クリックしてブラウズします

MP3, WAV, MP4, WebM, M4A — 最大500MB

Whisper large-v3 - 99言語、クラス最高の正確さ。
このクリップのトークン推定
無料登録 買いトークン
YouTube、Instagram、TikTok、Spotify、1,300以上のプラットフォーム
ダウンロード後に価格を発表します。 Whisperでは約500トークン/分を予想してください。
録音: 0:00

マイクを使ったリアルタイムの転写

転写

音声を転写中...

ファイルのサイズが大きい場合は、少し時間がかかるかもしれません。

Free.aiで書かれるもの

Interviews + podcasts

ディアリゼーションはすべてのスピーカーにラベルを付けます。SRTをビデオエディタに直接エクスポートするか、記事を書くためのプレーンテキストにエクスポートします。

Auto captions + subtitles

YouTube アップロードまたは TikTok をアップロードし、SRT または WebVTT を選択し、字幕を /video/subtitle/ に書き込む。ワンステップ字幕ワークフロー。

会議ノート

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

90分の講義を書き留めて、その後、/study/flashcards/または/write/summarize/を使って、それを学習資料に変換する。

外国語音声

Whisper は 99 言語を自動検出します。原文で転写し、 /translate/ を通してジャンプ言語にテキストを送ります。

Legal + medical

タイムスタンプ、スピーカーラベル、各単語の開始/終了時間を含むJSONエクスポート - 正確な法廷レポーターまたは臨床ノートの準備。

Free.aiの転写と比較すると

あなたが得るもの Free.ai Otter.ai Descript Rev.com
無料日利用5K+ tokens/day300 minutes/mo1 hr/month
エンジンWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
言語99English-focused2230+
話者の透析
SRT/VTT エクスポートPaidPaid
パブリックAPILimitedLimited
ライブストリーミングSTT 自由 Paid
登録が必要いやYesYesYes
競合他社の数字は2026年現在の公開リストのフリープランを反映しています。各プロバイダの現在のプランを確認してください。
追加オプション
結果
証券が足りない Get More Tokens
Want better results? プレミアムモデル (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

紹介リンクを得て 友達1人につき25,000トークンを稼ぐために

もっと欲しい? 無料登録で1日5Kトークン+10Kボーナス
無料登録

ご要望を処理中...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

使い方 STT Online

1
入力を入力

テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。

2
クリックして生成

私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。

3
ダウンロードと共有

結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。

このツールを API で使用

あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) converts spoken audio into written text using AI. Free.ai runs Whisper large-v3 — the most accurate open-source speech recognition model — on our own GPUs.

はい。最大500MBのオーディオファイルをアップロードできます。STTはオーディオの1分あたり約500トークンを必要とします。1日に2,500-5,000トークンを無料で受け取ります。1日に複数のファイルを無料で受け取ります。

STTはMP3、WAV、MP4、WebM、M4A、OGG、FLACなど、ほぼすべてのオーディオやビデオフォーマットを受け入れており、アップロード当たり最大500MBまで。

はい。STT の結果は TXT、SRT (字幕)、または VTT (ウェブ字幕) としてエクスポートできます。YouTube 字幕やビデオ字幕に最適です。

私たちのSTTは,Whisper large‐v3を使用し,99言語で95%以上の単語精度を達成している。

はい。STTオプションでスピーカーダイアリゼーションを有効にすると、AIはセグメントをスピーカー1、スピーカー2などとラベル付けします。50%のトークンが必要です。

はい。STT APIはOpenAI互換である。オーディオを /v1/audio/transcriptionsに POST し、JSONを受け取ります。HTTP要求を送信できる言語からでも動作します。

ライブタブはマイクを捕捉し 遅延を最小限に抑えて ストリーミングします

はい、YouTube、TikTok、Instagram、Spotify、VimeoのURLを貼り付けると、STTはオーディオを抽出し、転写します。 1,300以上のプラットフォームをサポートします。

速度 - 1分のクリップは数秒で終了し、30分の録画は約1分で、1時間のファイルは約2分で完了します。WhisperはGPUクラスタ上で動作します。

はい、オーディオは私たちのGPUで処理され、STTが終了した後に削除されます。長期的に保存されることはありません。共有されることもありません。モデルの訓練に使用されることもありません。

Whisper large-v3 — 最大で最も正確な Whisper モデル (1.55B パラメータ)。速度とプライバシーのために A100 GPU 上で自己ホストしています。

1万枚のトークンで無料登録

無料アカウントを作成

クレジットカードは必要ありません

このツールをどう評価しますか?

Love this tool? Share it!