字幕生成

商用OK 380+モデル 透かしなし 登録は不要
モデル:
+ GPT-5, Claude, Gemini
動画を投稿すると、Whisperで文字転写し、ワードレベルタイミングを持つSRTまたはVTT字幕ファイルを作成し、TikTok準備スタイルプレセットを使って字幕をフレームに直接書き込む(オプション)。99の言語、デフォルトで自動検出。

動画をここにドラッグまたはクリックしてアップロード

MP4、MOV、WebM、MKV 200MBまで — または音声のみの転写のための MP3/WAV

Whisperは99の言語をサポートします。自動検出は99%のクリップで動作します。
SRTはどのプレーヤーでも動作します。VTTはウェブビデオでも綺麗に動作します。
クリップのトークン推定
買いトークン
クリップの正確なコストを見るにはビデオをアップロードしてください。
ダウンロード

            

字幕生成が稼ぐ場所

ティックトック/リール/ショート

85%の短い形式の視聴者は 音を消してる ティックトックのチューンで 字幕を入れれば 完成率が上がる

YouTubeの字幕

SRT サイドカーモードを選択し、ファイルを YouTube スタジオにアップロードします。ほとんどの言語で YouTube 自動キャプションよりも正確です。

電子学習

ADA/WCAG はトレーニングビデオにキャプションを要求します。一度生成して、点検して、完了です。

バーニング バーニングとは、どちらかというと「燃焼」のこと。

サイドカー

.srt または.vtt ファイルを分離します。ビューアのプレーヤーが表示するかどうかを決定します。YouTube、Vimeo、Web HTML5 ビデオ、Netflix、VLC で動作します。

  • 安価なのはSTTのみで、再符号化はない。
  • 編集可能 — テキストエディタでタイプミスを修正できます。
  • 視聴者はサブをオン/オフにする。

バーンイン

字幕は各フレームにラスター化されます。TikTok、Reels、ストーリー、サイドカー字幕をサポートしないプラットフォームに必要です。

  • どこでも見える
  • 選択したプリセットにスタイルロック
  • 永久的に - 再編集のためにサイドカーファイルを保持します。

なぜRevやKapwingやYouTubeの自動キャプションはないのか?

Revは人間のキャプションに1.50ドル/分を請求します(60分の講義につき90ドル)。Kapwingは無制限の自動キャプションに月額16ドルを請求しますが、無料でエクスポートすると透かしを付けます。YouTubeの自動キャプションは英語ではWhisperの品質ですが、非英語では著しく劣っています。このツールは同じWhisperモデル(large-v3)を使用しており、サブスクリプション、透かし、分ごとの料金はありません。既にあるプールからトークンを支払います。

追加オプション
結果
証券が足りない Get More Tokens
Want better results? プレミアムモデル (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

紹介リンクを得て 友達1人につき25,000トークンを稼ぐために

もっと欲しい? Sign up free for 10,000 tokens
無料登録

ご要望を処理中...

人工知能を使ってビデオの字幕を自動生成します。

使い方 字幕生成

1
入力を入力

テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。

2
クリックして生成

私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。

3
ダウンロードと共有

結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。

このツールを API で使用

あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

字幕生成 — FAQ

動画をアップロードすると、Whisperで音声を転写し、各フレーズをタイムラインし、SRTまたはVTT字幕ファイルを返します。または、字幕をビデオに直接書き込むこともできます。自動検出で99の言語で動作します。

はい。転写は12トークン/秒 (400トークンフロア)。60秒のクリップはサイドカーSRTで720トークンかかります。バーンインを追加すると1920トークンになります。 なぜなら、ビデオを字幕オーバーレイで再エンコードするからです。両方のレートはログインしたユーザーの日々のプール内です。

Whisper は 99 言語をすべて扱います。英語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、中国語、日本語、韓国語、アラビア語、ヒンディー語、ロシア語、トルコ語、その他 86 言語。自動検出は自動的に正しい言語を選択します。複数言語のクリップの場合は、この設定を無効にできます。

SRT (SubRip — 汎用的でどこでも動作)、VTT (WebVTT — HTML5 動画ネイティブで、スタイリングヒントをサポート) と、バーンインモードでフレームにラスター化された字幕をビデオに再レンダリングする。TikTok に対応している。

クラシック (白い Arial、黒い外観、下部中央), Cinema (ボールドボックススタイル、高いコントラスト), TikTok (黄色い Impact, 垂直ビデオに最適化), Clean (薄い Helvetica, 最小限の外観) の4つは、正しいアンチエイリアスのために ffmpeg 内の SubStation Alpha を通してスタイル化されています。

ユーザが字幕をオン/オフにする場合はサイドカーを使用します(YouTube、ウェブプレーヤー、Netflix スタイル)。ターゲットプラットフォームがサイドカー字幕を認識しない場合はバーンインを使用します(TikTok、Reels、ショートフィード、Instagram ストーリー)。バーンインは片道操作です。再編集する場合はサイドカーを残してください。

Whisper large-v3は、清潔な英語音声で95-98%の単語精度に達し、英語以外の音声や騒音の入力では85-95%に達します。法律、医学、公衆に向けたキャプションは常に点検してください。アクセントとスピーカーの重なりは誤認識の主な原因です。

直接ではありません。字幕生成はソース言語で字幕を書き換えます。翻訳した字幕の場合は、SRT をここにエクスポートし、/translate/subtitle/ にアップロードして、目的言語を選択してください。テキストを交換する際にタイミングを保つことができます。

最大 200MB (1080p で通常 10-15 分)。長いクリップは原則として大丈夫ですが、バーンインモードで ffmpeg の 10 分のタイムアウトに達する可能性があります。バーンインする場合は長い講義を 5 分のチャンクに分割してください。

これは、多くの有料サービスの基盤となる同じ Whisper モデルを使用し、トークンプール内で無料で利用できます。

いいえ。アップロードは字幕が生成されるとすぐに削除されます。SRT/VTTと焼き込んだ MP4は、24時間(有料ユーザは7日)間、我々の CDN 上でライブで表示されます。ダウンロードや共有ができます。

はい。 /v1/video/subtitle/ に `file`、`language`、`format`、オプションの `burn_in=true`、`font_style` を含むマルチパートを POST します。 前のフライト: GET /v1/video/subtitle-quote/?duration=SECS&burn_in=true。 /api/ に全スニペットがあります。

1万枚のトークンで無料登録

無料アカウントを作成

クレジットカードは必要ありません

このツールをどう評価しますか?

Love this tool? Share it!