AIビデオダビングスタジオ

商用OK 380+モデル 透かしなし 登録は不要
モデル:
+ GPT-5, Claude, Gemini
話し言葉の頭部のクリップをアップロードし、口の動きを唇同期して他の言語に吹き替えます。 Whisper は転写、MadLAD は翻訳、Kokoro は37言語に渡る174の声で話し、Sync Lipsync v2 は口を再レンダリングします。クリップの99%はソース言語を自動的に検出します。

動画をここにドラッグまたはクリックしてアップロード

MP4、MOV、WebM 100MBまで 単一スピーカーの話し頭が最適

Whisper はクリップの 99% でソース言語を検出します。自動検出が間違った場合のみオブジェクトを上書きします。
プレビューをクリックして、クリップ全体をダビングする前に、目的言語での短いフレーズを聞くことができます。
動画に音楽やサウンド FX が含まれている場合、新しい声の下に保存したい場合に有用です。オフ = 単一声のダブをクリアします。
クリップのトークン推定
クリップの正確なコストを見るにはビデオをアップロードしてください。
ダビングパイプライン
原稿
翻訳
ダウンロード

人工知能のビデオダビングが 利益をもたらす

YouTubeチャンネルのロケーション

英語のビデオを一晩でスペイン語、ポルトガル語、ヒンディー語に変換する。YouTubeのオーディオトラックスワップは、唇の動きに合わせた口の動きで、1つのアップロードで3倍の視聴者を満足させる。

グローバル・アドクリエイティブ

1つの広告を撮影し 20の言語に翻訳して 1週間のA/Bテストを行う 声優スタジオに 1言語500ドル/分払うより

E-learning + corporate training

コンプライアンス、オンボード、 製品トレーニングビデオ 12の言語が必要だ スタジオ予算なしで 同じコース、全ての市場

どうやってダビングパイプラインが動くのか

ステップ 1

転写 (Whisper large-v3)

音声はワードレベルで抽出され、タイミングで転写されます。 出力言語は99%の正確性で自動的に検出されます。

ステップ 2

翻訳

文字通りの単語ごとの翻訳ではなく,自然な発話のフレーズに調整された3Bパラメータモデルを用いて,転写を目標言語に翻訳する。

ステップ 3

話す(こころ-174声)

目的言語の自然な音声が翻訳を読み上げます。37 言語に渡る 174 の音声があります。一つを選んで、まずプレビューを聞いてみてください。

ステップ 4

リップシンク (Sync Lipsync v2)

口はフレームごとに再レンダリングされる 新しい音声に合わせて 単一スピーカーの前方向のショットのための最新の技術

なぜラスクやペーパーカップやヘイジェンじゃない?

Raskは100分の出力につき月額24ドルで、130の言語に制限されています。Papercupは企業向けのみです(電話販売、4桁の請求額を除く)。HeyGenのダビングの階層は5分のクオリティで月額29ドルから始まります。このツールは同じパイプラインコンポーネントを使用しています。STTのWhisper、翻訳のMadLAD、TTSのKokoro、口の再レンダリングのSync Lipsync v2。サブスクリプション、透かし、月額クオリティはありません。既に持っているプールからトークンを支払います。

追加オプション
結果
証券が足りない もっとトークンを取得
もっと良い結果が欲しいのか? プレミアムモデル また,高品質の画像を得るためには,画像の解像度を高くする必要がある。 プランを表示

❤️ Love this tool? Share it!

紹介リンクを得て 友達1人につき25,000トークンを稼ぐために

もっと欲しい? 無料登録で1日30Kトークン+10Kボーナス
無料登録

ご要望を処理中...

唇の動きを同期して、どんなビデオでも20以上の言語に変換できます。 Whisper は転写、MadLAD は翻訳、Kokoro は話し、Sync Lipsync v2 は口の動きに合わせます。

使い方 AIビデオダビングスタジオ

1
入力を入力

テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。

2
クリックして生成

私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。

3
ダウンロードと共有

結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。

このツールを API で使用

あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

AIビデオダビングスタジオ — FAQ

動画をアップロードし、ターゲット言語を選択し、その言語にダビングされた同じ動画を、新しいオーディオに合わせて話者の唇が再同期された状態で返します。英語の YouTube コンテンツをスペイン語、フランス語、中国語などに変換するのに最適です。

サーバ側で順次実行される4つのステップは、 (1) Whisper が元の音声を転写、 (2) MadLAD が転写を目標言語に翻訳、 (3) Kokoro がその言語で自然な音声を生成、 (4) Sync Lipsync v2 が新しい声に合わせて話者の口を再マッピングします。これらはすべて一つの要求で実行されます。ジャグリングツールは必要ありません。

20 言語のドロップダウンリストが表示されます。これらは、スペイン語、フランス語、ドイツ語、ポルトガル語、イタリア語、中国語、日本語、韓国語、アラビア語、ヒンディー語、トルコ語、ロシア語、オランダ語、ポーランド語、ベトナム語、インドネシア語、タイ語、ヘブライ語、スウェーデン語、英語です。 MadLAD は技術的には 450 以上の言語をサポートしています。他の言語が必要な場合は、お問い合わせください。

ダビングは有料トークンのみを使用します (クリップ当たり約 100,000 円)。Sync Lipsync v2 は高価なステップです。最初の 3 つは無料で自己ホストされています。登録ボーナスクレジットはAIビデオダビングスタジオをロック解除しません。

30 秒以下のクリップは約 1-3 分でダビングします。長いビデオは比例して長くなります。アップロードのハードキャップは 100 MB です。長い作品の場合はシーンに分割してそれぞれダビングしてください。

いいえ。Kokoroは174の内蔵音声 (37言語) のうちの1つを使用します。オリジナルのスピーカーのクローンではありません。アイデンティティを保持するための声のクローンには、別の /voice/clone/ツールとカスタムパイプラインが必要です。

シンクロ リップシンクロ v2 は、単一スピーカーの前方向撮影に最適です。多数のスピーカーのシーンやプロファイルビューのクリップはドリフトします。最良の結果は、話し頭のクローズアップ撮影です。

簡単なピックアップは Auto/Male/Female を提供します。精密な音声選択のために、まず /voice/tts/ を使って音声 ID をプレビューしてコピーし、それを送信します。UI にもうすぐ追加されます。

アップロードされたビデオは処理後数分以内に削除されます。出力は共有リンクのCDN上で24時間(有料ユーザは7日)保存されます。

はい - 純粋なリップシンクワークフロー (ビデオ + 前記録音声) の場合、下にある /v1/image/edit/ またはカスタムエンドポイントを使用します。ダビングは自動的に4つのステップを組み合わせます。

字幕ファイル (SRT/VTT) には /transcribe/ を使い、既存の SRT を翻訳するには /translate/subtitle/ を使います。ダビングはオーディオを置き換え、字幕はテキストをオーバーレイします。異なる出力です。

はい — target_lang を使って /v1/video/dubbing/ に多重ビデオを POST します。返します {output_url, transcript, translated_text}。ドキュメントは /api/ を参照してください。

1万枚のトークンで無料登録

無料アカウントを作成

クレジットカードは必要ありません

このツールをどう評価しますか?

Love this tool? Share it!