人工唇同期

商用OK 380+モデル 透かしなし 登録は不要
モデル:
+ GPT-5, Claude, Gemini
話し頭のビデオとオーディオトラックまたはスクリプトをアップロードしてください。新しいオーディオに合わせてフレームごとに口を再レンダリングします。Sync Lipsync v2 で動作します。リダビング、ADR、ボイスオーバーの置き換え、サイレントクリップの話し方に最適です。

動画をここにドラッグまたはクリック

MP4/MOV/WebM ·最大100MB

· ·

音声ファイルをここにドラッグまたはクリック

MP3/WAV/M4A ·最大50MB

·
0 / 1500
持続時間が一致しない
クリップのトークン推定
動画と音声をアップロードして(あるいはスクリプトを入力して)正確なコストを見てください。
ダウンロード

人工知能の唇同期が 成功する場所

赤字

口の音を再生する 発音の間違いで 再撮影は無い

声優交換

どんな俳優でも撮影し、好きなボイスオーバーアーティスト(またはTTS音声)でダビングしてください。口は先導ではなく、後続します。

話し言葉のアバター

静止画の肖像画やAIによって生成されたキャラクターに声を与えます。 /image-to-video/ と連結して、静止画をアニメーション化し、それから声を出すことができます。

人工唇同期の仕組み

ステップ 1

動画をアップロード

明瞭な前方向の顔が最も効果的です。マルチスピーカー、プロファイルビュー、急速な頭の回転は品質を低下させます。

ステップ 2

オーディオを提供

MP3/WAV/M4Aをアップロードするか、スクリプトを入力して、Kokoro(37言語にわたる174の音声)でTTSします。

ステップ 3

チェック

音声とビデオの長さが0.5秒以上異なると警告します。デフォルトでは短い長さに自動的にトリムします。

ステップ 4

レンダリング

音声の音声化を行うには、音声の音声化を行うためのプログラムをインストールする必要があります。

唇同期出力のためのヒント

  • 前方に向けたスピーカーが1台 複数のスピーカーで撮影すると 顔検出器が混乱する
  • 顔の半分が暗くて 口の追跡が困難だった
  • オーディオはピークが -6 dB から -3 dB です。クリップされたオーディオや、ほんの少し静かなオーディオの同期は悪い。
  • 30秒のチャンクが最も速くレンダリングされます。10分以上のビデオの場合はシーンに分割してください。
追加オプション
結果
証券が足りない もっとトークンを取得
もっと良い結果が欲しいのか? プレミアムモデル また,高品質の画像を得るためには,画像の解像度を高くする必要がある。 プランを表示

❤️ Love this tool? Share it!

紹介リンクを得て 友達1人につき25,000トークンを稼ぐために

もっと欲しい? 無料登録で1日30Kトークン+10Kボーナス
無料登録

ご要望を処理中...

人工知能で唇同期ビデオを作成します。どんな顔にもオーディオをマッチさせます。

使い方 人工唇同期

1
入力を入力

テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。

2
クリックして生成

私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。

3
ダウンロードと共有

結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。

このツールを API で使用

あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

人工唇同期 — FAQ

話し声の頭部のビデオとオーディオトラックをアップロードすると、AI はフレームごとに口を再レンダリングして、新しいオーディオと音声的に一致させます。ADR、ボイスオーバーの置き換え、リダビング、無声の肖像画に声を付けるなどに最適です。

音声の各音素を解析し、各フレームの顔を検出し、唇領域をマッチさせて再生します。残りの顔、背景、体は変更されません。

リップシンクは有料トークンを使用します (最低約10,000、期間によってスケールします)。ログインしたら、ログインボーナストークンを使用できます。

MP4、MOV、WebM 100MBまで。30秒以下のクリップが最も速く動作します。1台の前方向スピーカーは最もクリーンなリップシンクを与えます。複数のスピーカーまたは頭の急速な回転は品質を低下させます。

また、スクリプトを入力して、Kokoroの37言語に渡る174の音声から選択してください。それをTTSに変換して、ドライブ音声として使用します。

持続時間が 0.5 秒以上異なると警告します。自動的に短く切り替えるトグル (標準で有効) は、長いものを切り替えます。そうでなければ、出力は重なり合うウィンドウのみをカバーします。

良い結果: 1 人の明瞭な前方向顔、良い照明、ほとんど安定したカメラ。悪い結果: プロファイルビュー、遮蔽された顔(サングラス、マスク)、複数の競合する顔、フレームの一部に口を含む極端なクローズアップ。

ダビング (/video/dubbing/) は、STT → 翻訳 → TTS → リップシンクの完全なパイプラインです。リップシンクは最後のステップに過ぎません。音声を自分で提供します。ボイスオーバートラックが用意されている場合は、リップシンクを使用してください。翻訳と再ボイスを初めから作成したい場合は、ダビングを使用してください。

典型的には、30秒のクリップは 1-2 分でレンダリングされます。提出後、バナーに待ち時間の推定値が表示され、結果はダッシュボードに表示されます。タブを閉じることもできます。

一度に一つの顔にロックされます。マルチスピーカーシーンでは、単一スピーカーのクリップに切り分け、それぞれをリップシンクし、ビデオエディタで再び合成します。

入力ファイルはレンダリング後数分以内に削除されます。出力は共有リンクの CDN 上で 24 時間 (有料ユーザは 7 日) 保存されます。

はい — 多部 分のビデオ + オーディオファイル (またはビデオ + テキスト + 音声) を /v1/video/lip-sync/ に POST します。ドキュメントは /api/ を参照してください。

1万枚のトークンで無料登録

無料アカウントを作成

クレジットカードは必要ありません

このツールをどう評価しますか?

Love this tool? Share it!