Synchronisation des lèvres de l'IA

Utilisation commerciale OK 380+ modèles Pas de filigrane Pas besoin d'inscription
Modèle:
+ GPT-5, Claude, Gemini
Téléchargez une vidéo en tête-à-tête parlante et soit une piste audio ou un script — nous allons remettre le frame-by-frame bouche pour correspondre au nouvel audio. Propulsé par Sync Lipsync v2. Idéal pour le redoublage, l'ADR, le remplacement voix-off, ou faire un clip muet.

Faites glisser une vidéo ici ou cliquez sur

MP4 / MOV / WebM · max 100MB

· ·

Faites glisser un fichier audio ici ou cliquez sur

MP3 / WAV / M4A · max 50 Mo

·
0 / 1500
Les durées ne correspondent pas
Estimation de jeton pour votre clip
Téléchargez une vidéo + audio (ou tapez un script) pour voir le coût exact.
Télécharger

Où IA lip-sync gagne sa garde

ADR/redub

Re-enregistrez une ligne dans la cabine, déposez-la, la bouche re-rends pour correspondre. Plus de rappels sur un mot mal prononcé.

Échange de voix vers l'extérieur

Tirez avec n'importe quel acteur, dub avec votre artiste préféré voix off (ou une voix TTS) — les lèvres suivent, pas le plomb.

Avatars parlants

Donnez une voix à un portrait silencieux ou à un personnage généré par l'IA. Chaînez avec /image-à-vidéo/ pour animer un portrait immobile d'abord, puis faites-le parler.

Comment fonctionne la synchronisation des lèvres de l'IA

Étape 1

Télécharger la vidéo

Le visage clair orienté vers l'avant fonctionne mieux. Le haut-parleur multiple, la vue de profil ou les tours de tête rapides réduisent la qualité.

Étape 2

Fournir l'audio

Télécharger MP3 / WAV / M4A OR tapez un script et nous le TTS avec Kokoro (174 voix dans 37 langues).

Étape 3

Contrôle de longueur

Nous avertissons si la vidéo et l'audio diffèrent de plus de 0,5 s. Auto-trim à la longueur plus courte est cochée par défaut.

Étape 4

Rendu

Sync Lipsync v2 re-rend chaque cadre de bouche pour phonétique-match le nouvel audio. Typique clip de 30 secondes: ~1–2 min.

Conseils pour la meilleure sortie lip-sync

  • Haut-parleur unique orienté vers l'avant. Les prises de vue multi haut-parleurs confondent le détecteur de visage.
  • Des ombres lourdes sur la moitié du visage ont blessé le suivi de la bouche.
  • Audio à -6 dB à -3 dB pic. Synchronisation audio plus rapide ou plus rapide.
  • Les morceaux de 30 secondes rendent plus rapide. Pour les vidéos de plus de 10 minutes, divisés en scènes.
Options avancées
Résultat
Les jetons sont bas. Obtenez plus de jetons
Vous voulez de meilleurs résultats? Modèles premium (GPT-5, Claude, Gemini) offrent une qualité supérieure. Afficher les plans

❤️ Love this tool? Share it!

Inscrivez-vous pour obtenir un lien de référence et gagner 25 000 jetons par ami.

Tu en veux plus? Inscrivez-vous gratuitement pour 30K jetons/jour + 10K bonus
Inscription gratuite

Traitement de votre demande...

Créez des vidéos recoupées à la lèvre avec l'IA. Faites correspondre l'audio à n'importe quel visage.

Comment utiliser Synchronisation des lèvres de l'IA

1
Saisissez votre entrée

Tapez du texte, téléchargez un fichier ou décrivez ce que vous voulez. Aucun compte n'est nécessaire.

2
Cliquez sur générer

Notre IA traite votre demande en quelques secondes à l'aide des meilleurs modèles open-source.

3
Télécharger et partager

Téléchargez, copiez ou partagez votre résultat. Gratuit pour un usage personnel et commercial.

Utilisez cet outil via l'API

Automatisez cet outil à partir de votre propre code. Endpoint REST compatible OpenAI, Auth-token auth, pas de SDK supplémentaire requis.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

Synchronisation des lèvres de l'IA — FAQ

Téléchargez une vidéo en tête-à-tête parlante, une piste audio (ou tapez un script pour TTS) et l'IA rattache le cadre bouche par image au nouvel audio phonétique. Idéal pour l'ADR, le remplacement de la voix, le redoublage ou la présentation silencieuse d'une voix.

Sync Lipsync v2 est un modèle buccal ultramoderne. Il analyse chaque phonème dans l'audio, détecte le visage dans chaque cadre et régénère la région des lèvres pour correspondre. Le reste du visage, de l'arrière-plan et du corps sont intacts.

Lip-sync utilise des jetons payés (~10 000 minimum, échelles avec durée). Les jetons bonus d'inscription peuvent être utilisés une fois que vous êtes connecté.

MP4, MOV, WebM jusqu'à 100 Mo. Les clips de moins de 30 secondes fonctionnent plus vite. Un haut-parleur orienté vers l'avant donne le plus propre lip-sync; multi-parleur ou tours de tête rapides réduisent la qualité.

MP3, WAV, M4A jusqu'à 50 Mo. Sinon, tapez un script et choisissez parmi les 174 voix de Kokoro dans 37 langues — nous allons le TTS et l'utiliser comme audio de conduite.

Nous vous prévenons lorsque les durées diffèrent de plus de 0,5 seconde. Le "auto-trim to short" bascule (sur par défaut) coupe le plus long des deux; sinon la sortie ne couvre que la fenêtre qui se chevauche.

Meilleurs résultats : un visage clair orienté vers l'avant, bien éclairé, généralement stable. Mauvais résultats : vue de profil, visage occulté (verres de soleil, masques), multiples visages concurrents, gros plan extrême avec bouche partielle dans le cadre.

Le doublage (/video/doublage/) est un pipeline complet: STT → traduire → TTS → lip-sync. Lip-sync n'est que la dernière étape — vous fournissez l'audio vous-même. Utilisez le lip-sync lorsque vous avez déjà la piste vocal-over prête; utilisez le doublage lorsque vous voulez traduire et re-voix à partir de zéro.

Typique : Un clip de 30 secondes rend en 1-2 minutes. La bannière affiche une estimation d'attente une fois que vous soumettez, et le résultat atterrit dans votre tableau de bord — vous pouvez fermer l'onglet.

Pas dans un seul passage — le modèle se verrouille sur un seul visage. Pour les scènes multi haut-parleurs, découpées en clips à un seul haut-parleur, lip-sync chacune, puis recoudre ensemble dans un éditeur vidéo.

Non. Les fichiers d'entrée sont supprimés dans les minutes qui suivent le rendu. La sortie est conservée sur notre CDN pendant 24h (7j pour les utilisateurs payants) sur le lien de partage.

Oui — POST une vidéo multipart + fichier audio (ou vidéo + texte + voix) vers /v1/video/lip-sync/. Voir /api/ pour les docs.

Inscrivez-vous gratuitement pour 10 000 jetons

Créer un compte gratuit

Aucune carte de crédit requise

Comment évalueriez-vous cet outil?

Love this tool? Share it!