همگام‌سازی لب‌های هوش مصنوعی

استفاده تجاری ص ۳۸۰. بدون نشان آبی نیازی به ثبت نام نیست
مدل:
+ GPT-5, Claude, Gemini
یک ویدئو از سر صحبت‌کننده و یا یک آهنگ صوتی یا یک اسکریپت را بارگذاری کنید — ما فریم به فریم دهان را برای مطابقت با صدای جدید دوباره ترسیم می‌کنیم. با Sync Lipsync v2 پشتیبانی می‌شود. ایده‌آل برای کاهش، ADR، جایگزینی صدای اضافی، یا ساختن یک کلیپ صامت صحبت.

ویدئو را به اینجا بکشید یا کلیک کنید

MP4 / MOV / WebM · حداکثر ۱۰۰ مگابایت

· ·

پروندۀ صوتی را به اینجا بکشید یا کلیک کنید

MP3 / WAV / M4A · حداکثر ۵۰ مگابایت

·
0 / 1500
مدت‌ها تطابق ندارند
برآورد نشانه برای ویدئو
یک ویدئو + صدا را بارگذاری کنید (یا یک اسکریپت را تایپ کنید) تا هزینه دقیق را ببینید.
بارگیری

جایی که هوش مصنوعی لب هماهنگ کردنش را بدست می آورد

ADR / redub

يه خط رو تو کابين دوباره ضبط کن، بندازش تو، دهن دوباره بهم ميخوره ديگه براي تلفظ اشتباه کلمه بازي نميکنيم

جابجایی صدا

با هر بازیگری فیلمبرداری کنید، با صدای مورد علاقه خود (یا صدای TTS) - لب‌ها دنبال می‌کنند، نه رهبری می‌کنند.

آواتارهای حرفه‌ای

به یک پرتره ساکت یا شخصیتی که توسط هوش مصنوعی ایجاد شده است صدا بدهید. با /image-to-video/ زنجیره کنید تا ابتدا یک پرتره ثابت را پویانمایی کنید، سپس آن را به صحبت وادار کنید.

چگونه هوش مصنوعی لب هماهنگ کار می کند

گام ۱

بارگذاری ویدئو

چهره روشن رو به جلو بهترین کار را می‌کند. چند بلندگو، نمای پروفایل، یا چرخش سریع سر کیفیت را کاهش می‌دهد.

گام دوم

فراهم کردن صدا

MP3 / WAV / M4A را آپلود کنید یا یک اسکریپت را تایپ کنید و ما آن را با Kokoro (۱۷۴ صدا در ۳۷ زبان) ترجمه می‌کنیم.

گام ۳

بررسی طول

اگر ویدئو و صدا بیش از ۰٫۵ ثانیه تفاوت داشته باشند، هشدار می‌دهیم.

گام چهارم

نمایش

Sync Lipsync v2 هر فریم دهان را برای مطابقت با صدای جدید دوباره نمایش می‌دهد.

نکات برای بهترین خروجی همگام‌سازی لب

  • يه بلندگوي جلويي. شليک هاي چند بلندگويي شناسايي چهره رو گيج ميکنه
  • چهره خوب روشن شده سايه هاي سنگين روي نصف صورت باعث ميشه که رديابي دهان مشکل باشه
  • صدا در ۶ dB- تا ۳ dB- اوج. همگام‌سازی صدای بریده یا آهسته بدتر است.
  • برای ویدئوهای ۱۰ دقیقه و بیشتر، به صحنه‌ها تقسیم کنید.
گزینه‌های پیشرفته
نتیجه
. رمزها کم ميشه گرفتن نشانه‌های بیشتر
نتيجه بهتري ميخواي؟ مدلهای پریمیوم (GPT-5, Claude, Gemini) کیفیت بالاتری را ارائه می‌دهند. نمایش نقشه

❤️ دوست Free.ai رو به دوستانت بگو

Sign up برای دریافت لینک راهنمایی و کسب ۲۵۰۰۰ توکن برای هر دوست.

بيشتر ميخواي؟ ثبت نام مجاني براي 30K توکن/روز + 10K بونوس
ثبت نام

در حال پردازش درخواست شما...

ویدئوهای همگام‌سازی لب را با هوش مصنوعی ایجاد کنید. صدا را با هر چهره ای تطبیق دهید.

چطور استفاده کنم همگام‌سازی لب‌های هوش مصنوعی

1
وارد کردن ورودی

متن را تایپ کنید ، یک پرونده را بارگذاری کنید ، یا آنچه را که می‌خواهید توصیف کنید. حساب نیازی نیست.

2
ایجاد را بزنید

هوش مصنوعی ما درخواست شما را در چند ثانیه با استفاده از بهترین مدل‌های منبع باز پردازش می‌کند.

3
بارگیری و اشتراک

دانلود، کپی یا اشتراک‌گذاری نتایج خود. برای استفاده شخصی و تجاری رایگان است.

استفاده از این ابزار از طریق API

این ابزار را از کد خودتان خودکار کنید. نقطه پایانی REST سازگار با OpenAI، گواهی‌نامه حامل گواهی‌نامه، نیازی به SDK اضافی نیست. هزینه گواهی‌نامه با رابط وب مطابقت دارد.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

همگام‌سازی لب‌های هوش مصنوعی — FAQ

یک ویدئو از یک سر صحبت‌کننده را همراه با یک آهنگ صوتی بارگذاری کنید (یا یک اسکریپت برای TTS تایپ کنید) و هوش مصنوعی فریم به فریم دهان را برای مطابقت صوتی با صدای جدید بازسازی می‌کند. ایده‌آل برای ADR، جایگزینی صدای فوق، کاهش صدا یا دادن صدا به یک پرتره ساکت.

همگام‌سازی Lipsync v2 یک مدل رندر دهان پیشرفته است. هر صدایی در صدا را تجزیه و تحلیل می‌کند، صورت را در هر فریم شناسایی می‌کند و ناحیه لب را برای تطابق دوباره ایجاد می‌کند. بقیه صورت، پس‌زمینه و بدن دست نخورده باقی می‌مانند.

همگام‌سازی لب از نشانه‌های پرداختی استفاده می‌کند (حداقل ~۱۰۰۰۰، با طول مدت مقیاس می‌شود). نشانه‌های اضافه ثبت نام می‌توانند پس از ورود به سیستم استفاده شوند.

MP4, MOV, WebM تا ۱۰۰ مگابایت. کلیپ‌های کمتر از ۳۰ ثانیه سریع‌ترین کار را انجام می‌دهند. یک بلندگو با جهت جلویی، همگام‌سازی لب‌های تمیز را فراهم می‌کند؛ بلندگوهای چندگانه یا چرخش سریع سر کیفیت را کاهش می‌دهد.

MP3, WAV, M4A تا ۵۰ مگابایت. به جای آن، یک اسکریپت تایپ کنید و از ۱۷۴ صدای کوکورو در ۳۷ زبان انتخاب کنید — ما آن را به TTS تبدیل می‌کنیم و از آن به عنوان صدای رانندگی استفاده می‌کنیم.

هنگامی که طول مدت‌ها بیش از ۰٫۵ ثانیه تفاوت دارند ، به شما هشدار می‌دهیم. کلید «خودکار کوتاه کردن به کوتاه‌تر» (به صورت پیش‌فرض فعال) طولانی‌ترین از دو را می‌بسته؛ در غیر این صورت ، خروجی فقط پنجره‌ی همپوشانی را پوشش می‌دهد.

بهترین نتایج: یک چهره روشن رو به جلو، روشنایی خوب، بیشتر دوربین ثابت. نتایج ضعیف: نمای پروفایل، چهره بسته (عینک آفتابی، ماسک)، چند چهره رقابتی، نزدیک‌نمایی شدید با دهان جزئی در قاب.

دوبله (/video/dubbing/) یک خط لوله کامل است: STT → ترجمه → TTS → همگام‌سازی لب. همگام‌سازی لب تنها آخرین گام است — شما خودتان صدا را فراهم می‌کنید. از همگام‌سازی لب هنگامی استفاده کنید که از قبل آهنگ صداگذاری آماده داشته باشید؛ از دوبله هنگامی استفاده کنید که می‌خواهید از ابتدا ترجمه و صداگذاری مجدد انجام دهید.

معمولاً: کلیپ ۳۰ ثانیه‌ای در ۱–۲ دقیقه نمایش داده می‌شود. بنر یک تخمین انتظار را نشان می‌دهد که زمانی که ارسال می‌کنید، و نتیجه در دایرکتوری شما قرار می‌گیرد - شما می‌توانید تب را ببندید.

نه در یک بار — مدل روی یک صورت قفل می‌شود. برای صحنه‌های چند بلندگو، به کلیپ‌های تک بلندگو برش دهید، هر کدام را با لب هماهنگ کنید، سپس در یک ویرایشگر ویدئو دوباره به هم بچسبانید.

نه. پرونده‌های ورودی در عرض چند دقیقه از رندر حذف می‌شوند. خروجی در شبکهٔ پخش محتوای ما برای ۲۴ ساعت (۷ روز برای کاربران پرداختی) در پیوند اشتراک نگه داشته می‌شود.

بله — یک فایل چندبخشی ویدئو + صوتی (یا ویدئو + متن + صدا) را به /v1/video/lip-sync/ ارسال کنید.

براي 10000 تا توکن مجاني ثبت نام کن

ایجاد حساب

کارت اعتباري لازم نيست

اين ابزار رو چطور رتبه بندي ميکني؟

دوست Free.ai رو به دوستانت بگو