مولد ویدئو هوش مصنوعی ویرایشگر ویدئوی هوش مصنوعی بهبوددهنده ویدئو هوش مصنوعی استودیوی دوبله ویدئویی هوش مصنوعی جستجوی تابع (تابع جستجوی تابع) 2. مترجم ویدئویی هوش مصنوعی جلوه‌های ویدئو هوش مصنوعی — Pikaffects- style ارتقا دهنده ویدئو هوش مصنوعی بیشتر →

همگام‌سازی لب‌های هوش مصنوعی

Q: «آی سی سی چیست؟».

یک ویدئو از یک سر صحبتکننده را همراه با یک آهنگ صوتی بارگذاری کنید (یا یک اسکریپت برای TTS تایپ کنید) و هوش مصنوعی فریم به فریم دهان را برای مطابقت صوتی با صدای جدید بازسازی میکند. ایدهآل برای ADR، جایگزینی صدای فوق، کاهش صدا یا دادن صدا به یک پرتره ساکت.

Q: چطور کار ميکنه؟

همگامسازی Lipsync v2 یک مدل رندر دهان پیشرفته است. هر صدایی در صدا را تجزیه و تحلیل میکند، صورت را در هر فریم شناسایی میکند و ناحیه لب را برای تطابق دوباره ایجاد میکند. بقیه صورت، پسزمینه و بدن دست نخورده باقی میمانند.

Q: مجانيه؟

همگامسازی لب از نشانههای پرداختی استفاده میکند (حداقل ~۱۰۰۰۰، با طول مدت مقیاس میشود). نشانههای اضافه ثبت نام میتوانند پس از ورود به سیستم استفاده شوند.

Q: چه فرمتهای ویدئویی پذیرفته میشوند؟

MP4, MOV, WebM تا ۱۰۰ مگابایت. کلیپهای کمتر از ۳۰ ثانیه سریعترین کار را انجام میدهند. یک بلندگو با جهت جلویی، همگامسازی لبهای تمیز را فراهم میکند؛ بلندگوهای چندگانه یا چرخش سریع سر کیفیت را کاهش میدهد.

Q: اگه ويدئو و صوتي طول متفاوتي داشته باشن چي؟

هنگامی که طول مدتها بیش از ۰٫۵ ثانیه تفاوت دارند ، به شما هشدار میدهیم. کلید «خودکار کوتاه کردن به کوتاهتر» (به صورت پیشفرض فعال) طولانیترین از دو را میبسته؛ در غیر این صورت ، خروجی فقط پنجرهی همپوشانی را پوشش میدهد.

Q: چقدر طول ميکشه؟

معمولاً: کلیپ ۳۰ ثانیهای در ۱–۲ دقیقه نمایش داده میشود. بنر یک تخمین انتظار را نشان میدهد که زمانی که ارسال میکنید، و نتیجه در دایرکتوری شما قرار میگیرد - شما میتوانید تب را ببندید.

Q: مي تونم چند تا بلندگو داشته باشم؟

نه در یک بار — مدل روی یک صورت قفل میشود. برای صحنههای چند بلندگو، به کلیپهای تک بلندگو برش دهید، هر کدام را با لب هماهنگ کنید، سپس در یک ویرایشگر ویدئو دوباره به هم بچسبانید.

استفاده تجاری ص ۳۸۰. بدون نشان آبی نیازی به ثبت نام نیست

یک ویدئو از سر صحبت‌کننده و یا یک آهنگ صوتی یا یک اسکریپت را بارگذاری کنید — ما فریم به فریم دهان را برای مطابقت با صدای جدید دوباره ترسیم می‌کنیم. با Sync Lipsync v2 پشتیبانی می‌شود. ایده‌آل برای کاهش، ADR، جایگزینی صدای اضافی، یا ساختن یک کلیپ صامت صحبت.

1. ویدئو — صورت/ دهان برای بازسازی

ویدئو را به اینجا بکشید یا کلیک کنید

MP4 / MOV / WebM · حداکثر ۱۰۰ مگابایت

2- صدا یا متن — دهان را به حرکت درمی ‌ آورد.

پروندۀ صوتی را به اینجا بکشید یا کلیک کنید

MP3 / WAV / M4A · حداکثر ۵۰ مگابایت

یک ویدئو + صدا را بارگذاری کنید (یا یک اسکریپت را تایپ کنید) تا هزینه دقیق را ببینید.

جایی که هوش مصنوعی لب هماهنگ کردنش را بدست می آورد

ADR / redub

يه خط رو تو کابين دوباره ضبط کن، بندازش تو، دهن دوباره بهم ميخوره ديگه براي تلفظ اشتباه کلمه بازي نميکنيم

جابجایی صدا

با هر بازیگری فیلمبرداری کنید، با صدای مورد علاقه خود (یا صدای TTS) - لب‌ها دنبال می‌کنند، نه رهبری می‌کنند.

آواتارهای حرفه‌ای

به یک پرتره ساکت یا شخصیتی که توسط هوش مصنوعی ایجاد شده است صدا بدهید. با /image-to-video/ زنجیره کنید تا ابتدا یک پرتره ثابت را پویانمایی کنید، سپس آن را به صحبت وادار کنید.

چگونه هوش مصنوعی لب هماهنگ کار می کند

گام ۱

بارگذاری ویدئو

چهره روشن رو به جلو بهترین کار را می‌کند. چند بلندگو، نمای پروفایل، یا چرخش سریع سر کیفیت را کاهش می‌دهد.

گام دوم

فراهم کردن صدا

MP3 / WAV / M4A را آپلود کنید یا یک اسکریپت را تایپ کنید و ما آن را با Kokoro (۱۷۴ صدا در ۳۷ زبان) ترجمه می‌کنیم.

گام ۳

بررسی طول

اگر ویدئو و صدا بیش از ۰٫۵ ثانیه تفاوت داشته باشند، هشدار می‌دهیم.

گام چهارم

نمایش

Sync Lipsync v2 هر فریم دهان را برای مطابقت با صدای جدید دوباره نمایش می‌دهد.

نکات برای بهترین خروجی همگام‌سازی لب

يه بلندگوي جلويي. شليک هاي چند بلندگويي شناسايي چهره رو گيج ميکنه
چهره خوب روشن شده سايه هاي سنگين روي نصف صورت باعث ميشه که رديابي دهان مشکل باشه
صدا در ۶ dB- تا ۳ dB- اوج. همگام‌سازی صدای بریده یا آهسته بدتر است.
برای ویدئوهای ۱۰ دقیقه و بیشتر، به صحنه‌ها تقسیم کنید.

ویدئوهای همگام‌سازی لب را با هوش مصنوعی ایجاد کنید. صدا را با هر چهره ای تطبیق دهید.

چطور استفاده کنم همگام‌سازی لب‌های هوش مصنوعی

وارد کردن ورودی

متن را تایپ کنید ، یک پرونده را بارگذاری کنید ، یا آنچه را که می‌خواهید توصیف کنید. حساب نیازی نیست.

ایجاد را بزنید

هوش مصنوعی ما درخواست شما را در چند ثانیه با استفاده از بهترین مدل‌های منبع باز پردازش می‌کند.

بارگیری و اشتراک

دانلود، کپی یا اشتراک‌گذاری نتایج خود. برای استفاده شخصی و تجاری رایگان است.

استفاده از این ابزار از طریق API

این ابزار را از کد خودتان خودکار کنید. نقطه پایانی REST سازگار با OpenAI، گواهی‌نامه حامل گواهی‌نامه، نیازی به SDK اضافی نیست. هزینه گواهی‌نامه با رابط وب مطابقت دارد.

مستندات API دریافت کلید API

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

ابزارهای هوش مصنوعی آزاد مرتبط

مولد ویدئو هوش مصنوعی

ویرایشگر ویدئوی هوش مصنوعی

بهبوددهنده ویدئو هوش مصنوعی

استودیوی دوبله ویدئویی هوش مصنوعی

جستجوی تابع (تابع جستجوی تابع) 2.

مترجم ویدئویی هوش مصنوعی

جلوه‌های ویدئو هوش مصنوعی — Pikaffects- style

ارتقا دهنده ویدئو هوش مصنوعی

همگام‌سازی لب‌های هوش مصنوعی — FAQ

یک ویدئو از یک سر صحبت‌کننده را همراه با یک آهنگ صوتی بارگذاری کنید (یا یک اسکریپت برای TTS تایپ کنید) و هوش مصنوعی فریم به فریم دهان را برای مطابقت صوتی با صدای جدید بازسازی می‌کند. ایده‌آل برای ADR، جایگزینی صدای فوق، کاهش صدا یا دادن صدا به یک پرتره ساکت.

همگام‌سازی Lipsync v2 یک مدل رندر دهان پیشرفته است. هر صدایی در صدا را تجزیه و تحلیل می‌کند، صورت را در هر فریم شناسایی می‌کند و ناحیه لب را برای تطابق دوباره ایجاد می‌کند. بقیه صورت، پس‌زمینه و بدن دست نخورده باقی می‌مانند.

همگام‌سازی لب از نشانه‌های پرداختی استفاده می‌کند (حداقل ~۱۰۰۰۰، با طول مدت مقیاس می‌شود). نشانه‌های اضافه ثبت نام می‌توانند پس از ورود به سیستم استفاده شوند.

MP4, MOV, WebM تا ۱۰۰ مگابایت. کلیپ‌های کمتر از ۳۰ ثانیه سریع‌ترین کار را انجام می‌دهند. یک بلندگو با جهت جلویی، همگام‌سازی لب‌های تمیز را فراهم می‌کند؛ بلندگوهای چندگانه یا چرخش سریع سر کیفیت را کاهش می‌دهد.

MP3, WAV, M4A تا ۵۰ مگابایت. به جای آن، یک اسکریپت تایپ کنید و از ۱۷۴ صدای کوکورو در ۳۷ زبان انتخاب کنید — ما آن را به TTS تبدیل می‌کنیم و از آن به عنوان صدای رانندگی استفاده می‌کنیم.

هنگامی که طول مدت‌ها بیش از ۰٫۵ ثانیه تفاوت دارند ، به شما هشدار می‌دهیم. کلید «خودکار کوتاه کردن به کوتاه‌تر» (به صورت پیش‌فرض فعال) طولانی‌ترین از دو را می‌بسته؛ در غیر این صورت ، خروجی فقط پنجره‌ی همپوشانی را پوشش می‌دهد.

بهترین نتایج: یک چهره روشن رو به جلو، روشنایی خوب، بیشتر دوربین ثابت. نتایج ضعیف: نمای پروفایل، چهره بسته (عینک آفتابی، ماسک)، چند چهره رقابتی، نزدیک‌نمایی شدید با دهان جزئی در قاب.

دوبله (/video/dubbing/) یک خط لوله کامل است: STT → ترجمه → TTS → همگام‌سازی لب. همگام‌سازی لب تنها آخرین گام است — شما خودتان صدا را فراهم می‌کنید. از همگام‌سازی لب هنگامی استفاده کنید که از قبل آهنگ صداگذاری آماده داشته باشید؛ از دوبله هنگامی استفاده کنید که می‌خواهید از ابتدا ترجمه و صداگذاری مجدد انجام دهید.

معمولاً: کلیپ ۳۰ ثانیه‌ای در ۱–۲ دقیقه نمایش داده می‌شود. بنر یک تخمین انتظار را نشان می‌دهد که زمانی که ارسال می‌کنید، و نتیجه در دایرکتوری شما قرار می‌گیرد - شما می‌توانید تب را ببندید.

نه در یک بار — مدل روی یک صورت قفل می‌شود. برای صحنه‌های چند بلندگو، به کلیپ‌های تک بلندگو برش دهید، هر کدام را با لب هماهنگ کنید، سپس در یک ویرایشگر ویدئو دوباره به هم بچسبانید.

نه. پرونده‌های ورودی در عرض چند دقیقه از رندر حذف می‌شوند. خروجی در شبکهٔ پخش محتوای ما برای ۲۴ ساعت (۷ روز برای کاربران پرداختی) در پیوند اشتراک نگه داشته می‌شود.

بله — یک فایل چندبخشی ویدئو + صوتی (یا ویدئو + متن + صدا) را به /v1/video/lip-sync/ ارسال کنید.

براي 10000 تا توکن مجاني ثبت نام کن

ایجاد حساب

کارت اعتباري لازم نيست

اين ابزار رو چطور رتبه بندي ميکني؟

همگام‌سازی لب‌های هوش مصنوعی

جایی که هوش مصنوعی لب هماهنگ کردنش را بدست می آورد

ADR / redub

جابجایی صدا

آواتارهای حرفه‌ای

چگونه هوش مصنوعی لب هماهنگ کار می کند

بارگذاری ویدئو

فراهم کردن صدا

بررسی طول

نمایش

نکات برای بهترین خروجی همگام‌سازی لب

نتیجه

چطور استفاده کنم همگام‌سازی لب‌های هوش مصنوعی

وارد کردن ورودی

ایجاد را بزنید

بارگیری و اشتراک

استفاده از این ابزار از طریق API

ابزارهای هوش مصنوعی آزاد مرتبط

همگام‌سازی لب‌های هوش مصنوعی — FAQ

«آی سی سی چیست؟».

چطور کار ميکنه؟

مجانيه؟

چه فرمت‌های ویدئویی پذیرفته می‌شوند؟

چه نوع فرمت‌های صوتی کار می‌کنند؟

اگه ويدئو و صوتي طول متفاوتي داشته باشن چي؟

اين روش براي هر صورتي جواب ميده؟

اين با دوبله چقدر فرق داره؟

چقدر طول ميکشه؟

مي تونم چند تا بلندگو داشته باشم؟

بارگذاری من ذخیره شده است؟

یک API وجود دارد؟

10000 توکن رایگان دریافت کنید

صبر کن - 10K توکن رایگان دریافت کن!

بيشتر ميخواي؟