مولد ویدئو هوش مصنوعی ویرایشگر ویدئوی هوش مصنوعی بهبوددهنده ویدئو هوش مصنوعی استودیوی دوبله ویدئویی هوش مصنوعی جستجوی تابع (تابع جستجوی تابع) 2. مترجم ویدئویی هوش مصنوعی جلوه‌های ویدئو هوش مصنوعی — Pikaffects- style ارتقا دهنده ویدئو هوش مصنوعی بیشتر →

هوش مصنوعی

Q: واقعا مجانيه؟

بله — SadTalker روی GPUهای خود میزبانی شده ما اجرا میشود، در استخر توکن روزانه رایگان است. هر کلیپ حدود ۶۰۰۰ توکن پایه + ۸۰۰ توکن در ثانیه صدا هزینه دارد. بنابراین یک کلیپ ۱۰ ثانیه ای حدود ۱۴۰۰۰ توکن است. ناشناس ۲۵۰۰/روز دریافت میکند، ثبت نام شده ۱۰۰۰۰/روز دریافت میکند.

Q: «مصاحبه با ناصر حجازی: کدام یک را انتخاب کنم؟».

SadTalker (به صورت پیشفرض) رایگان است و یک سر طبیعی صحبتکننده با حرکت ظریف سر + چشمک زدن تولید میکند. Lipsync Premium دارای شکلهای دهان تیزتر است (به ویژه برای plosives و bilabials مانند «p»، «b»، «m») و در صداهای طولانی ۲-۳ برابر سریعتر نمایش میدهد. برای توضیح دهندههای رسانههای اجتماعی و آواتارها، SadTalker عالی است. برای دوبلاژ با صدای با کیفیت بالا و محتوای حساس به lip-sync ، به Premium تغییر دهید.

Q: چه نوع صدايي کار ميکنه؟

WAV یا MP3 از گفتار واضح. SadTalker کلیپهای ۱ تا ۳۰ ثانیهای را به صورت قابل اعتماد مدیریت میکند، از کلیپهای طولانیتر پشتیبانی میشود اما کندتر است. برای بهترین همگامسازی لب، از یک بلندگو، نویز پسزمینه کم و گفتار واضح استفاده کنید. اگر میخواهید سر سخنگو را اسکریپت کنید، ابتدا صدا را از طریق /tts/ تولید کنید.

Q: این روش با روشهای D-ID/HeyGen/Synthesia چگونه است؟

D-ID برای ۵ دقیقه ویدئو ۵٫۹۹ دلار در ماه دریافت میکند. HeyGen ۲۴ دلار در ماه است. Synthesia ۳۰ دلار در ماه است. ما SadTalker را در مجموعه روزانه رایگان به شما میدهیم – کیفیتی قابل مقایسه برای ویدئوی توضیح دهنده/آواتار.

Q: پس زمینه و لباس چطور؟ آیا بقیه عکس حرکت میکند؟

SadTalker ناحیه صورت را پویانمایی میکند (دهان ، چشم ها ، تکان دادن سر ، پلک زدن). شانهها ، لباس ها و پس زمینه تقریباً ثابت باقی میمانند. برای سر صحبت کننده تمام بدن با حرکت بدن ، از مدل lipsync Premium با برش گسترده استفاده کنید.

استفاده تجاری ص ۳۸۰. بدون نشان آبی نیازی به ثبت نام نیست

Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

تصویر چهره

PNG/JPG — چهره رو به جلو، صورت صاف

صدا) گزینه‌ای (

MP3/WAV — یا خالی بگذارید + از TTS زیر استفاده کنید

یا دست‌نوشتۀ را تایپ کنید) از Kokoro TTS استفاده می‌کند (

اگر صدا را در بالا فراهم کنید ، این متن نادیده گرفته می‌شود. حداکثر ۱۰۰۰ کاراکتر.

Model

~6000 توکن برای هر کلیپ (مجاناً)؛ با طول بالا

پویانمایی هر عکس پرتره برای صحبت کردن. SadTalker رایگان (خود میزبانی) یا lipsync premium — تصویر صورت + صدا را رها کنید ، یک ویدئو با لب همگام‌سازی شده را دریافت کنید. ایده‌آل برای توضیح، آواتار ، صدای ویدئو.

چطور استفاده کنم هوش مصنوعی

وارد کردن ورودی

متن را تایپ کنید ، یک پرونده را بارگذاری کنید ، یا آنچه را که می‌خواهید توصیف کنید. حساب نیازی نیست.

ایجاد را بزنید

هوش مصنوعی ما درخواست شما را در چند ثانیه با استفاده از بهترین مدل‌های منبع باز پردازش می‌کند.

بارگیری و اشتراک

دانلود، کپی یا اشتراک‌گذاری نتایج خود. برای استفاده شخصی و تجاری رایگان است.

استفاده از این ابزار از طریق API

این ابزار را از کد خودتان خودکار کنید. نقطه پایانی REST سازگار با OpenAI، گواهی‌نامه حامل گواهی‌نامه، نیازی به SDK اضافی نیست. هزینه گواهی‌نامه با رابط وب مطابقت دارد.

مستندات API دریافت کلید API

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

ابزارهای هوش مصنوعی آزاد مرتبط

مولد ویدئو هوش مصنوعی

ویرایشگر ویدئوی هوش مصنوعی

بهبوددهنده ویدئو هوش مصنوعی

استودیوی دوبله ویدئویی هوش مصنوعی

جستجوی تابع (تابع جستجوی تابع) 2.

مترجم ویدئویی هوش مصنوعی

جلوه‌های ویدئو هوش مصنوعی — Pikaffects- style

ارتقا دهنده ویدئو هوش مصنوعی

هوش مصنوعی — FAQ

یک عکس پرتره + یک کلیپ صوتی (یا پرونده گفتار) را بارگذاری کنید ، هوش مصنوعی چهره را پویانمایی می‌کند تا صدا را با لب همگام سازی کند. خروجی یک ویدئو MP4 از عکس است که صدا را با حرکات دهان واقعی ، تکان دادن سر و پلک زدن "گفتگو" می‌کند. دو مدل: SadTalker رایگان (خود میزبانی شده ، MIT) یا lipsync Premium (دهان تیزتر ، سریع تر).

بله — SadTalker روی GPUهای خود میزبانی شده ما اجرا می‌شود، در استخر توکن روزانه رایگان است. هر کلیپ حدود ۶۰۰۰ توکن پایه + ۸۰۰ توکن در ثانیه صدا هزینه دارد. بنابراین یک کلیپ ۱۰ ثانیه ای حدود ۱۴۰۰۰ توکن است. ناشناس ۲۵۰۰/روز دریافت می‌کند، ثبت نام شده ۱۰۰۰۰/روز دریافت می‌کند.

SadTalker (به صورت پیش‌فرض) رایگان است و یک سر طبیعی صحبت‌کننده با حرکت ظریف سر + چشمک زدن تولید می‌کند. Lipsync Premium دارای شکل‌های دهان تیزتر است (به ویژه برای plosives و bilabials مانند «p»، «b»، «m») و در صداهای طولانی ۲-۳ برابر سریع‌تر نمایش می‌دهد. برای توضیح دهنده‌های رسانه‌های اجتماعی و آواتارها، SadTalker عالی است. برای دوبلاژ با صدای با کیفیت بالا و محتوای حساس به lip-sync ، به Premium تغییر دهید.

پرتره رو به جلو، صورت روشن، نوردهی هموار، حالت خنثی. صورت باید حداقل ۳۰٪ قاب را پر کند. از عینک‌های سنگین (که ردیابی چشم را مختل می‌کنند)، عکس‌های پروفایل (که مدل نیاز به دیدن هر دو چشم دارد) و حالت‌های شدید اجتناب کنید. عکس‌های استودیویی از سر و سلفی‌های خوب کار می‌کنند.

WAV یا MP3 از گفتار واضح. SadTalker کلیپ‌های ۱ تا ۳۰ ثانیه‌ای را به صورت قابل اعتماد مدیریت می‌کند، از کلیپ‌های طولانی‌تر پشتیبانی می‌شود اما کندتر است. برای بهترین همگام‌سازی لب، از یک بلندگو، نویز پس‌زمینه کم و گفتار واضح استفاده کنید. اگر می‌خواهید سر سخنگو را اسکریپت کنید، ابتدا صدا را از طریق /tts/ تولید کنید.

SadTalker حدود ۱۰ ثانیه از زمان GPU را در هر ثانیه صدا مصرف می‌کند. بنابراین یک سر صحبت ۱۰ ثانیه ای ~۱۰۰ ثانیه طول می‌کشد. Lipsync Premium سریعتر است (~۳-۵ ثانیه در هر ثانیه صدا) اما هزینه بیشتری دارد. هر دو روی A100s ما اجرا می‌شوند — شما می‌توانید تب را ببندید و نتیجه در دایرکتوری شما قرار می‌گیرد.

D-ID برای ۵ دقیقه ویدئو ۵٫۹۹ دلار در ماه دریافت می‌کند. HeyGen ۲۴ دلار در ماه است. Synthesia ۳۰ دلار در ماه است. ما SadTalker را در مجموعه روزانه رایگان به شما می‌دهیم – کیفیتی قابل مقایسه برای ویدئوی توضیح دهنده/آواتار.

بله — یک چهره از طریق /image/avatar/ یا /image/generate/ ایجاد کنید، سپس آن را به اینجا وارد کنید. مدل هر پرتره رو به جلو را به همان روش برخورد می‌کند. زنجیره مشترک: prompt → SDXL portrait → SadTalker animates → /tts/ for the voice → done.

SadTalker ناحیه صورت را پویانمایی می‌کند (دهان ، چشم ها ، تکان دادن سر ، پلک زدن). شانه‌ها ، لباس ها و پس زمینه تقریباً ثابت باقی می‌مانند. برای سر صحبت کننده تمام بدن با حرکت بدن ، از مدل lipsync Premium با برش گسترده استفاده کنید.

بله — POST به /v1/video/talking-head/ با چند قسمتی `image` + `audio`. یا از /scheduled/ برای صف کردن چندین اجرا استفاده کنید. /batch/ همچنین CSV از URL تصویر + URL صدا را قبول می‌کند.

بله — POST چندبخشی `image` + `audio` به /v1/video/talking-head/ در api.free.ai. حامل امضا. با `video_url` + `share_token` JSON را برمی‌گرداند. ۱۰۰۰۰ توکن/ماه رایگان.

عکس‌ها و صداها در ۲۴ ساعت پس از تولید حذف می‌شوند. خروجی ویدئوها برای ۲۴ ساعت (۷ روز برای کاربران پرداختی) در شبکه CDN ما باقی می‌مانند تا بتوانید دوباره از /account/?tab=history دانلود کنید. هیچ‌گاه برای آموزش استفاده نمی‌شود. سیاست حریم خصوصی کامل در /privacy/.

براي 30000 تا توکن مجاني ثبت نام کن

ایجاد حساب

کارت اعتباري لازم نيست

اين ابزار رو چطور رتبه بندي ميکني؟

هوش مصنوعی

نتیجه

چطور استفاده کنم هوش مصنوعی

وارد کردن ورودی

ایجاد را بزنید

بارگیری و اشتراک

استفاده از این ابزار از طریق API

ابزارهای هوش مصنوعی آزاد مرتبط

هوش مصنوعی — FAQ

Free.ai هوش مصنوعی Talking Head Generator چيه؟

واقعا مجانيه؟

«مصاحبه با ناصر حجازی: کدام یک را انتخاب کنم؟».

چه عکسي بهتره؟

چه نوع صدايي کار ميکنه؟

چقدر طول ميکشه تا هر کليپ توليد بشه؟

این روش با روش‌های D-ID/HeyGen/Synthesia چگونه است؟

ميتونم از يه چهره توليد شده استفاده کنم؟

پس زمینه و لباس چطور؟ آیا بقیه عکس حرکت می‌کند؟

میتونم تعداد زیادی ویدیو تولید کنم؟

آیا API رایگان است؟

آیا بارگذاری‌های من ذخیره می‌شوند یا برای آموزش استفاده می‌شوند؟

10000 توکن رایگان دریافت کنید

صبر کن - 10K توکن رایگان دریافت کن!

بيشتر ميخواي؟