هوش مصنوعی

استفاده تجاری ص ۳۸۰. بدون نشان آبی نیازی به ثبت نام نیست
مدل:
+ GPT-5, Claude, Gemini
Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

PNG/JPG — چهره رو به جلو، صورت صاف

MP3/WAV — یا خالی بگذارید + از TTS زیر استفاده کنید

اگر صدا را در بالا فراهم کنید ، این متن نادیده گرفته می‌شود. حداکثر ۱۰۰۰ کاراکتر.
~6000 توکن برای هر کلیپ (مجاناً)؛ با طول بالا
بارگیری
گزینه‌های پیشرفته
نتیجه
. رمزها کم ميشه گرفتن نشانه‌های بیشتر
نتيجه بهتري ميخواي؟ مدلهای پریمیوم (GPT-5, Claude, Gemini) کیفیت بالاتری را ارائه می‌دهند. نمایش نقشه

❤️ دوست Free.ai رو به دوستانت بگو

ثبت نام کنید تا لینک پیشنهادی دریافت کنید و 30 توکن برای هر دوست بدست آورید.

بيشتر ميخواي؟ ثبت نام مجاني براي 30K توکن/روز + 10K بونوس
ثبت نام

در حال پردازش درخواست شما...

پویانمایی هر عکس پرتره برای صحبت کردن. SadTalker رایگان (خود میزبانی) یا lipsync premium — تصویر صورت + صدا را رها کنید ، یک ویدئو با لب همگام‌سازی شده را دریافت کنید. ایده‌آل برای توضیح، آواتار ، صدای ویدئو.

چطور استفاده کنم هوش مصنوعی

1
وارد کردن ورودی

متن را تایپ کنید ، یک پرونده را بارگذاری کنید ، یا آنچه را که می‌خواهید توصیف کنید. حساب نیازی نیست.

2
ایجاد را بزنید

هوش مصنوعی ما درخواست شما را در چند ثانیه با استفاده از بهترین مدل‌های منبع باز پردازش می‌کند.

3
بارگیری و اشتراک

دانلود، کپی یا اشتراک‌گذاری نتایج خود. برای استفاده شخصی و تجاری رایگان است.

استفاده از این ابزار از طریق API

این ابزار را از کد خودتان خودکار کنید. نقطه پایانی REST سازگار با OpenAI، گواهی‌نامه حامل گواهی‌نامه، نیازی به SDK اضافی نیست. هزینه گواهی‌نامه با رابط وب مطابقت دارد.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

هوش مصنوعی — FAQ

یک عکس پرتره + یک کلیپ صوتی (یا پرونده گفتار) را بارگذاری کنید ، هوش مصنوعی چهره را پویانمایی می‌کند تا صدا را با لب همگام سازی کند. خروجی یک ویدئو MP4 از عکس است که صدا را با حرکات دهان واقعی ، تکان دادن سر و پلک زدن "گفتگو" می‌کند. دو مدل: SadTalker رایگان (خود میزبانی شده ، MIT) یا lipsync Premium (دهان تیزتر ، سریع تر).

بله — SadTalker روی GPUهای خود میزبانی شده ما اجرا می‌شود، در استخر توکن روزانه رایگان است. هر کلیپ حدود ۶۰۰۰ توکن پایه + ۸۰۰ توکن در ثانیه صدا هزینه دارد. بنابراین یک کلیپ ۱۰ ثانیه ای حدود ۱۴۰۰۰ توکن است. ناشناس ۲۵۰۰/روز دریافت می‌کند، ثبت نام شده ۱۰۰۰۰/روز دریافت می‌کند.

SadTalker (به صورت پیش‌فرض) رایگان است و یک سر طبیعی صحبت‌کننده با حرکت ظریف سر + چشمک زدن تولید می‌کند. Lipsync Premium دارای شکل‌های دهان تیزتر است (به ویژه برای plosives و bilabials مانند «p»، «b»، «m») و در صداهای طولانی ۲-۳ برابر سریع‌تر نمایش می‌دهد. برای توضیح دهنده‌های رسانه‌های اجتماعی و آواتارها، SadTalker عالی است. برای دوبلاژ با صدای با کیفیت بالا و محتوای حساس به lip-sync ، به Premium تغییر دهید.

پرتره رو به جلو، صورت روشن، نوردهی هموار، حالت خنثی. صورت باید حداقل ۳۰٪ قاب را پر کند. از عینک‌های سنگین (که ردیابی چشم را مختل می‌کنند)، عکس‌های پروفایل (که مدل نیاز به دیدن هر دو چشم دارد) و حالت‌های شدید اجتناب کنید. عکس‌های استودیویی از سر و سلفی‌های خوب کار می‌کنند.

WAV یا MP3 از گفتار واضح. SadTalker کلیپ‌های ۱ تا ۳۰ ثانیه‌ای را به صورت قابل اعتماد مدیریت می‌کند، از کلیپ‌های طولانی‌تر پشتیبانی می‌شود اما کندتر است. برای بهترین همگام‌سازی لب، از یک بلندگو، نویز پس‌زمینه کم و گفتار واضح استفاده کنید. اگر می‌خواهید سر سخنگو را اسکریپت کنید، ابتدا صدا را از طریق /tts/ تولید کنید.

SadTalker حدود ۱۰ ثانیه از زمان GPU را در هر ثانیه صدا مصرف می‌کند. بنابراین یک سر صحبت ۱۰ ثانیه ای ~۱۰۰ ثانیه طول می‌کشد. Lipsync Premium سریعتر است (~۳-۵ ثانیه در هر ثانیه صدا) اما هزینه بیشتری دارد. هر دو روی A100s ما اجرا می‌شوند — شما می‌توانید تب را ببندید و نتیجه در دایرکتوری شما قرار می‌گیرد.

D-ID برای ۵ دقیقه ویدئو ۵٫۹۹ دلار در ماه دریافت می‌کند. HeyGen ۲۴ دلار در ماه است. Synthesia ۳۰ دلار در ماه است. ما SadTalker را در مجموعه روزانه رایگان به شما می‌دهیم – کیفیتی قابل مقایسه برای ویدئوی توضیح دهنده/آواتار.

بله — یک چهره از طریق /image/avatar/ یا /image/generate/ ایجاد کنید، سپس آن را به اینجا وارد کنید. مدل هر پرتره رو به جلو را به همان روش برخورد می‌کند. زنجیره مشترک: prompt → SDXL portrait → SadTalker animates → /tts/ for the voice → done.

SadTalker ناحیه صورت را پویانمایی می‌کند (دهان ، چشم ها ، تکان دادن سر ، پلک زدن). شانه‌ها ، لباس ها و پس زمینه تقریباً ثابت باقی می‌مانند. برای سر صحبت کننده تمام بدن با حرکت بدن ، از مدل lipsync Premium با برش گسترده استفاده کنید.

بله — POST به /v1/video/talking-head/ با چند قسمتی `image` + `audio`. یا از /scheduled/ برای صف کردن چندین اجرا استفاده کنید. /batch/ همچنین CSV از URL تصویر + URL صدا را قبول می‌کند.

بله — POST چندبخشی `image` + `audio` به /v1/video/talking-head/ در api.free.ai. حامل امضا. با `video_url` + `share_token` JSON را برمی‌گرداند. ۱۰۰۰۰ توکن/ماه رایگان.

عکس‌ها و صداها در ۲۴ ساعت پس از تولید حذف می‌شوند. خروجی ویدئوها برای ۲۴ ساعت (۷ روز برای کاربران پرداختی) در شبکه CDN ما باقی می‌مانند تا بتوانید دوباره از /account/?tab=history دانلود کنید. هیچ‌گاه برای آموزش استفاده نمی‌شود. سیاست حریم خصوصی کامل در /privacy/.

براي 30000 تا توکن مجاني ثبت نام کن

ایجاد حساب

کارت اعتباري لازم نيست

اين ابزار رو چطور رتبه بندي ميکني؟

دوست Free.ai رو به دوستانت بگو