رأس متحدث

الاستخدام التجاري 380+ طراز لا يوجد علامة مائية لا حاجة للتسجيل
النموذج:
+ GPT-5, Claude, Gemini
Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

PNG/JPG - وجه الصورة أمامها، وجه واضح

MP3/WAV - أو اتركه فارغا + استخدم TTS أدناه

إذا قدمت صوتاً أعلاه، يتم تجاهل هذا النص.
~ 000 6 رمز لكل مقطع (مجاناً)؛ وتتراوح أسعار الرسوم حسب الطول
تنزيل
الخيارات المتقدمة
النتيجة
تريد نتائج أفضل؟ نماذج عالية الجودة (GPT-5, Claude, Gemini) توفر جودة أعلى. عرض الخطط

❤️ Love this tool? Share it!

انضم للحصول على رابط إحالتك وكسب 25,000 رمز لكل صديق.

تريد المزيد؟ انضم مجانا ل 30K الرموز/يوم + 10K مكافأة
انضم مجانا

... معالجة طلبك

حرك أي صورة شخصية لتتحدث. SadTalker المجاني (المستضاف ذاتياً) أو Lipsync الأعلى جودة - أسقط صورة وجه + صوت، واحصل على فيديو رأس متحدث متزامن مع الشفاه. مثالي للمشرح، الصورة، الصوت فوق الفيديو.

كيف تستخدم رأس متحدث

1
أدخل مدخلك

أدخل نص، أو تحميل ملف، أو وصف ما تريد. لا حساب مطلوب.

2
انقر على إنشاء

الذكاء الاصطناعي لدينا يعالج طلبك في ثوان باستخدام أفضل نماذج المصدر المفتوح.

3
تنزيل وتقاسم

تحميل، نسخ، أو مشاركة نتائجك مجانا للاستخدام الشخصي والتجاري.

استخدام هذه الأداة عن طريق API

أتمتة هذه الأداة من شفرة الخاصة بك. OpenAI-متوافق REST نقطة نهاية، حامل-رمز التوثيق، لا يلزم إضافي SDK. تكاليف الرموز تطابق واجهة شبكة الويب.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

رأس متحدث — FAQ

تحميل صورة شخصية + مقطع صوت (أو ملف صوت)، الذكاء الاصطناعي يحيي الوجه لمزامنة الصوت مع الشفاه. الخرج هو فيديو MP4 للصورة "الناطقة" بالصوت مع حركات فم واقعية، اهتزاز الرأس، والرمشة. نموذجان: SadTalker المجاني (المستضاف ذاتيا، معهد ماساتشوستس للتكنولوجيا) أو Lipsync الأعلى (فم أكثر حدة، أسرع).

نعم — SadTalker يعمل على وحدات المعالجة المركزية الخاصة بنا، مجانا في مجمع الرموز اليومي. كل مقطع فيديو يكلف ~6000 رموز أساس + 800 رموز في الثانية من الصوت. لذلك، مقطع فيديو مدته 10 ثوان هو ~14000 رموز. مجهول الحصول على 2500/يوم، وتسجيل الدخول الحصول على 10000/يوم. مقياس الراتب من حيث الطول أيضا ولكن مع خروجية أكثر حدة.

SadTalker (الافتراضي) مجاني وينتج رأس متحدث طبيعي مع حركة رأس دقيقة + رمشة. Premium lipsync لديه أشكال فم أكثر حدة (خاصة بالنسبة للنطق بالحرف "p" و"b" و"m") ويعرض 2-3x أسرع على الصوت الطويل. بالنسبة لشرح وسائل التواصل الاجتماعي والصور، SadTalker عظيم. للدبلجة عالية الدقة والمحتوى الحرج من حيث تزامن الشفاه، انتقل إلى premium.

صورة شخصية أمامية، وجه واضح، إضاءة متساوية، تعبير محايد. يجب أن يملأ الوجه 30% على الأقل من الإطار. تجنب النظارات الشمسية الثقيلة (هي تخل بتتبع العين)، والصور الشخصية (النموذج يحتاج إلى رؤية العينين)، والتعابير المتطرفة. صور الرأس في الاستوديو والسيلفي الجيدة تعمل بشكل رائع.

WAV أو MP3 للكلام الواضح. SadTalker يتعامل مع 1-30 ثانية مقاطع بصورة موثوقة، أطول مدعوم ولكن أبطأ. لأفضل شفط الشفتين، استخدم متحدث واحد، ضجيج خلفية منخفض، وحديث واضح. توليد الصوت أولاً عن طريق / tts / إذا كنت تريد أن تكتب الرأس المتكلم.

SadTalker يستغرق حوالي 10 ثوان من وقت المعالج الرسومى لكل ثانية من الصوت. لذا فإن رأس حديث لمدة 10 ثوان يستغرق ~100 ثانية. Premium lipssync أسرع (~3-5 ثوان لكل ثانية من الصوت) ولكنه أكثر تكلفة. كلاهما يعمل على A100s - يمكنك إغلاق العلامة والناتج يهبط في لوحة التحكم.

يفرض D-ID 5.99 دولار/شهر لخمس دقائق من الفيديو. و HeyGen 24 دولار/شهر. و Synthesia 30 دولار/شهر. ونحن نقدم لك SadTalker مجاناً في المجموعة اليومية - جودة مماثلة لمقاطع الفيديو التفسيرية / الافتراضية. و Premium lipsync يطابق جودة D-ID Studio. والخيار المجاني جيد بما فيه الكفاية لأغلب حالات الاستخدام القصير لتيك توك / يوتيوب.

نعم — إنشاء وجه من خلال /image/avatar/ أو /image/generate/، ثم تغذيته هنا. النموذج يتعامل مع أي صورة وجه بنفس الطريقة. السلسلة المشتركة: prompt → SDXL portrait → SadTalker animates → /tts/ for the voice → done.

SadTalker يحرك منطقة الوجه (الفم، العينين، حركة الرأس، الرموش). الكتفين، الملابس، والخلفية تظل ثابتة تقريبا. لرأس الكلام كامل الجسم مع حركة الجسم، استخدم نموذج Lipsync الأعلى جودة مع زراعة أوسع.

نعم — POST إلى /v1/video/talking-head/ مع `image` + `audio` متعددة الأجزاء. أو استخدم /scheduled/ لوضع العديد من التشغيلات في صف. /batch/ يقبل أيضاً CSV من زوج من URL للصورة + URL للصوت.

نعم — POST multipart `image` + `audio` to /v1/video/talking-head/ on api.free.ai. bearer auth. returns JSON with `video_url` + `share_token`. 10,000 tokens/month free. premium scales linearly with audio duration. /api/ has the curl example.

ويتم حذف الصور والتسجيلات الصوتية في غضون 24 ساعة من توليدها. وتبقى مقاطع الفيديو المخرجة على شبكة توزيع المحتوى لمدة 24 ساعة (7 أيام للمستخدمين المدفوعين) بحيث يمكنك إعادة تنزيلها من /account/?tab=history.

تسجيل مجاني ل 30000 رموز

إنشاء حساب مجاني

لا تلزم بطاقة ائتمان

كيف تقيِّم هذه الأداة؟

Love this tool? Share it!