فيديو

الاستخدام التجاري 380+ طراز لا يوجد علامة مائية لا حاجة للتسجيل
النموذج:
+ GPT-5, Claude, Gemini
تحويل صورة شخصية ونص مطبوع إلى فيديو رأس متحدث. اختار صورة رمزية أو قم برفع صورة خاصة بك (بموافقة). يقوم خط الأنابيب بتشغيل TTS (174 صوتًا، 37 لغة) ويتم تزامن الشفتين مع الفم مع الصوت. الخرج هو MP4 نظيف في 9: 16 أو 16: 9.
جميع الصور الثماني المرخصة للاستخدام التجاري.اختر الصورة التي يناسب عمرها/جنسها/عرقها محتوىك على أفضل وجه.

اسحب صورة هنا أو انقر لتحميلها

صورة وجه أمامي، PNG/JPG/WebP، 10 ميغابايت كحد أقصى

حتى 2000 حرف لكل عرض - حوالي 2-3 دقائق من الكلام. النصوص الأطول → مقسمة إلى عدة مرات. 0 / 2000 · 0 words · 0s
أصوات من مكتبتنا التي تضم 174 صوتا، متصفح كامل على الموقع /voice/.

خط الأنابيب: Kokoro TTS → Sync Lipsync v2. يستغرق توليد 60-120 ثانية. المخرج هو MP4، لا علامة مائية. يمكنك إغلاق العلامة - المقطع يهبط في لوحة التحكم.

~ 000 10 رمز كحد أدنى (مقاييس بطول النص)
0%
جيل جديد
.. صورةك المتكلمه

مولد صور حديثة للذكاء الاصطناعي مجاني - لا رسوم شهرية، لا حد للدقائق، لا علامة مائية

تحويل صورة وكتابة مطبوعة إلى فيديو للشخص الذي يتحدث كلماتك. اختار من 8 صور مخزنة تغطي مجموعة متنوعة من الجنسين، والأعمار، والعرقيات، أو تحميل صورتك الخاصة (مع تأكيد الموافقة). ينتج خط الأنابيب TTS من خلال Kokoro متعدد اللغات وشفط الشفاه الفم باستخدام Sync Lipsync v2. 174 أصوات عبر 37 لغة متاحة. MP4 تنزيل نظيفة دون علامة مائية ومناسبة للمحتوى التجاري عندما تمتلك حقوق الصورة.

أشرطة الفيديو المتعلقة بالتدريب والتوجيه

إنشاء صورة متسقة للشركة التي تقدم كل وحدة تدريبية في نفس الصوت. تبادل النص لكل وحدة. تحديث جملة مرة واحدة وإعادة عرض في دقيقة - لا إعادة التصوير.

التسويق المتعدد اللغات

ترجمة نص واحد إلى 37 لغة وتمثيل نفس الشخص الذي يتحدث بكل لغة. أرخص كثيراً من استئجار ممثل صوت لكل لغة، ومتسق عبر الأسواق.

مقاطع يومية على وسائط التواصل الاجتماعي

المبدعون الذين لا يريدون التصوير يوميا يمكنهم كتابة أسبوع من قصص LinkedIn أو YouTube القصيرة مع صورة مستقرة - نفس الوجه، النص الجديد، صفر إضاءة أو ميكروفون مطلوب.

كيف تصنع فيديو شخصية ناطقة

اختار صورة رمزية أو قم بتحميل صورتك الخاصة

وهناك ثمانية من مقدمي الأسهم مرخص لهم مسبقا للاستخدام التجاري. وإذا قمت برفع صورتك الخاصة، ضع علامة في مربع الموافقة - هذا شرط قانوني واعتماد المنصة.

أدخل النص

يصل إلى 2000 حرف لكل عرض - حوالي 2-3 دقائق من الكلام. ينبغي تقسيم النصوص الأطول إلى صور منفصلة لتحديد وتيرة وإمكانية التنبؤ بتكلفة الرموز.

اختار الصوت واللغة والجانب

174 صوتا عبر 37 لغة. 9:16 هو الأفضل لـ ريلز / قصص قصيرة / تيك توك؛ 16:9 هو الأفضل لليوتيوب / لينكد إن / مقدمات الحلقات الدراسية على الإنترنت.

توليد وتحميل

120 ثانية. تنزيل MP4، تقاسم من خلال رابط واحد النقر، أو ترك العلامة - الفيديو يتم حفظه إلى لوحة حسابك عندما تكون جاهزاً.

كيف نقارن بين الصور المتكلمه

Free.ai أفاتار دال - يد هيجين ألف - التوليف
الاشتراك الشهري رموز الدفع أولا بأول من 5.90 دولار/شهر من 29 دولارا/شهريا من 22 دولارا في الشهر
الحد الأقصى للدقائق المدرجة في رسوم الفيديو ميزان ذي رموز 10 دقائق 15 دقيقة 10 دقائق
علامة مائية على المستوى المجاني لا نعم نعم لا توجد فئة مجانية
مصرف الأصوات 174 صوتا/37 صوتاً ~120 ~300 ~120
صورك الخاصة نعم نعم المستوى المدفوع فقط المؤسسات فقط
المقارنة تستند إلى التسعير العام لكل منصة وشروط المستويات اعتبارًا من عام 2026.
الخيارات المتقدمة
النتيجة
الرموز تنفد Get More Tokens
Want better results? نماذج عالية الجودة (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

انضم للحصول على رابط إحالتك وكسب 25,000 رمز لكل صديق.

تريد المزيد؟ Sign up free for 10,000 tokens
انضم مجانا

... معالجة طلبك

إنشاء فيديوهات شخصية ناطقة مع الذكاء الاصطناعي المجاني. مثالية للعروض ووسائط التواصل الاجتماعي.

كيف تستخدم فيديو

1
أدخل مدخلك

أدخل نص، أو تحميل ملف، أو وصف ما تريد. لا حساب مطلوب.

2
انقر على إنشاء

الذكاء الاصطناعي لدينا يعالج طلبك في ثوان باستخدام أفضل نماذج المصدر المفتوح.

3
تنزيل وتقاسم

تحميل، نسخ، أو مشاركة نتائجك مجانا للاستخدام الشخصي والتجاري.

استخدام هذه الأداة عن طريق API

أتمتة هذه الأداة من شفرة الخاصة بك. OpenAI-متوافق REST نقطة نهاية، حامل-رمز التوثيق، لا يلزم إضافي SDK. تكاليف الرموز تطابق واجهة شبكة الويب.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

فيديو — FAQ

تحويل صورة شخصية بالإضافة إلى نص مطبوع إلى فيديو رأس متحدث - يتحدث الرمز الكلمات مع حركة الفم المتزامنة مع الشفتين. مسارين: اختار من 8 رمز مخزون مرخص مسبقاً (نوع جنس / عمر / عرقية متنوعة) أو تحميل صورتك الخاصة مع تأكيد الموافقة الإلزامية. الصوت واللغة تأتي من بنك كوكورو لدينا 174 صوت. الشفتين تنسيق يجري على Sync Lipsync v2.

نعم داخل مجمع الرموز اليومي. تتراوح التكلفة مع طول النص ومدة العرض - حوالي 2500 رموز في الثانية من المخرج (TTS + lip-sync)، مع حد أدنى 10000 رموز. يكلف رأس متحدث لمدة 20 ثانية حوالي 50000 رموز. يغطى المجمع اليومي المجاني لقطات قصيرة؛ الخطط المدفوعة أو حزم الرموز تغطي فيديوهات شرح أطول.

لا — يمكنك اختيار من بين 8 صور صور (إلينا، ماركوس، عائشة، ديفيد، مي، راج، صوفيا، جيمس) التي تغطي مجموعة من الجنسين، الأعمار، والعرقيات. ونحن نملك تراخيص تجارية لكل منهم. إذا قمت برفع صورتك الخاصة بدلا من ذلك، يجب أن تضع علامة في مربع الموافقة للتأكد من أن لديك إذنا لتحريك صورة ذلك الشخص.

37 لغة عبر كوكورو TTS، بما في ذلك الإنجليزية (الولايات المتحدة / المملكة المتحدة)، الإسبانية، الفرنسية، الألمانية، الإيطالية، البرتغالية، الماندرين، اليابانية، الكورية، العربية، الهندية، الروسية، و 24 لغة أخرى. يقوم مختار الصوت بمزامنة حقل اللغة تلقائيًا عندما تختار صوتًا. تتكيف مزامنة الشفتين بشكل مقنع مع أي لغة.

9:16 الصورة الرأسية (الافتراضية - أفضل ل ريلز / تيك توك / قصص قصيرة / قصص إنستغرام) و 16:9 المناظر الطبيعية (أفضل لليوتيوب، لينكد إن، مقدمات الحلقات الدراسية على الإنترنت، التدريب المؤسسي). يجلس الصورة في الإطار المناسب لكل من - إطار الصورة الرأسية على 9:16، الصورة المتوسطة على 16:9.

يصل إلى 2000 حرف لكل عرض - حوالي 2-3 دقائق من الكلام المستمر بمعدل محادثة 150 حرف في الدقيقة. بالنسبة للإنتاجات الأطول (شرح لمدة 5 دقائق، وحدة دراسية لمدة 10 دقائق)، تقسيم النص إلى عدة مرات وجمعها معاً في أي محرر.

نحن نستخدم Sync Lipsync v2 — نفس المحرك الذي يقوم بتشغيل /video/dubbing/. إنه يتتبع شكل الفم لكل صوت وينتج تزامن مقنع لللغة الإنجليزية واللغات الأوروبية الرئيسية. تظل الدقة طبيعية على وتيرة المحادثة حتى بالنسبة للغات النغمية مثل الماندار وتايلاند، على الرغم من أن الكلام السريع / المؤكد هو أصعب الحالة.

نعم - إذا كنت تستخدم صورة افتراضية (جميع الصور الثماني مرخصة مسبقاً للاستخدام التجاري) أو إذا كان لديك حقوق في الصورة المرفوعة (وجهك الخاص، أو صورة افتراضية مرخصة، أو موافقة خطية صريحة). يجب ألا تتلاعب بشخص حقيقي دون إذن أو تمثل الصورة افتراضية على أنها شخصية عامة. تقتضي شروط المنصة الكشف عن المحتوى الذي يولده الذكاء الاصطناعي حيثما ينطبق ذلك (يوتيوب، تيك توك).

إذا قمت برفع صورة، يجب أن تؤكد أنك تملك موافقة الشخص المعني على إحياء شبههم بالصوت المنطوق. وهذا يفرضه الطرف الخلفي - API يرفض رفع الصور بدون `consent_given=1`. ترفض الصورة التي تظهر بوضوح المشاهير، الشخصيات السياسية، أو أطراف ثالثة غير موافقة. هذا شرط قانوني وسياسة الثقة والسلامة للمنصة.

174 صوتا عبر 37 لغة من خلال كوكورو. تظهر الأداة أكثر 14 صوتا شعبية في الخط؛ ويمكن التصفح في الكتالوج الكامل في /voice/tts/. انظر أي صوت هناك قبل العودة إلى عرض الصورة، حتى تشعر بأن الصوت والوجه يطابقان.

D-ID, HeyGen, and Synthesia charge $5.90-$29/month with 10-15 included minutes, then overrun rates. Free.ai لا يوجد لديه رسم شهري - تدفع لكل عرض من خلال نظامنا الرموز داخل حوض مجاني يومي. جودة المخرجات مماثلة (نفس فئة محركات TTS و lip-sync) والطبقة المجانية ليس لها علامة مائية.

نعم. أرسل JSON إلى /v1/video/avatar/ مع `script`, `voice`, `language`, `avatar` (stock id like "stock_1") OR `avatar_url` + `consent_given=1`, and `aspect_ratio`. تكلفة ما قبل الطيران: GET /v1/video/avatar-quote/?chars=500.

تسجيل مجاني ل 10000 رموز

إنشاء حساب مجاني

لا تلزم بطاقة ائتمان

كيف تقيِّم هذه الأداة؟

Love this tool? Share it!