مولد فيديو محرر فيديو محسن فيديو تسجيل أداء الذكاء الاصطناعي (الإجراء الثاني للمدارج) مترجم فيديو تأثيرات الفيديو - أسلوب Pikaffects تحسين فيديو الذكاء الاصطناعي مولد قصص قصيرة للذكاء الاصطناعي أكثر →

استوديو تسجيل فيديو

الاستخدام التجاري 380+ طراز لا يوجد علامة مائية لا حاجة للتسجيل

تحميل مقطع فيديو لرأس متحدث وجعله مترجما إلى لغة أخرى مع حركة الفم المتزامنة مع الشفاه. ويسجل Whisper، وترجم MadLAD، وتحدث كوكورو في 174 صوتا عبر 37 لغة، وSync Lipsync v2 يعيد عرض الفم. 99٪ من المقاطع تكتشف تلقائيا لغة المصدر.

سحبت فيديو هنا أو انقر لتحميل

MP4, MOV, WebM حتى 100 ميغابايت · الرأس المتكلم ذو المتحدث الواحد يعمل على أفضل وجه

اللغة المصدر (في الفيديو) يكتشف Whisper لغة المصدر على 99% من المقاطع. تخط فقط إذا كان الكشف التلقائي يخمن خطأ.

.. دخل

الصوت انقر على خيار "المسح" للاستماع إلى الصوت وهو يتحدث جملة قصيرة باللغة المستهدفة قبل أن تقوم بتسجيل المقطع بأكمله.

الاحتفاظ بالصوت الأصلي كخلفية (صوت منخفض)

مفيد إذا كان الفيديو يحتوي على موسيقى أو تأثيرات صوتية تريد الحفاظ عليها تحت الصوت الجديد. من = نظيف الصوت الواحد.

تحميل فيديو لرؤية التكلفة الدقيقة لمقطع الفيديو الخاص بك.

حيث يدفع صوت الفيديو الذكي ثمنه بنفسه

إقامة قنوات يوتيوب محليا

وتحويل فيديو إنجليزي إلى نسخة أسبانية، وبرتغالية، والهندسية بين عشية وضحاها. ويسمح تبادل المسار الصوتي على يوتيوب بتحميل فيديو واحد لخدمة ثلاثة أضعاف جمهوره بحركة فم متطابقة.

إبداعات الإعلانات العالمية

صور إعلان واحد، وترجمه إلى 20 لغة لاختبار لمدة أسبوع "بيتس" تدفع لاستديو الترجمة 500 دولار في الدقيقة لكل لغة

E-learning + corporate training

فيديوهات الامتثال، والتأهيل، وتدريب المنتجات التي تحتاج إلى عشرات اللغات بدون ميزانية استوديو، نفس الدورة، كل سوق.

كيف يعمل خط إنتاج الترجمة

الخطوة 1

(Whisper large-v3) (الشخير الكبير - الجيل الثالث)

يتم استخراج الصوت من الفيديو ونقله مع توقيت على مستوى الكلمة.

الخطوة 2

مترجم (MadLAD-400)

وتترجم النصوص إلى اللغة المستهدفة باستخدام نموذج 3B-parameter الذي تم تعديله ليتلاءم مع العبارات المنطوقة الطبيعية، وليس حرفيا كلمة بكلمة.

الخطوة 3

)كوكورو - ١٧٤ صوتا(

صوت طبيعي في اللغة المستهدفة يقرأ الترجمة. 174 صوتا عبر 37 لغة - اختر واحدا واسمعوا مسبقا أولا.

الخطوة 4

)النسخة ٢ من نظام الصوت المتزامن(

الفم يعاد تصويره إطاراً إطاراً ليتناسب مع الصوت الجديد أحدث تقنيات التصوير بصوت واحد

لماذا لا "راسك" أو "بيبركوب" أو "هايجين"؟

يفرض برنامج راسك 24 دولاراً شهرياً مقابل 100 دقيقة من الإنتاج، ويصل الحد الأقصى إلى 130 لغة مصدر. أما برنامج بيبركوب فهو مخصص للمؤسسات فقط (بيع المكالمات، توقع فواتير بأربعة أرقام). ويبدأ مستوى الترجمة في برنامج هيجين من 29 دولاراً شهرياً مع حصة 5 دقائق. وتستخدم هذه الأداة نفس مكونات أنابيب الإنتاج - ويسبر لترجمة النصوص، وماد ليد للترجمة، وكوكورو لترجمة النصوص إلى صوت، وسنك ليب سنك v2 لإعادة عرض الفم - دون اشتراكات، ولا علامات مائية، ولا حصة شهرية. وتدفع رموزاً من المجمع الذي لديك بالفعل.

صوت أي فيديو إلى 20 + لغات مع حركة الشفتين المتزامنة.

كيف تستخدم استوديو تسجيل فيديو

أدخل مدخلك

أدخل نص، أو تحميل ملف، أو وصف ما تريد. لا حساب مطلوب.

انقر على إنشاء

الذكاء الاصطناعي لدينا يعالج طلبك في ثوان باستخدام أفضل نماذج المصدر المفتوح.

تنزيل وتقاسم

تحميل، نسخ، أو مشاركة نتائجك مجانا للاستخدام الشخصي والتجاري.

استخدام هذه الأداة عن طريق API

أتمتة هذه الأداة من شفرة الخاصة بك. OpenAI-متوافق REST نقطة نهاية، حامل-رمز التوثيق، لا يلزم إضافي SDK. تكاليف الرموز تطابق واجهة شبكة الويب.

وثائق API احصل على مفتاح API

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

أدوات الذكاء الاصطناعي المجانية ذات الصلة

مولد فيديو

محرر فيديو

محسن فيديو

تسجيل أداء الذكاء الاصطناعي (الإجراء الثاني للمدارج)

مترجم فيديو

تأثيرات الفيديو - أسلوب Pikaffects

تحسين فيديو الذكاء الاصطناعي

مولد قصص قصيرة للذكاء الاصطناعي

استوديو تسجيل فيديو — FAQ

تحميل الفيديو، واختيار لغة مستهدفة، والحصول على نفس الفيديو معزز إلى تلك اللغة مع شفتي المتحدث إعادة تزامن لمطابقة الصوت الجديد. عظيم لتحويل المحتوى الإنجليزي يوتيوب إلى الإسبانية، الفرنسية، الصينية، إلخ.

أربع خطوات تجري على جانب الخادم بالترتيب: (1) Whisper ينقل النص الأصلي، (2) MadLAD يترجم النص إلى لغتك المستهدفة، (3) Kokoro يولد الكلام الطبيعي في تلك اللغة، (4) Sync Lipsync v2 يعيد رسم فم المتكلم ليتناسب مع الصوت الجديد. كل ذلك يتم في طلب واحد - لا تلعب بأدواتك الخاصة.

وتشمل القائمة القابلة للتنزيل 20 لغة من أكثر اللغات طلبا (الإسبانية، والفرنسية، والألمانية، والبرتغالية، والإيطالية، والصينية، واليابانية، والكورية، والعربية، والهندية، والتركية، والروسية، والهولندية، والبولندية، والفييتنامية، والإندونيسية، والتايلندية، والعبرية، والسويدية، والإنكليزية) ويدعم برنامج MadLAD من الناحية التقنية أكثر من 450 لغة - يرجى الاتصال بنا إذا احتجتم إلى لغات أخرى.

يقوم الصوت باستخدام الرموز المدفوعة فقط (~ 100،000 لكل مقطع). Sync Lipsync v2 هي الخطوة المكلفة - الخطوات الثلاث الأولى مجانية ومستقلة.

المقاطع التي تقل مدتها عن 30 ثانية يتم تسجيلها في حوالي 1-3 دقائق. فيديوهات أطول تستغرق وقتا أطول نسبيا. السقف الصارم 100 ميغابايت.

لا — كوكورو يستخدم واحد من 174 صوتاً داخلياً (37 لغة)، وليس نسخة مستنسخة من المتحدث الأصلي. لحفظ الهوية في استنساخ الصوت، ستحتاج إلى أداة /voice/clone/ الخاصة بنا بالإضافة إلى خط أنابيب مخصص.

صوت متزامن شفوي v2 هو أحدث صيغة لصور المتحدثين الوحيدين المتجهين للأمام. مشاهد المتحدثين المتعددين أو مقاطع عرض الصورة يمكن أن تنحرف. أفضل النتائج تأتي من صور الرأس المتكلم القريبة.

يقدم الاختيار البسيط Auto / Male / Female. لاختيار الصوت بعناية، استخدم /voice/tts/ أولاً لعرض مسبق ونسخ هوية الصوت، ثم يمكننا توصيل ذلك عبر. قريباً في واجهة المستخدم.

لا. يتم حذف الفيديو المرسل في غضون دقائق من معالجته. ويُحتفظ بالناتج على شبكة CDN الخاصة بنا لمدة 24 ساعة (7 أيام للمستخدمين المدفوعين) عند رابط المشاركة.

نعم - بالنسبة لعملية التزامن الشفوي البحتة (فيديوك + الصوت المسجل مسبقًا)، استخدم /v1/image/edit/ أو نقطة نهاية مخصصة.

استخدم /transcribe/ لملفات النصوص الفرعية (SRT/VTT)، أو /translate/subtitle/ لترجمة نصوص SRT موجودة. ويستعاض عن الصوت بالصوت؛ وتغطي النصوص الفرعية النص - مخرجات مختلفة.

نعم - فيديو متعدد الأجزاء إلى /v1/video/dubbing/ مع target_lang. يعود {output_url, transcript, translated_text}. انظر /api/ للحصول على الوثائق.

تسجيل مجاني ل 30000 رموز

إنشاء حساب مجاني

لا تلزم بطاقة ائتمان

كيف تقيِّم هذه الأداة؟

استوديو تسجيل فيديو

حيث يدفع صوت الفيديو الذكي ثمنه بنفسه

إقامة قنوات يوتيوب محليا

إبداعات الإعلانات العالمية

E-learning + corporate training

كيف يعمل خط إنتاج الترجمة

(Whisper large-v3) (الشخير الكبير - الجيل الثالث)

مترجم (MadLAD-400)

)كوكورو - ١٧٤ صوتا(

)النسخة ٢ من نظام الصوت المتزامن(

لماذا لا "راسك" أو "بيبركوب" أو "هايجين"؟

النتيجة

كيف تستخدم استوديو تسجيل فيديو

أدخل مدخلك

انقر على إنشاء

تنزيل وتقاسم

استخدام هذه الأداة عن طريق API

أدوات الذكاء الاصطناعي المجانية ذات الصلة

استوديو تسجيل فيديو — FAQ

ما هو فيديو الصوت الذكي؟

كيف يعمل خط الأنابيب؟

ما هي اللغات المدعومة؟

هل هو مجاني؟

ما هي أطول أطوال الفيديو؟

هل سيكون الصوت مثل المتحدث الأصلي؟

كم هو دقيق تزامن الشفاه؟

هل يمكنني اختيار صوت محدد؟

هل فيديوي مخزن؟

هل يمكنني أن أقوم بترجمة صوتي بنفسي بسيناريو مختلف؟

ماذا لو أردت النصوص الجانبية بدلاً من ذلك؟

هل هناك اختبار دقيق؟

حصل على 10,000 رموز مجانية

انتظر - احصل على 10K رموز مجانية!

تريد المزيد؟