MMAudio v2 (video→audio)

Free.ai · audio · ~500 الرموز لكل clip

وصف الصوت

~500 الرموز لكل clip

يعمل بحرية على وحدات المعالجة الرسومية لدينا رفع مستوى الخدمة MMAudio v2 (video→audio) →

MMAudio v2 (video→audio) هو a نموذج الذكاء الاصطناعي. Routed through external models — ~500 tokens لكل استخدام (50% markup over upstream cost).

الاستخدام عن طريق واجهة البرمجة

REST API متوافق مع OpenAI. تولد مفتاحاً وتدعو هذا النموذج في ثوانٍ.

curl -X POST https://api.free.ai/v1/music/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'

وثائق API احصل على مفتاح API

نماذج مماثلة

ElevenLabs Sound Effects

جميع النماذج →

الأسئلة المتكررة

MMAudio v2 (video→audio) يولد تأثيرات صوتية قصيرة وصوت محيط من نص أو مرجع فيديو. خطوات، المطر، الآلات، صوت مخلوقات فضائية - يصف الصوت وMMAudio v2 (video→audio) يقوم بتوليفه.

عادة ما تتراوح من 1 إلى 22 ثانية اعتمادا على المحرك.المسارات المحيطة القابلة للدوران يمكن تمديدها باستخدام /audio/loop/.

نعم — محركات الفيديو إلى صوت مثل MMAudio v2 تقرأ إطارات من الفيديو الخاص بك وتقوم بتصنيع مسار صوت مطابق (خطوات عندما تتحرك الأقدام، رشقات عندما تضرب المياه).

WAV تلقائياً. MP3 متاح في خيار الشكل.

MMAudio v2 (video→audio) هو نموذج صوت أعلى جودة. حوالي ~ 1000-5000 رموز لكل مقطع. $ 1 = 750000 رموز.

هذه النماذج هي مصممة للتأثيرات الصوتية + فولي، وليس الموسيقى. للموسيقى الموسيقية أو مسارات الصوت انظر /music/ حيث MusicGen، ACE-Step، Stable Audio تتعامل مع هذه الحالة.

نعم — الطلب وصفي (اصف الصوت، لا الكلمات)، لذا فإن أي لغة تعمل ما دام النموذج يفهمها، واللغة الإنجليزية تعطي أكثر النتائج اتساقاً.

نعم - /batch/ يقبل قائمة من الطلبات. كل مقطع يقع في /account/?tab=history. API هو الطريق الأكثر مرونة للحفاظ على شجرة المجلد.

نعم — POST إلى /v1/audio/generate/ مع model="MMAudio v2 (video→audio)" وطلبك (أو الفيديو للمحركات v2a). /api/ لديها المرجع الكامل.

نفس السياسة التي تتبعها بقية Free.ai — استضافة ذاتية على وحدات المعالجة الرسومية الخاصة بنا ، مكافأة مع DPA ، تنتهي صلاحية التحميلات في الجدول الزمني لنافذة المشاركة.

نعم - Free.ai يمنح الاستخدام التجاري للصوت المولد لتصميم صوت الألعاب، والأفلام، والبرامج الصوتية، والإعلانات.

5 إلى 30 ثانية لكل مقطع. الترجمة من الفيديو إلى الصوت تستغرق وقتاً أطول (بالتناسب مع طول الفيديو). استخدم زر الصف في /audio/ لإغلاق العلامة.

MMAudio v2 (video→audio)

الاستخدام عن طريق واجهة البرمجة

نماذج مماثلة

الأسئلة المتكررة

ما الذي يولده MMAudio v2 (video→audio)؟

كم تدوم مقاطع فيديو ( MMAudio v2 (video→audio) _ )؟

هل يمكن لـ MMAudio v2 (video→audio) أن يقوم بتسجيل مقطع فيديو مباشرة؟

ما هو شكل الخرج الذي يعود به MMAudio v2 (video→audio)؟

كم تكلف MMAudio v2 (video→audio)؟

هل يمكن لـ MMAudio v2 (video→audio) أن يولد الموسيقى أيضاً؟

هل يدعم MMAudio v2 (video→audio) نداءات مخصصة بلغات متعددة؟

هل يمكنني أن أقوم بتوليد تأثيرات صوتية بالدفعة مع MMAudio v2 (video→audio)؟

هل هناك رابطة بين التطبيقات لـ MMAudio v2 (video→audio)؟

ماذا عن الخصوصية عندما أرفع صورة إلى MMAudio v2 (video→audio)؟

هل مخرجات MMAudio v2 (video→audio) آمنة للاستخدام التجاري؟

كم يستغرق MMAudio v2 (video→audio)؟

حصل على 10,000 رموز مجانية

انتظر - احصل على 10K رموز مجانية!

تريد المزيد؟