DiffRhythm
Free.ai
·
music
·
~500 الرموز لكل track
·
3.7
من 3 المستخدمون في هذه الفئة
DiffRhythm هو a نموذج توليد الموسيقى. Routed through external models — ~500 tokens لكل مسار (50% markup over upstream cost).
الاستخدام عن طريق واجهة البرمجة
REST API متوافق مع OpenAI. تولد مفتاحاً وتدعو هذا النموذج في ثوانٍ.
curl -X POST https://api.free.ai/v1/music/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/diffrhythm","prompt":"your prompt here"}'
وثائق API
احصل على مفتاح API
نماذج مماثلة
الأسئلة المتكررة
DiffRhythm يولد موسيقى آلية أصلية (وفي بعض المحركات، أصوات) من نافذة نصية. وصف المزاج، النوع، الآلات، أو BPM وDiffRhythm يعيد مسار صوت كامل.
10 إلى 60 ثانية لكل جيل اعتمادا على المحرك.للقطع الأطول، تسلسل الأجيال المتعددة من خلال /music/stitch/ أو توليد في قطاعات 30 ثانية والتلاشي المتقاطع.
بعض المحركات تقوم بتوليف الصوت من الكلمات التي تقدمها (علّق الكلمات في النموذج)؛ وبعضها الآخر يقوم بذلك على الوسائل فقط. ضع علامة على النموذج في هذه الصفحة — يعني حقل الكلمات أن الصوت مدعم.
موسيقى البوب، الروك، الجاز، الإمبيرنتال، الكلاسيكية، لو في، الهيب هوب، كلها تؤدي بشكل معقول. أنواع الموسيقى المتخصصة (غاميلان، كارناتيك، الغناء بالحنجرة) أضعف - وصف الآلات صراحة لأفضل النتائج.
DiffRhythm هو نموذج موسيقي أعلى جودة. كل مسار يشغل ~ 5000-15000 رموز اعتمادا على المدة والتعقيد. $ 1 = 750000 رموز.
WAV تلقائياً (غير خاسر، جاهز لمزيد من المزج). MP3 متاح في مختبر الخرج للملفات الأصغر.
لا — DiffRhythm يعيد مسارا مختلطا. لفصله إلى جذوع، تشغيل المخرج من خلال /music/separate/ الذي يستخدم Demucs لاستخراج الصوتيات، الطبول، الباس، وغيرها.
نعم — /batch/ يقبل قائمة من الطلبات. كل مسار ينتهي في /account/?tab=history مع الطلب كأسم الملف. لمزيد من التحكم، استخدم API.
نعم — POST التعليمات إلى /v1/music/generate/ مع model="DiffRhythm". /api/ لديها المرجع الكامل بما في ذلك الكلمات، والمدة، وبارامترات الوتيرة.
DiffRhythm لا يستنسخ التكوينات المحمية بحقوق الطبع — الخرجات يتم توليفها حديثا. Free.ai يمنح الاستخدام التجاري؛ أنت تحتفظ بحقوق المسارات التي أنتجتها. تسمية فنان في الطلب يطلب "على غرار" — الصوت الفعلي هو الأصلي.
15 ثانية إلى دقيقتين لكل مسار اعتمادا على المدة + المحرك. النماذج العالية تنتهي أسرع. استخدم زر الصف لإغلاق العلامة - النتيجة تصل إلى /account/?tab=history عندما تنتهي.
نعم - فشلت في إعادة العرض التلقائي. بالنسبة للمقطوعات التي تم تشغيلها ولكنها تبدو سيئة، بريد إلكتروني contact@free.ai مع رابط المشاركة وسنراجع كل حالة على حدة.