MMAudio v2 (video→audio)
Free.ai
·
audio
·
~500 प्रति टोकन clip
MMAudio v2 (video→audio) an AI नमूना हो । बाह्य मोडेल मार्फत मार्ग — ~ 500 टोकन प्रति प्रयोग (50% माथि अपस्ट्रिम लागत मा मार्कअप).
API मार्फत प्रयोग गर्नुहोस्
OpenAI-सुसंगत REST API। एक कुञ्जी उत्पन्न गर्नुहोस् र सेकेन्डमा यो नमूना कल गर्नुहोस्।
curl -X POST https://api.free.ai/v1/music/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
मिसिलीकरण
API कुञ्जी प्राप्त गर्नुहोस्
प्राय सोधिने प्रश्नहरू
MMAudio v2 (video→audio) ले पाठ प्रमर्श वा भिडियो सन्दर्भबाट छोटो ध्वनि प्रभाव र परिवेश अडियो उत्पन्न गर्दछ । खुट्टाको चाल, वर्षा, मेशिनरी, विदेशी प्राणीको हल्ला — ध्वनि वर्णन गर्दछ र MMAudio v2 (video→audio) ले यसलाई संश्लेषण गर्दछ ।
सामान्यतया इन्जिनमा निर्भर १ देखि २२ सेकेन्ड । लूपयोग्य परिवेशी ट्रयाकहरू /audio/loop/ सँग फैलाउन सकिन्छ ।
हो — MMAudio v2 जस्तै भिडियो-अडियो इन्जिनले तपाईँको भिडियोबाट फ्रेमहरू पढ्दछ र मिल्दो साउन्डट्र्याक सिंथेसिस गर्दछ (खुट्टाले चाल गर्दा पाइलाहरू, पानीले हिट गर्दा स्प्लेशहरू) । /v1/audio/from-video/ वा माथिको पृष्ठमा मौन भिडियो अपलोड गर्नुहोस् ।
पूर्वनिर्धारित रूपमा WAV । MP3 ढाँचा चयनकर्तामा उपलब्ध छ ।
MMAudio v2 (video→audio) एक प्रिमियम अडियो मोडेल हो। प्रति क्लिप ~१,०००–५,००० टोकनको बारेमा। $१ = ७५०,००० टोकन।
यी नमूनाहरू ध्वनि प्रभावहरू + फोलीका लागि ट्युन गरिएको छ, संगीत होइन । लयबद्ध वा स्वर ट्रयाकहरूका लागि / संगीत / हेर्नुहोस् जहाँ MusicGen, ACE-Step, Stable Audio ले त्यो केस ह्यान्डल गर्दछ ।
हो — प्रोम्प्ट वर्णनात्मक छ (स्वर वर्णन, गीत छैन), त्यसैले कुनै पनि भाषा काम जति लामो मोडेल यो बुझ्छ. अंग्रेजी सबैभन्दा निरन्तर परिणाम दिन्छ.
हो — /batch/ ले प्रोम्टको सूची स्वीकार गर्दछ । प्रत्येक क्लिप /account/?tab=history मा आउँछ । एपीआई फोल्डर-ट्री संरक्षणका लागि सबैभन्दा लचिलो मार्ग हो ।
हो — /v1/audio/generate/ मा POST गर्न मोडल="MMAudio v2 (video→audio)" र तपाईँको प्रोम्प्ट (वा v2a इन्जिनका लागि भिडियो)। /api/ मा पूर्ण सन्दर्भ छ।
Free.ai को बाँकी रूपमा नै नीति - हाम्रो GPUs मा आत्म-होस्ट, एक डीपीए संग प्रिमियम, अपलोड शेयर-सञ्झ्याल तालिका मा समाप्त. हामी आफ्नो इनपुट मा ट्रेन छैन.
हो — Free.ai खेल ध्वनि डिजाइन लागि उत्पन्न अडियो को व्यावसायिक प्रयोग अनुदान, फिल्म foley, पोडकास्ट, विज्ञापन.
प्रति क्लिप ५ देखि ३० सेकेन्ड । भिडियो-अडियोमा लामो समय लाग्छ (भिडियो लम्बाइ अनुरूप) । ट्याब बन्द गर्न /audio/ मा लाम बटन प्रयोग गर्नुहोस् ।