MMAudio v2 (video→audio)
Free.ai
·
audio
·
~500 polletter per clip
MMAudio v2 (video→audio) är {artikel} {kategori}. Körs genom externa modeller — ~500 polletter per användning (50 % uppräkning över uppströmskostnad).
Använd via API
OpenAI-kompatibelt REST API. Skapa en nyckel och ring denna modell på några sekunder.
curl -X POST https://api.free.ai/v1/music/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
API-dokumentation
Hämta API- nyckel
Vanliga frågor
MMAudio v2 (video→audio) genererar korta ljudeffekter och omgivande ljud från en textprompt eller video referens. Fotsteg, regn, maskiner, främmande varelser ryter — beskriva ljudet och MMAudio v2 (video→audio) syntetiserar det.
Vanligtvis 1 till 22 sekunder beroende på motorn. Loopable omgivande spår kan sträckas med /audio/loop/.
Ja — video-till-audio motorer som MMAudio v2 läsa ramar från din video och syntetisera en matchande soundtrack (fotsteg när fötterna rör sig, stänker när vatten träffar). Ladda upp den tysta videon till /v1/audio/from-video / eller sidan ovan.
WAV som standard. MP3 är tillgänglig i formatväljaren.
MMAudio v2 (video→audio) är en premium ljudmodell. Om ~1000-5.000 tokens per klipp. $1 = 750.000 tokens.
Dessa modeller är stämda för ljudeffekter + foley, inte musik. För melodiska instrument- eller sångspår se /music/ where MusicGen, ACE-Step, Stable Audio hantera detta fall.
Ja — prompten är beskrivande (beskriv ljudet, inte texterna), så alla språk fungerar så länge modellen förstår det. Engelska ger de mest konsekventa resultaten.
Ja — / batch / accepterar en lista med frågor. Varje klipp landar i / account/?tab= historia. API:et är den mest flexibla vägen för att bevara katalogträd.
Ja – POST till /v1/audio/generate/ with model="MMAudio v2 (video→audio)" och din prompt (eller video för v2a motorer). /api/ har den fullständiga referensen.
Samma policy som resten av Free.ai – självvärd på våra GPUs, premium med en DPA, uppladdningar löper ut på share-window schemat. Vi tränar inte på dina ingångar.
Ja — Free.ai beviljar kommersiell användning av genererat ljud för spelljuddesign, filmfoto, podcasts, annonser.
5 till 30 sekunder per klipp. Video- till- ljud tar längre tid (proportionalitet till videolängd). Använd köknappen på /audio/ för att stänga fliken.