MMAudio v2 (video→audio)
Free.ai
·
audio
·
~500 tokens per clip
MMAudio v2 (video→audio) is a Modellu. Routed attraversu mudelli esterni — ~ 500 tokens per usu (50% markup supra u costu a monte).
Usare via API
API REST compatibili OpenAI. Genera una chiave è chiama stu mudellu in uni pochi di siconni.
curl -X POST https://api.free.ai/v1/music/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
Documentazione
Otteni a chiave API
Dumande frequenti
MMAudio v2 (video→audio) genera curti effetti sonori è audio ambientali da un testu o da una riferenza di video. Passi, pioggia, machini, criatura alieni rughjonu — descrivenu u sonu è MMAudio v2 (video→audio) lu sintetizza.
Tipicamenti 1 à 22 siconni a sicunna dû motori. Li piste ambientali circàbbili si ponnu allungari cu /audio/loop/.
Sì — i motori video-à-audiu comu MMAudio v2 leghjinu i fotogrammi di u vostru video è sintetizzanu una banda sonora ca currispondi (passi quannu i pedi si movi, spruzzi quannu l'acqua colpisce). Caricate u video silenziosu in /v1/audio/from-video/ o a pàggina supra.
WAV pi difinizzioni. MP3 è dispunibbili nta lu selettori di furmatu.
MMAudio v2 (video→audio) hè un mudellu audio premium. Circa ~1,000–5,000 tokens per clip. $1 = 750,000 tokens.
Sti mudelli sò sintonizati pi effetti sonori + foley, non pi musica. Pi tracce strumentali o vocali melòdichi vidi /music/ unni MusicGen, ACE-Step, Stable Audio gestisci chistu casu.
Sì — u prompt hè discrittivi (descrivi u sonu, non i testi), quinni ogni lingua funziona finu a chi u mudellu la capisci. L'ingrisi dà i risultati cchiù cunsistenti.
Sì — /batch/ accetta una lista di pruposte. Ogni clip finisci in /account/?tab=history. L'API è u modu cchiù flessibbili pi cunservari l'arburi di cartelle.
Sì — POST à /v1/audio/generate/ cu model="MMAudio v2 (video→audio)" e u vostru prompt (o video per i muturi v2a). /api/ hà a riferenza piena.
A stissa pulitica di u restu di Free.ai — auto-ospitatu nantu à i nostri GPU, premium cù un DPA, i caricamenti scadenu in a pianificazione di a finestra di cunnizzioni. Non ci addestramu nantu à i vostri input.
Sì — Free.ai cunzenti l'usu cummerciali di l'audiu generatu pi lu design di lu sonu di li giochi, film foley, podcast, pubbricità.
5 à 30 siconni pi clip. A cunversioni di u video in audio dura cchiù longu (prupurziunali â lunghezza di u video). Usa u buttoni di a coda di /audio/ pi chiudiri la linguetta.