MMAudio v2 (video→audio)

Free.ai · audio · ~500 token per clip
~500 token per clip

MMAudio v2 (video→audio) è a Modello AI. Instradato attraverso modelli esterni Tokens 500 per uso (con un markup del 50% rispetto al costo upstream).

Utilizzare tramite API

API OpenAI-compatibile REST. Generare una chiave e chiamare questo modello in pochi secondi.

curl -X POST https://api.free.ai/v1/music/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
Documentazione API Ottieni la chiave API

Domande frequenti

MMAudio v2 (video→audio) genera effetti sonori brevi e audio ambiente da un prompt di testo o di riferimento video. Passi, pioggia, macchinari, creature aliene ruggisce MMAudio v2 (video→audio) descrive il suono e MMAudio v2 (video→audio) sintetizza.

Tipicamente da 1 a 22 secondi a seconda del motore. Le tracce ambient registrabili possono essere allungate con /audio/loop/.

Sì MMAudio v2 legge i fotogrammi dal video e sintetizza una colonna sonora corrispondente (passi quando i piedi si muovono, schizzi quando l'acqua colpisce). Carica il video silenzioso su /v1/audio/from-video/ o sulla pagina precedente.

WAV per impostazione predefinita. MP3 è disponibile nel selettore di formato.

MMAudio v2 (video→audio) è un modello audio premium. Circa ~1.000 token 5.000 per clip. $1 = 750.000 token.

Questi modelli sono sintonizzati per effetti sonori + foley, non musica. Per tracce melodiche strumentali o vocali vedere /music/ dove MusicGen, ACE-Step, Stable Audio gestire quel caso.

Sì, il prompt è descrittivo (descrivere il suono, non i testi), quindi ogni lingua funziona finché il modello lo comprende. L'inglese dà i risultati più coerenti.

Sì /batch/ accetta un elenco di prompt. Ogni clip arriva in /account/?tab=history. L'API è il percorso più flessibile per la conservazione dell'albero delle cartelle.

Sì POST to /v1/audio/generate/ with model="MMAudio v2 (video→audio)" and your prompt (or video for v2a engines). /api/ has the full reference.

Stessa politica come il resto di Free.ai CdA auto-ospitati sulle nostre GPU, premium con un DPA, gli upload scadono sul programma share-window. Non ci alleniamo sui vostri input.

Sì Free.ai concede l'uso commerciale di audio generato per la progettazione del suono del gioco, film foley, podcast, annunci.

Da 5 a 30 secondi per clip. Video-to-audio richiede più tempo (proporzionale alla lunghezza del video). Utilizzare il pulsante coda su /audio/ per chiudere la scheda.

Love this tool? Share it!

Valuta questa pagina