MMAudio v2 (video→audio)

Free.ai · audio · ~500 tokens per clip
~500 tokens per clip

MMAudio v2 (video→audio) es a Modelo de IA. Enrutado a través de modelos externos — ~500 tokens por uso(marque del 50% sobre el coste ascendente).

Uso a través de API

API REST compatible con OpenAI. Genera una clave y llama a este modelo en segundos.

curl -X POST https://api.free.ai/v1/music/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
Documentación API Obtener clave de API

Preguntas frecuentes

MMAudio v2 (video→audio) genera efectos de sonido cortos y audio ambiental a partir de un mensaje de texto o referencia de vídeo. Pasos, lluvia, maquinaria, criaturas alienígenas rugen — describe el sonido y MMAudio v2 (video→audio) lo sintetiza.

Típicamente de 1 a 22 segundos dependiendo del motor. Las pistas ambientales loopable se pueden estirar con /audio/loop/.

Sí — motores de vídeo a audio como MMAudio v2 leer fotogramas de su vídeo y sintetizar una banda sonora correspondiente (pasos cuando los pies se mueven, salpica cuando el agua golpea).Cargue el vídeo silencioso a /v1/audio/ from-video/ o la página de arriba.

WAV por defecto. MP3 está disponible en el selector de formato.

MMAudio v2 (video→audio) es un modelo de audio premium. Alrededor de ~1,000–5,000 tokens por clip. $1 = 750.000 tokens.

Estos modelos están sintonizados para efectos de sonido + foley, no música. Para las pistas instrumentales o vocales melódicas ver /music/ donde MusicGen, ACE-Step, Stable Audio manejan ese caso.

Sí — el prompt es descriptivo (describa el sonido, no las letras), por lo que cualquier idioma funciona mientras el modelo lo entienda. El inglés da los resultados más consistentes.

Sí — /batch/ acepta una lista de avisos. Cada clip aterriza en /account/?tab=historia. La API es la ruta más flexible para la preservación de árboles de carpetas.

Sí — POST to /v1/audio/generate/ with model="MMAudio v2 (video→audio)" y su prompt (o vídeo para motores v2a). /api/ tiene la referencia completa.

La misma política que el resto de Free.ai — auto-anfitriones en nuestras GPUs, premium con un DPA, cargas expiran en el calendario de ventanas compartidas. No entrenamos en sus entradas.

Sí — Free.ai concede el uso comercial de audio generado para el diseño de sonido del juego, foley de película, podcasts, anuncios.

5 a 30 segundos por clip. El vídeo a audio tarda más tiempo (proporcional a la longitud de vídeo). Utilice el botón de cola en /audio/ para cerrar la pestaña.

Love this tool? Share it!

Calificar esta página