MMAudio v2 (video→audio)
Free.ai
·
audio
·
~500 Torneiras por clip
_ Encaminhado através de modelos externos — ~500 tokens por utilização (50% de marcagem sobre o custo a montante).
Utilizar através da API
API REST compatível com o OpenAI. Gere uma chave e chame este modelo em segundos.
curl -X POST https://api.free.ai/v1/music/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
Documentação da API
Obter a chave da API
Perguntas Frequentes
MMAudio v2 (video→audio) gera efeitos sonoros curtos e áudio ambiente a partir de um texto ou referência de vídeo. Passos, chuva, máquinas, rugidos de criaturas alienígenas — descreve o som e MMAudio v2 (video→audio) sintetiza-o.
Tipicamente 1 a 22 segundos dependendo do motor. As faixas ambientais loopáveis podem ser estendidas com /audio/loop /.
Sim — motores de vídeo-a-audio como MMAudio v2 leia as molduras do seu vídeo e sintetize uma faixa sonora correspondente (passos de pé quando os pés se movem, splashs quando a água bate). Envie o vídeo silencioso para /v1/audio/de-video/ ou a página acima.
WAV por padrão. MP3 está disponível no selector de formato.
MMAudio v2 (video→audio) é um modelo de áudio premium. Cerca de 1.000–5.000 tokens por clipe. $1 = 750.000 tokens.
Estes modelos são sintonizados para efeitos sonoros + foley, não música. Para faixas instrumentais ou vocais melódicas veja /music / onde MusicGen, ACE-Step, Stable Audio manipulam esse caso.
Sim — o prompt é descritivo (describa o som, não a letra), então qualquer linguagem funciona desde que o modelo o compreenda. Inglês dá os resultados mais consistentes.
Sim — /batch/ aceita uma lista de indicações. Cada clip aterra em /account /?tab=história. A API é a rota mais flexível para a preservação de pasta-árbore.
Sim — POST to /v1/audio/generate/ com model="MMAudio v2 (video→audio)" e seu prompt (ou vídeo para motores v2a). /api/ tem a referência completa.
A mesma política que o resto de Free.ai — self-hosted on our GPUs, premium with a DPA, uploads expirem na agenda share-window. Nós não treinamos em seus insumos.
Sim — Free.ai concede uso comercial de áudio gerado para o design de som de jogo, foley de filme, podcasts, anúncios.
5 a 30 segundos por clipe. O vídeo a audio leva mais tempo (proporcional ao comprimento do vídeo). Use o botão da fila em /audio/ para fechar a guia.