MMAudio v2 (video→audio)
Free.ai
·
audio
·
~500 жетони на clip
MMAudio v2 (video→audio) е a Модел на AI. Посочена през външни модели — ~500 žeтони за употреба (50% маркиране над разходите на горния поток).
Използване чрез API
Съгласен с OpenAI REST API. Генерирайте ключ и се обадете на този модел в секунди.
curl -X POST https://api.free.ai/v1/music/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
API документация
Вземете API ключ
Често задавани въпроси
MMAudio v2 (video→audio) генерира къси звукови ефекти и звук на околната среда от текст или видео референция. Стъпки, дъжд, машини, чужбини шумове — описва звука и MMAudio v2 (video→audio) синтетизира го.
Обикновено 1 до 22 секунди в зависимост от двигателя. Лоповите околни протези могат да се разтегнат с /audio/loop /.
Да — видео-то-аудио двигатели като MMAudio v2 прочетете кадри от видеото си и синтезирайте съвпадащ звуков трак (стъпки, когато краката се движат, пръска при удари с вода). Качвайте тихото видео на /v1/audio/from-video/ или страницата по-горе.
WAV по подразбиране. MP3 е на разположение в избирача на формата.
MMAudio v2 (video→audio) е първокласен аудио модел. Около ~1000-5000 жетони на клип. $1 = 750 000 жетона.
Тези модели са настроени за звукови ефекти + фолие, а не музика. За мелодичните инструментални или вокални песни вижте /music / където MusicGen, ACE-Step, Stable Audio да се справите с този куфар.
Да — бързият е описателен (приписвай звука, а не текста), така че всеки език работи, докато моделът го разбира. Английският дава най-консистентните резултати.
Да — /batch/ приема списък с въпроси. Всеки клип се качва в /account /?tab=history. API е най-гъвкавият маршрут за опазване на папките-дървото.
Да — POST to /v1/audio/generate/ with model="MMAudio v2 (video→audio)" и вашият бърз (или видео за V2a двигатели). /api/ има пълното позоваване.
Същата политика като остатъка от Free.ai – самостоятелно домакин на нашите GPU, премия с DPA, изтича по графика на акциите. Не тренираме върху вашите входове.
Да — Free.ai отпуска търговско използване на генериран звук за дизайн на звука на играта, филмови фолии, подкасти, реклами.
5 до 30 секунди на клип. Видео-то-аудио отнема по-дълго (пропорционално на дължината на видеото). Използвайте бутона за редица на /audio/ за да затворите раздела.