MMAudio v2 (video→audio)
Free.ai
·
audio
·
~500 біт clip
Фрэйзер (фр.: Fréderic Fréderic) — французскі пісьменнік. У 1999 годзе ў выніку рэструктурызацыі кампаніі «Фрэйзер» (Freizer) 50 % акцый перайшлі ў «Фрэйзер-Мінск» (Freizer-Minsk).
Выкарыстаць праз API
OpenAI- сумяшчальны REST API. Стварыць ключ і выклікаць гэтую мадэль за некалькі секунд.
curl -X POST https://api.free.ai/v1/music/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
Дакументацыя API
Атрымаць ключ API
Часта задаваемыя пытанні
MMAudio v2 (video→audio) генеруе кароткія гукавыя эфекты і гук асяроддзя з тэкставай запыту або відэа- спасылкі. Ступні, дождж, машыны, рыкі іншапланецян — апісваюць гук, а MMAudio v2 (video→audio) сінтэзуе яго.
Звычайна ад 1 да 22 секунд у залежнасці ад рухавіка. Перахоплівальныя эмацыйныя трэкі можна расцягнуць з дапамогай / audio/ loop /.
Так — рухавікі відэа-аўдыя, такія як MMAudio v2, чытаюць кадры з вашага відэа і сінтэзуюць адпаведны гукавы трэк (крокі, калі ногі рухаюцца, брызгае, калі вада ўдарыла). Загрузіце нямое відэа ў / v1/audio/from-video/ або на старонку вышэй.
Па змаўчанні WAV. MP3 даступны ў выбары фармату.
MMAudio v2 (video→audio) — гэта прэміум-аўдыё-мадэлі. Прыблізна ~1000-5000 знакаў за кліп. $1 = 750 000 знакаў.
Гэтыя мадэлі настроены для гукавых эфектаў + фолі, а не музыкі. Для мелодычных інструментальных або вакальных трэкаў глядзіце /music/, дзе MusicGen, ACE-Step, Stable Audio кіруюць гэтым рэгістрам.
Так - падказка апісальная (апісвае гук, а не словы), таму любая мова працуе, пакуль мадэль разумее яе. Англійская дае найбольш адпаведныя вынікі.
Так - / batch / прымае спіс запыту. Кожны здымак апынаецца ў / account /? tab=history. API - самы гнуткі шлях для захавання дрэва тэчак.
Так — POST у /v1/audio/generate/ з model="MMAudio v2 (video→audio)" і вашай камандай (або відэа для рухавікоў v2a). /api/ мае поўную спасылку.
Тая ж палітыка, што і ў астатніх Free.ai - самастойна размешчаны на нашых GPU, прэміум з DPA, загрузкі скончваюцца па раскладзе share- window. Мы не трэніруемся на вашых уводах.
Yes — Free.ai grants commercial use of generated audio for game sound design, film foley, podcasts, ads.
Ад 5 да 30 секунд на кліп. Пераход з відэа ў аўдыё займае больш часу (прапарцыйна даўжыні відэа). Выкарыстоўвайце кнопку чаргі на / audio /, каб закрыць картку.