MMAudio v2 (video→audio)
Free.ai
·
audio
·
~500 znaki na clip
MMAudio v2 (video→audio) to a Model AI. Skierowane przez modele zewnętrzne — ~500 tokeny na użycie (50% markingu nad kosztami strumienia).
Użyj przez API
Kompatybilny z OpenAI REST API. Generuj klucz i zadzwoń po ten model w sekundach.
curl -X POST https://api.free.ai/v1/music/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
Dokumentacja API
Pobierz klucz API
Często zadawane pytania
MMAudio v2 (video→audio) generuje krótkie efekty dźwiękowe i dźwięki otoczeniowe z tekstowych lub wideo odniesienia. Stopy, deszcz, maszyny, ryki obcych stworzeń — opisuje dźwięk i MMAudio v2 (video→audio) syntezuje go.
Zazwyczaj od 1 do 22 sekund w zależności od silnika. Dostępne ścieżki otoczenia można rozciągnąć za pomocą /audio/loop /.
Tak — silniki wideo-to-audio, takie jak MMAudio v2 czytaj ramki z Twojego wideo i syntetyzuj dopasowaną ścieżkę dźwiękową (stopy podczas ruchu stóp, rozpryska się podczas uderzeń w wodę). Wyślij ciche wideo na /v1/audio/od-video/ lub stronę powyższą.
WAV domyślnie. MP3 jest dostępny w pickerze formatu.
MMAudio v2 (video→audio) to premium audio model. Około ~1000–5000 tokenów na klip. $1 = 750 000 tokenów.
Modele te są nastawione na efekty dźwiękowe + foley, a nie muzykę. Dla melodycznych utworów instrumentalnych lub wokalnych patrz /music / gdzie MusicGen, ACE-Step, Stable Audio obsługiwać tę sprawę.
Tak — zachęta jest opisowa (opisać dźwięk, a nie teksty), więc każdy język działa tak długo, jak model go rozumie. Angielski daje najbardziej konsekwentne wyniki.
Tak — /batch/ akceptuje listę pytań. Każdy klip ląduje w /account /?tab=history. API jest najbardziej elastyczną drogą do zachowania drewna folderów.
Tak – POST do /v1/audio/generat/ z modelem="MMAudio v2 (video→audio)" i Twojego szybkiego (lub wideo dla silników v2a). /api/ ma pełne odniesienie.
Taka sama polityka jak reszta Free.ai – samorządzony na naszych GPU, premia z DPA, wygasa na harmonogram akcjonariuszy. Nie trenujemy na wejściach.
Tak — Free.ai przyznaje komercyjne wykorzystanie generowanego dźwięku do projektowania gier, folii filmowych, podcastów, reklam.
5 do 30 sekund na klip. Video- to-audio trwa dłużej (proporcjonalnie do długości wideo). Użyj przycisku kolejki na /audio/, aby zamknąć zakładkę.