MMAudio v2 (video→audio)

Free.ai · audio · ~500 znaki na clip
~500 znaki na clip
Bezpłatnie działa na naszych GPU. Uaktualnij dla MMAudio v2 (video→audio) →

MMAudio v2 (video→audio) to a Model AI. Skierowane przez modele zewnętrzne — ~500 tokeny na użycie (50% markingu nad kosztami strumienia).

Użyj przez API

Kompatybilny z OpenAI REST API. Generuj klucz i zadzwoń po ten model w sekundach.

curl -X POST https://api.free.ai/v1/music/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
Dokumentacja API Pobierz klucz API

Często zadawane pytania

MMAudio v2 (video→audio) generuje krótkie efekty dźwiękowe i dźwięki otoczeniowe z tekstowych lub wideo odniesienia. Stopy, deszcz, maszyny, ryki obcych stworzeń — opisuje dźwięk i MMAudio v2 (video→audio) syntezuje go.

Zazwyczaj od 1 do 22 sekund w zależności od silnika. Dostępne ścieżki otoczenia można rozciągnąć za pomocą /audio/loop /.

Tak — silniki wideo-to-audio, takie jak MMAudio v2 czytaj ramki z Twojego wideo i syntetyzuj dopasowaną ścieżkę dźwiękową (stopy podczas ruchu stóp, rozpryska się podczas uderzeń w wodę). Wyślij ciche wideo na /v1/audio/od-video/ lub stronę powyższą.

WAV domyślnie. MP3 jest dostępny w pickerze formatu.

MMAudio v2 (video→audio) to premium audio model. Około ~1000–5000 tokenów na klip. $1 = 750 000 tokenów.

Modele te są nastawione na efekty dźwiękowe + foley, a nie muzykę. Dla melodycznych utworów instrumentalnych lub wokalnych patrz /music / gdzie MusicGen, ACE-Step, Stable Audio obsługiwać tę sprawę.

Tak — zachęta jest opisowa (opisać dźwięk, a nie teksty), więc każdy język działa tak długo, jak model go rozumie. Angielski daje najbardziej konsekwentne wyniki.

Tak — /batch/ akceptuje listę pytań. Każdy klip ląduje w /account /?tab=history. API jest najbardziej elastyczną drogą do zachowania drewna folderów.

Tak – POST do /v1/audio/generat/ z modelem="MMAudio v2 (video→audio)" i Twojego szybkiego (lub wideo dla silników v2a). /api/ ma pełne odniesienie.

Taka sama polityka jak reszta Free.ai – samorządzony na naszych GPU, premia z DPA, wygasa na harmonogram akcjonariuszy. Nie trenujemy na wejściach.

Tak — Free.ai przyznaje komercyjne wykorzystanie generowanego dźwięku do projektowania gier, folii filmowych, podcastów, reklam.

5 do 30 sekund na klip. Video- to-audio trwa dłużej (proporcjonalnie do długości wideo). Użyj przycisku kolejki na /audio/, aby zamknąć zakładkę.

Love this tool? Share it!

Oszacuj tę stronę