MMAudio v2 (video→audio)
Free.ai
·
audio
·
~500 ਟੋਕਨਾਂ ਪ੍ਰਤੀ clip
MMAudio v2 (video→audio) an AI ਮਾਡਲ ਹੈ । ਬਾਹਰੀ ਮਾਡਲਾਂ ਰਾਹੀਂ ਰੂਟ ਕੀਤਾ — ~500 ਟੋਕਨ ਪ੍ਰਤੀ ਵਰਤੋਂ (ਅੱਪਸਟਰੀਮ ਲਾਗਤ ਤੋਂ 50% ਮਾਰਕਅਪ)
API ਰਾਹੀਂ ਵਰਤੋਂ
OpenAI- ਅਨੁਕੂਲ REST API। ਇੱਕ ਕੁੰਜੀ ਬਣਾਓ ਅਤੇ ਇਸ ਮਾਡਲ ਨੂੰ ਸਕਿੰਟਾਂ ਵਿੱਚ ਕਾਲ ਕਰੋ।
curl -X POST https://api.free.ai/v1/music/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
API ਡੌਕੂਮੈਂਟੇਸ਼ਨ
API ਕੁੰਜੀ ਲਵੋ
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
MMAudio v2 (video→audio) ਇੱਕ ਪਾਠ ਪੁਆਇੰਟ ਜਾਂ ਵੀਡਿਓ ਹਵਾਲਾ ਤੋਂ ਛੋਟੇ ਸਾਊਂਡ ਪਰਭਾਵ ਅਤੇ ਆਵਾਜ਼ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਪੱਥਰ ਦੇ ਕਦਮ, ਮੀਂਹ, ਮਸ਼ੀਨਰੀ, ਬਾਹਰੀ ਜੀਵ ਦਾ ਝਟਕਾ - ਸਾਊਂਡ ਨੂੰ ਵਰਣਨ ਕਰੋ ਅਤੇ MMAudio v2 (video→audio) ਇਸ ਨੂੰ ਸੰਸਲੇਸ਼ਿਤ ਕਰਦਾ ਹੈ।
ਆਮ ਤੌਰ ਉੱਤੇ ਇੰਜਣ ਉੱਤੇ ਨਿਰਭਰ ਕਰ ਕੇ 1 ਤੋਂ 22 ਸਕਿੰਟ ਹੈ। ਲੂਪਯੋਗ ਐਂਬਾਇਰਨਮੈਂਟ ਟਰੈਕ /audio/loop/ ਨਾਲ ਵਧਾਏ ਜਾ ਸਕਦੇ ਹਨ।
ਹਾਂ — ਵੀਡਿਓ-ਤੋਂ-ਆਡੀਓ ਇੰਜਣ ਜਿਵੇਂ MMAudio v2 ਤੁਹਾਡੇ ਵਿਡੀਓ ਤੋਂ ਫਰੇਮ ਪੜ੍ਹਦੇ ਹਨ ਅਤੇ ਇੱਕ ਮਿਲਦਾ ਸਾਊਂਡਟਰੈਕ ਬਣਾਉਂਦੇ ਹਨ (ਪੈਰਾਂ ਦੇ ਹਿਲਣ ਨਾਲ ਪੈਰਾਂ ਦੇ ਕਦਮ, ਪਾਣੀ ਦੇ ਲੱਗਣ ਨਾਲ ਛਿੜਕਾਅ) । ਚੁੱਪ ਵਿਡੀਓ /v1/audio/from-video/ ਜਾਂ ਉੱਪਰਲੇ ਸਫ਼ੇ ਉੱਤੇ ਅੱਪਲੋਡ ਕਰੋ ।
ਡਿਫਾਲਟ ਤੌਰ ਉੱਤੇ WAV ਹੈ । MP3 ਫਾਰਮੈਟ ਚੋਣਕਾਰ ਵਿੱਚ ਉਪਲੱਬਧ ਹੈ ।
MMAudio v2 (video→audio) ਇੱਕ ਪ੍ਰੀਮੀਅਮ ਆਡੀਓ ਮਾਡਲ ਹੈ। ਪ੍ਰਤੀ ਕਲਿੱਪ ~1,000-5,000 ਟੋਕਨ ਹਨ। $1 = 750,000 ਟੋਕਨ ਹਨ।
ਇਹ ਮਾਡਲ ਸਾਊਂਡ ਪਰਭਾਵ + ਫੋਲੀ ਲਈ ਟੂਨ ਕੀਤੇ ਗਏ ਹਨ, ਸੰਗੀਤ ਲਈ ਨਹੀਂ। ਗੀਤਕ ਸੰਗੀਤ ਜਾਂ ਗਾਇਕੀ ਟਰੈਕਾਂ ਲਈ /music/ ਵੇਖੋ, ਜਿੱਥੇ MusicGen, ACE-Step, Stable Audio ਇਸ ਨੂੰ ਸੰਭਾਲਦੇ ਹਨ।
ਹਾਂ — ਇਹ ਪ੍ਰਸ਼ਨ ਵਰਣਨਕਾਰੀ ਹੈ (ਸਵਾਰੀ ਦਾ ਵਰਣਨ ਕਰੋ, ਗੀਤ ਨਹੀਂ), ਇਸ ਲਈ ਕੋਈ ਵੀ ਭਾਸ਼ਾ ਕੰਮ ਕਰਦੀ ਹੈ, ਜੇਕਰ ਮਾਡਲ ਇਸ ਨੂੰ ਸਮਝ ਸਕੇ । ਅੰਗਰੇਜ਼ੀ ਸਭ ਤੋਂ ਵੱਧ ਸਥਿਰ ਨਤੀਜੇ ਦਿੰਦੀ ਹੈ ।
ਹਾਂ — /batch/ ਪ੍ਰਸ਼ਨਾਂ ਦੀ ਲਿਸਟ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ। ਹਰੇਕ ਕਲਿੱਪ /account/?tab=history ਵਿੱਚ ਪਹੁੰਚਦਾ ਹੈ। ਫੋਲਡਰ-ਲੜੀ ਸੰਭਾਲਣ ਲਈ API ਸਭ ਤੋਂ ਵੱਧ ਲਚਕਦਾਰ ਰੂਟ ਹੈ।
ਹਾਂ — /v1/audio/generate/ ਨੂੰ POST ਕਰੋ, ਜਿਸ ਵਿੱਚ model="MMAudio v2 (video→audio)" ਅਤੇ ਤੁਹਾਡਾ ਪ੍ਰਸ਼ਨ (ਜਾਂ v2a ਇੰਜਣਾਂ ਲਈ ਵੀਡਿਓ) ਹੋਵੇ । /api/ ਵਿੱਚ ਪੂਰਾ ਹਵਾਲਾ ਹੈ ।
Free.ai ਦੇ ਬਾਕੀ ਹਿੱਸਿਆਂ ਵਾਂਗ ਹੀ ਪਾਲਸੀ — ਸਾਡੇ GPUs ਉੱਤੇ ਆਪਣਾ ਹੋਸਟ, DPA ਨਾਲ ਪ੍ਰੀਮੀਅਮ, ਅੱਪਲੋਡ ਸਾਂਝ-ਵਿੰਡੋ ਸ਼ੈਡਿਊਲ ਉੱਤੇ ਖਤਮ ਹੋ ਜਾਂਦੇ ਹਨ। ਅਸੀਂ ਤੁਹਾਡੇ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ।
ਹਾਂ — Free.ai ਖੇਡ ਸਾਊਂਡ ਡਿਜ਼ਾਈਨ, ਫਿਲਮ ਫੋਲੀ, ਪੋਡਕਾਸਟ, ਐਡਵਰਡਸ ਲਈ ਤਿਆਰ ਆਡੀਓ ਦਾ ਵਪਾਰਕ ਵਰਤੋਂ ਕਰਨ ਦਾ ਅਧਿਕਾਰ ਦਿੰਦਾ ਹੈ।
ਪ੍ਰਤੀ ਕਲਿੱਪ5ਤੋਂ 30 ਸਕਿੰਟ। ਵਿਡੀਓ-ਤੋਂ-ਆਡੀਓ ਵਧੇਰੇ ਸਮਾਂ ਲੈਂਦਾ ਹੈ (ਵਿਡੀਓ ਲੰਬਾਈ ਦੇ ਅਨੁਪਾਤ ਵਿੱਚ)। ਟੈਬ ਬੰਦ ਕਰਨ ਲਈ /audio/ ਉੱਤੇ ਕਤਾਰ ਬਟਨ ਵਰਤੋਂ।