MMAudio v2 (video→audio)

Free.ai · audio · ~500 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ clip
~500 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ clip
ଆମର GPUs ଉପରେ ମୁକ୍ତ ଭାବରେ ଚାଲୁଛି। ଏଥିପାଇଁ ଅଦ୍ୟତନ କରନ୍ତୁ MMAudio v2 (video→audio) →

MMAudio v2 (video→audio) ହେଉଛି an AI ନମୂନା। ବାହ୍ୟ ନମୂନା ମାଧ୍ୟମରେ ପଥପ୍ରଦର୍ଶନ କରାଯାଇଛି — ~500 ଟୋକନ ପ୍ରତି ବ୍ୟବହାର ବିଧି (ଉପଧାରା ଖର୍ଚ୍ଚ ଉପରେ 50% ମାର୍କଅପ)।

API ମାଧ୍ୟମରେ ବ୍ୟବହାର କରନ୍ତୁ

OpenAI-ସଂଗତି REST API. ଗୋଟିଏ କି ସୃଷ୍ଟି କରନ୍ତୁ ଏବଂ ସେକଣ୍ଡଗୁଡ଼ିକରେ ଏହି ନମୂନାକୁ ଡକାନ୍ତୁ।

curl -X POST https://api.free.ai/v1/music/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/mmaudio-v2","prompt":"your prompt here"}'
API ଦଲିଲିକରଣ API କି ଗ୍ରହଣ କରନ୍ତୁ

ସାଧାରଣ ପ୍ରଶ୍ନ

MMAudio v2 (video→audio) ଗୋଟିଏ ପାଠ୍ୟ ପ୍ରୋମୋଟ କିମ୍ବା ଭିଡିଓ ସଂଯୋଗରୁ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ପ୍ରଭାବ ଏବଂ ପରିବେଶ ଧ୍ୱନି ସୃଷ୍ଟି କରେ। ପାଦଚିହ୍ନ, ବର୍ଷା, ଯନ୍ତ୍ରାଂଶ, ବିଦେଶୀ ପ୍ରାଣୀର ଚିତ୍କାର - ଧ୍ୱନି ବର୍ଣ୍ଣନା କରିଥାଏ ଏବଂ MMAudio v2 (video→audio) ଏହାକୁ ସଂଯୋଜିତ କରେ।

ସାଧାରଣତଃ ଯନ୍ତ୍ର ଉପରେ ନିର୍ଭର କରି 1 ରୁ 22 ସେକଣ୍ଡ। ଲୁପଯୋଗ୍ୟ ପରିବେଶ ଟ୍ରାକଗୁଡ଼ିକୁ /audio/loop/ ସହିତ ଲମ୍ବାଇ ପାରିବେ।

ହଁ — ଭିଡିଓ-ରୁ-ଧ୍ୱନି ଯନ୍ତ୍ରଗୁଡ଼ିକ ଯେପରିକି MMAudio v2 ଆପଣଙ୍କର ଭିଡିଓରୁ ଫ୍ରେମଗୁଡ଼ିକୁ ପଢ଼ିଥାଏ ଏବଂ ଗୋଟିଏ ମେଳଖାଉଥିବା ଧ୍ୱନି ଟ୍ରାକକୁ ସଂଯୋଜିତ କରିଥାଏ (ପାଦ ଗତି କରିବା ସମୟରେ ପାଦ ଚଲାଇବା, ପାଣି ପଶିବା ସମୟରେ ସ୍ପ୍ଲାଶ କରିବା) । ନିରବ ଭିଡିଓକୁ /v1/audio/from-video/ କିମ୍ବା ଉପର ପୃଷ୍ଠାରେ ଅପଲୋଡ କରନ୍ତୁ।

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଭାବରେ WAV। MP3 ଶୈଳୀ ଚୟନକାରୀରେ ଉପଲବ୍ଧ ଅଛି।

MMAudio v2 (video→audio) ଗୋଟିଏ ପ୍ରୀମିୟମ୍ ଧ୍ୱନି ନମୂନା। ପ୍ରତି କଲିପରେ ପ୍ରାୟ ~1,000–5,000 ଟୋକନ। $1 = 750,000 ଟୋକନ।

ଏହି ଆକାରଗୁଡ଼ିକ ଧ୍ୱନି ପ୍ରଭାବ + ଫୋଲି ପାଇଁ ସଜଡ଼ା ହୋଇଛି, ସଂଗୀତ ନୁହେଁ। ମେଲୋଡିକ ବାଦ୍ୟଯନ୍ତ୍ର କିମ୍ବା ଭୋଜିକାଲ ଟ୍ରାକଗୁଡ଼ିକ ପାଇଁ /music/ ଦେଖନ୍ତୁ ଯେଉଁଠି MusicGen, ACE-Step, Stable Audio ସେହି ମାମଲାକୁ ପରିଚାଳନା କରିଥାଏ।

ହଁ - ପ୍ରୋମୋଟ ବର୍ଣ୍ଣନାମୂଳକ (ଧ୍ୱନି ବର୍ଣ୍ଣନା କରନ୍ତୁ, ଗୀତଗୁଡ଼ିକ ନୁହେଁ), ତେଣୁ ଯେକୌଣସି ଭାଷା କାର୍ଯ୍ୟ କରିଥାଏ ଯେତେବେଳ ପର୍ଯ୍ୟନ୍ତ ନମୁନା ଏହାକୁ ବୁଝିଥାଏ। ଇଂରାଜୀ ସବୁଠାରୁ ସ୍ଥିର ପରିଣାମ ଦେଇଥାଏ।

ହଁ — /batch/ ପ୍ରୋମୋଟର ତାଲିକାକୁ ଗ୍ରହଣ କରିଥାଏ। ପ୍ରତ୍ୟେକ କଲିପ /account/?tab=history ରେ ପହଞ୍ଚିଥାଏ। API ଫୋଲଡର-ବୃକ୍ଷ ସଂରକ୍ଷଣ ପାଇଁ ସବୁଠାରୁ ଲମ୍ବା ପଥ।

ହଁ — /v1/audio/generate/ କୁ POST କରନ୍ତୁ ମଡେଲ="MMAudio v2 (video→audio)" ସହିତ ଏବଂ ଆପଣଙ୍କର ପ୍ରୋମୋଟ (ଅଥବା v2a ଇଞ୍ଜିନଗୁଡ଼ିକ ପାଇଁ ଭିଡିଓ)। /api/ ରେ ସମ୍ପୂର୍ଣ୍ଣ ସଂଯୋଗ ଅଛି।

Free.aiର ବାକି ଅଂଶ ପରି ସମାନ ନୀତି - ଆମ GPUs ଉପରେ ସ୍ୱୟଂ-ହୋଷ୍ଟ, DPA ସହିତ ପ୍ରୀମିୟମ, ଅପଲୋଡଗୁଡ଼ିକ ଅଂଶଧନ-ୱିଣ୍ଡୋ ସମୟସୀମାରେ ସମାପ୍ତ ହୁଏ। ଆମେ ଆପଣଙ୍କର ନିବେଶ ଉପରେ ପ୍ରଶିକ୍ଷଣ ଦେଇନଥାଉ।

ହଁ – Free.ai ଖେଳର ଶବ୍ଦ ଡିଜାଇନ, ଫିଲ୍ମ ଫୋଲି, ପୋଡକାଷ୍ଟ, ବିଜ୍ଞାପନ ପାଇଁ ଉତ୍ପାଦିତ ଅଡିଓର ବାଣିଜ୍ୟିକ ଉପଯୋଗକୁ ଅନୁମତି ପ୍ରଦାନ କରିଥାଏ ।

ପ୍ରତି କ୍ଲିପ5ରୁ 30 ସେକଣ୍ଡ। ଭିଡିଓ-ରୁ-ଧ୍ୱନି ଅଧିକ ସମୟ ଗ୍ରହଣ କରେ (ଭିଡ଼ିଓ ଲମ୍ବ ସହିତ ଅନୁପାତଗତ)। ଟ୍ୟାବକୁ ବନ୍ଦ କରିବା ପାଇଁ /audio/ ରେ ଥିବା ଧାଡ଼ି ବଟନକୁ ବ୍ୟବହାର କରନ୍ତୁ।

Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଏହି ପୃଷ୍ଠାକୁ ଆକଳନ କରନ୍ତୁ