AudioLDM 2

Free.ai (self-hosted) · music · ~5000 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ track · 4.0 ରୁ 4 ଏହି ବିଭାଗର ଚାଳକମାନେ
~5000 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ track

AudioLDM 2 ହେଉଛି a ସଂଗୀତ ନିର୍ମାଣ ନମୂନା ଯାହାକି Haohe Liu ଦ୍ୱାରା ନିର୍ମିତ। Music generation from text ରେ ସବୁଠାରୁ ଶକ୍ତିଶାଳୀ । Free.ai GPUs ଉପରେ ସ୍ୱୟଂ-ହୋଷ୍ଟ — ଆପଣଙ୍କର ଦୈନିକ ଟୋକନ ପୁଲ (5,000 ଟୋକନ ପ୍ରତି ଟ୍ରାକ) ବିରୋଧରେ ମୁକ୍ତ ଭାବରେ ଚାଲୁଛି। Apache 2.0 ଅନ୍ତର୍ଗତ ମୁକ୍ତ କରାଯାଇଛି — ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ଅନୁମତି Free.ai ରେ ।

API ମାଧ୍ୟମରେ ବ୍ୟବହାର କରନ୍ତୁ

OpenAI-ସଂଗତି REST API. ଗୋଟିଏ କି ସୃଷ୍ଟି କରନ୍ତୁ ଏବଂ ସେକଣ୍ଡଗୁଡ଼ିକରେ ଏହି ନମୂନାକୁ ଡକାନ୍ତୁ।

curl -X POST https://api.free.ai/v1/music/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"audioldm2","prompt":"your prompt here"}'
API ଦଲିଲିକରଣ API କି ଗ୍ରହଣ କରନ୍ତୁ

ସାଧାରଣ ପ୍ରଶ୍ନ

AudioLDM 2 ଗୋଟିଏ ପାଠ୍ୟ ପ୍ରୋମୋଟରୁ ମୂଳ ବାଦ୍ୟଯନ୍ତ୍ର ସଂଗୀତକୁ ସୃଷ୍ଟିକରେ (ଆଉ କିଛି ଇଞ୍ଜିନରେ, ସ୍ୱର)। ମୌନ, ଶୈଳୀ, ବାଦ୍ୟଯନ୍ତ୍ର, କିମ୍ବା BPM କୁ ବର୍ଣ୍ଣନା କରନ୍ତୁ ଏବଂ AudioLDM 2 ଗୋଟିଏ ସମାପ୍ତ ଧ୍ୱନି ଟ୍ରାକକୁ ଫେରାଇଥାଏ।

ଯନ୍ତ୍ର ଉପରେ ନିର୍ଭର କରି ପ୍ରତି ଉତ୍ପାଦନ ପାଇଁ 10 ରୁ 60 ସେକଣ୍ଡ। ଲମ୍ବା ଅଂଶଗୁଡ଼ିକ ପାଇଁ, /music/stitch/ ମାଧ୍ୟମରେ ଏକାଧିକ ଉତ୍ପାଦନକୁ ସଂଯୋଜିତ କରନ୍ତୁ କିମ୍ବା 30-ସେକଣ୍ଡ ଅଂଶଗୁଡ଼ିକରେ ଉତ୍ପାଦନ କରନ୍ତୁ ଏବଂ କ୍ରସଫେଡ କରନ୍ତୁ।

କିଛି ଯନ୍ତ୍ରଗୁଡ଼ିକ ଆପଣ ପ୍ରଦାନ କରିଥିବା ଗୀତଗୁଡ଼ିକରୁ ଗୀତଗୁଡ଼ିକୁ ସଂଯୋଜିତ କରିଥାଏ (ଫର୍ମରେ ଗୀତଗୁଡ଼ିକୁ ଲଗାନ୍ତୁ); ଅନ୍ୟମାନେ କେବଳ ବାଦ୍ୟଯନ୍ତ୍ର-ସହାୟକ ଅଟନ୍ତି। ଏହି ପୃଷ୍ଠାରେ ଫର୍ମକୁ ଯାଞ୍ଚ କରନ୍ତୁ - ଗୀତଗୁଡ଼ିକ କ୍ଷେତ୍ରର ଅର୍ଥ ଗୀତଗୁଡ଼ିକ ସମର୍ଥିତ।

ପପ, ରକ୍, EDM, ଜାଜ, ଆମ୍ବିୟେଣ୍ଟ, କ୍ଲାସିକ, ଲୋ-ଫାଇ, ହିପ-ହୋପ ବାଦ୍ୟଯନ୍ତ୍ର ସବୁକିଛି ଯଥେଷ୍ଟ ଭାବରେ ପ୍ରଦର୍ଶନ କରିଥାଏ । ନିଚ ପ୍ରକାରର (ଗମେଲାନ, କର୍ଣ୍ଣାଟିକ, ଗର୍ଭ ଗୀତ) ଦୁର୍ବଳ ଅଟେ — ଶ୍ରେଷ୍ଠ ଫଳାଫଳ ପାଇଁ ବାଦ୍ୟଯନ୍ତ୍ରକୁ ସ୍ପଷ୍ଟ ଭାବରେ ବର୍ଣ୍ଣନା କରନ୍ତୁ ।

AudioLDM 2 ଆମର ନିଜ GPUs ଉପରେ ଆପଣଙ୍କର ଦୈନିକ ମୁକ୍ତ ପୁଲ ବିରୋଧରେ ପ୍ରଥମେ ଚଲାଇଥାଏ; $5 → 200,000 ପୈଠିତ ଟୋକନ ପରେ। ପ୍ରତି ଟ୍ରାକ ପାଇଁ ପ୍ରାୟ ~5,000 ଟୋକନ।

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଭାବରେ WAV (ନଷ୍ଟହୀନ, ଆଗକୁ ମିଶ୍ରଣ ପାଇଁ ପ୍ରସ୍ତୁତ)। MP3 ଛୋଟ ଫାଇଲଗୁଡ଼ିକ ପାଇଁ ନିର୍ଗମ ଚୟନକର୍ତ୍ତାରେ ଉପଲବ୍ଧ।

ନା - AudioLDM 2 ଏକ ମିଶ୍ରିତ ଟ୍ରାକକୁ ଫେରାଇଥାଏ। ଷ୍ଟେମଗୁଡ଼ିକରେ ବିଭାଜିତ କରିବା ପାଇଁ, ନିର୍ଗମକୁ /music/separate/ ମାଧ୍ୟମରେ ଚଲାନ୍ତୁ ଯାହାକି Demucs କୁ ବ୍ୟବହାର କରି ଭୋକାଲ, ଡ୍ରାମ, ବେସ, ଏବଂ ଅନ୍ୟାନ୍ୟକୁ ବାହାର କରିଥାଏ।

ହଁ — /batch/ ପ୍ରୋମୋଟର ତାଲିକାକୁ ଗ୍ରହଣ କରିଥାଏ। ପ୍ରତ୍ୟେକ ଟ୍ରାକ /account/?tab=history ରେ ପ୍ରୋମୋଟର ସହିତ ଫାଇଲନାମ ସହିତ ପହଞ୍ଚିଥାଏ। ଅଧିକ ନିୟନ୍ତ୍ରଣ ପାଇଁ, API କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ହଁ — /v1/music/generate/ ରେ ଆପଣଙ୍କର ପ୍ରୋମୋଟକୁ POST କରନ୍ତୁ ଯାହାର ମଡେଲ="AudioLDM 2"। /api/ ରେ ଗୀତର ଶବ୍ଦ, ସମୟ ଏବଂ ଟେମ୍ପୋ ପରିମାପ ସହିତ ସମ୍ପୂର୍ଣ୍ଣ ସଂଯୋଗ ଅଛି।

AudioLDM 2 କପିରେଟ ସଂଗୀତକୁ ପୁନଃନିର୍ମାଣ କରେ ନାହିଁ - ନିର୍ଗମଗୁଡିକ ନୂତନ ଭାବରେ ସଂଶ୍ଳୋଧିତ ହୋଇଥାଏ। Free.ai ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ; ଆପଣ ଆପଣଙ୍କର ନିର୍ଗମ ଟ୍ରାକଗୁଡ଼ିକର ଅଧିକାର ରଖିଥାନ୍ତି। ପ୍ରୋମ୍ରେ ଜଣେ କଳାକାରଙ୍କ ନାମ ପଚାରିବା "ର ଶୈଳୀରେ" - ପ୍ରକୃତ ଧ୍ୱନିଟି ପ୍ରକୃତ।

15 ସେକଣ୍ଡରୁ2ମିନିଟ ପ୍ରତି ଟ୍ରାକ ସମୟ ଅବଧି + ଇଞ୍ଜିନ ଉପରେ ନିର୍ଭର କରିଥାଏ। ପ୍ରିମିଆ ମଡେଲ ଦ୍ରୁତ ଭାବରେ ସମାପ୍ତ ହୋଇଥାଏ। ଟ୍ୟାବକୁ ବନ୍ଦ କରିବା ପାଇଁ ଧାଡ଼ି ବଟନକୁ ବ୍ୟବହାର କରନ୍ତୁ - ସମାପ୍ତ ହେବା ପରେ ଫଳାଫଳ /account/?tab=history ରେ ପହଞ୍ଚିଥାଏ।

ହଁ — ବିଫଳ ରେଣ୍ଡର ସ୍ୱୟଂ-ପୂରଣ। ଟ୍ରାକଗୁଡ଼ିକ ପାଇଁ ଯାହା ଚାଲୁଥାଏ କିନ୍ତୁ ଖରାପ ସ୍ୱର, ଯୋଗାଯୋଗ@free.ai କୁ ଅଂଶଗ୍ରହଣ ସଂଯୋଗ ସହିତ ଇମେଲ କରନ୍ତୁ ଏବଂ ଆମେ ମାମଲା-ପ୍ରତି-କଥା ଯାଞ୍ଚ କରିବୁ।

Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଏହି ପୃଷ୍ଠାକୁ ଆକଳନ କରନ୍ତୁ