ମୁକ୍ତ ହାୱାଇନ୍ ଅନୁବାଦ

AI ସହିତ ହାୱାଇନ୍ ଧ୍ୱନି ଏବଂ ଭିଡିଓକୁ ପାଠ୍ୟରେ ଅନୁବାଦ କରନ୍ତୁ। ଦ୍ରୁତ, ସଠିକ ଏବଂ ମୁକ୍ତ।

ଏହା କିପରି କାମ କରେ

  1. ଏହି ସ୍ଥାନକୁ ଯାଆନ୍ତୁ Free.ai ଅନୁବାଦକ
  2. ଆପଣଙ୍କର ହାୱାଇନ୍ ଧ୍ୱନି କିମ୍ବା ଭିଡିଓ ଫାଇଲକୁ ଅଦ୍ୟତନ କରନ୍ତୁ
  3. ଆମର AI ସ୍ୱୟଂଚାଳିତ ଭାବରେ ହାୱାଇନ୍ କୁ ଚିହ୍ନଟ କରିଥାଏ ଏବଂ ଏହାକୁ ଅନୁବାଦ କରିଥାଏ
  4. ପାଠ୍ୟ କିମ୍ବା SRT ଉପଶୀର୍ଷକ ଭାବରେ ଆପଣଙ୍କର ଅନୁବାଦକୁ ଆହରଣ କରନ୍ତୁ

ହାୱାଇନ୍ ଅନୁବାଦ ବିଶେଷତାଗୁଡ଼ିକ

  • ଦ୍ରୁତ-ହସିବା ଦ୍ୱାରା ଶକ୍ତି ପ୍ରଦାନ (MIT ଲାଇସେନ୍ସିତ)
  • ସ୍ୱୟଂଚାଳିତ ହାୱାଇନ୍ ଭାଷା ଅନୁସନ୍ଧାନ
  • MP3, WAV, MP4, M4A, FLAC ଏବଂ ଅଧିକକୁ ସମର୍ଥନ କରେ
  • ସମୟସୀମା ଏବଂ ଉପଶୀର୍ଷକ ରପ୍ତାନୀ (SRT)
  • ପୈଠିତ ଯୋଜନାଗୁଡ଼ିକରେ କୌଣସି ଫାଇଲ ଆକାର ସୀମା ନାହିଁ
  • ବ୍ଯକ୍ତିଗତ ଏବଂ ସୁରକ୍ଷିତ -- ଫାଇଲଗୁଡ଼ିକୁ ପ୍ରକ୍ରିୟାକରଣ ପରେ ଅପସାରଣ କରାଯାଏ

ଭାଷା ବିବରଣୀName

ଭାଷାNameହାୱାଇନ୍
ISO ସଂକେତhaw
AI ଆକାରଦ୍ରୁତ-ହସିବା
ମୂଲ୍ୟମୁକ୍ତ

ସାଧାରଣ ପ୍ରଶ୍ନ

ହାୱାଇନ୍ Whisper ପାଇଁ ଗୋଟିଏ କମ୍-ସମ୍ପଦ ଭାଷା - ବଡ଼-v3-ଟର୍ବୋ 25% ଶବ୍ଦ ତ୍ରୁଟି ହାର ଉପରେ, କେବେ କେବେ ଭଲ ଭାବରେ ଉପରକୁ ବସିଛି। ଏହି ଅନୁବାଦ ସନ୍ଧାନ ଏବଂ gist ପାଇଁ ଉପଯୋଗୀ କିନ୍ତୁ ପ୍ରକାଶନ-ସଜ୍ଜିତ ଭାବରେ ବିବେଚନା କରାଯିବା ଉଚିତ ନୁହେଁ। ଯଦି ଗୋଟିଏ ଉଚ୍ଚ-ସଠିକତା ଯନ୍ତ୍ର ହାୱାଇନ୍ ପାଇଁ ଉପଲବ୍ଧ ହୁଏ, ଆମେ ଏହାକୁ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ୱାଇର୍ସରେ ଯୋଗ କରିଥାଉ।(ବେଂକମାର୍କ ସେଟ ଉପରେ ସ୍ତର D, over 25% word error rate – ଆମେ ବିକ୍ରୟ ଦାବି ବଦଳରେ ସଚ୍ଚୋଟ WER ସ୍ତର ପ୍ରକାଶ କରୁ ।)

ହଁ — ହାୱାଇନ୍ ଅନୁବାଦ ପ୍ରଥମେ ଆପଣଙ୍କର ଦୈନିକ ମୁକ୍ତ ଟୋକନ ପୁଲରୁ ଆଣିଥାଏ। ଧ୍ୱନି ପ୍ରତି ମିନିଟରେ ପ୍ରାୟ 50 ଟୋକନ ଖର୍ଚ୍ଚ ହୋଇଥାଏ, ତେଣୁ ଅଜ୍ଞାତ ଦୈନିକ ପୁଲ ପ୍ରତିଦିନ ଧ୍ୱନିର କିଛି ଘଣ୍ଟାକୁ ଆବରଣ କରିଥାଏ। ଲଗଇନ ଖାତାଗୁଡ଼ିକ ବଡ଼ ପୁଲ ଏବଂ 10,000 ସଙ୍ଗୀକରଣ ଟୋକନ ପାଇଥାଏ। ଏହା ପରେ, $1 750,000 ଟୋକନ କିଣେ (~250 ଘଣ୍ଟା ଧ୍ୱନି)।

ହାୱାଇନ୍ ଅନୁବାଦଗୁଡ଼ିକ ଭାଷାର ସାଧାରଣ ବନାନ ସହିତ ମାନକ UTF-8 ରେ ଫେରାଇ ଦିଆଯାଏ।

MP3, WAV, M4A, FLAC, OGG, OPUS, ଏବଂ WEBM କୁ ସିଧାସଳଖ ଗ୍ରହଣ କରାଯାଏ। ଭିଡିଓ ପାଇଁ (MP4, MOV, MKV) ଆମେ ଏହାକୁ Whisper କୁ ପଠାଇବା ପୂର୍ବରୁ ଧ୍ୱନି ଟ୍ରାକକୁ ସର୍ଭର-ପାର୍ଶ୍ୱରୁ କାଢ଼ିବା — ଆପଣ ନିଜେ କିଛି ପରିବର୍ତ୍ତନ କରିବାର ଆବଶ୍ୟକତା ନାହିଁ। ଉତ୍ସ ଭାଷା ସହିତ ସମାନ ପାଇପଲାଇନ, ହାୱାଇନ୍ ଅନ୍ତର୍ଗତ।

ବେନାମି ଅଦ୍ୟତନ ସୀମା ପ୍ରତି ଫାଇଲ ପାଇଁ ପ୍ରାୟ 500 MB। ଲଗଇନ ଖାତାଗୁଡ଼ିକ2GB ପର୍ଯ୍ୟନ୍ତ ଯାଇଥାଏ। ଅବଧିଟି ଏକ କଠିନ ସୀମା ନୁହଁ - ଲମ୍ବା ଫାଇଲଗୁଡ଼ିକୁ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ଚୁଣ୍ଟ କରାଯାଏ (30-ସେକଣ୍ଡର ୱିଣ୍ଡୋଗୁଡ଼ିକ ଅଲଗା ହୋଇଯାଏ) ଏବଂ ନିରନ୍ତର ସମୟସୀମା ସହିତ ଗୋଟିଏ ଏକକ ଟ୍ରାନ୍ସକ୍ରିପ୍ଟକୁ ଫେରିଥାଏ। ବହୁଘଣ୍ଟା ହାୱାଇନ୍ ରେକର୍ଡିଂଗୁଡ଼ିକ (ପଡକାଷ୍ଟ, ସମ୍ପୂର୍ଣ୍ଣ ପାଠ୍ୟ, ସାକ୍ଷାତକାର) ଭଲ ଭାବରେ କାମ କରିଥାଏ।

ହଁ - ପ୍ରତ୍ୟେକ ହାୱାଇନ୍ ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ ପାଇଁ ସ୍ପିକର ଡାଏରିଜମ ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଭାବରେ ଚାଲୁଅଛି। ନିର୍ଗମକୁ ସମୟସୀମା ସହିତ ସ୍ପିକର 1 / ସ୍ପିକର2/ ସ୍ପିକର3ପରି ବିଭକ୍ତ କରାଯାଇଛି, ତେଣୁ ସାକ୍ଷାତକାର, ପ୍ୟାନେଲ ଆଲୋଚନା, ଏବଂ ବହୁପକ୍ଷୀୟ ବୈଠକଗୁଡ଼ିକ ନାମ ଚିହ୍ନିତ ହୋଇ ଫେରି ଆସେ। ଡିଆରାଇଜମ ଗୋଟିଏ ବିଶେଷ ମଡେଲରେ ଚାଲିଥାଏ ଏବଂ ଆମେ ସମର୍ଥନ କରୁଥିବା ସମସ୍ତ ଭାଷାଗୁଡ଼ିକରେ ସମାନ ଭାବରେ କାମ କରେ।

ହଁ — ୟୁଟ୍ୟୁବ ପାଇଁ URL କୁ /transcribe/youtube/ ରେ ଲଗାନ୍ତୁ କିମ୍ବା ପୋଡକାଷ୍ଟ ଫୀଡ (Apple, Spotify, RSS) ପାଇଁ /transcribe/podcast/ ରେ ଲଗାନ୍ତୁ। ଆମେ ଧ୍ୱନିକୁ ଡାଉନଲୋଡ କରୁ, Whisper ମାଧ୍ୟମରେ language=haw ସହିତ ଚଲାଉ, ଏବଂ ସମୟସୀମା ଏବଂ ସ୍ଵରକ ସୂଚକ ସହିତ ଟ୍ରାନସ୍କ୍ରିପ୍ଟକୁ ଫେରାଇ ଦେଉ। ସାମାନ୍ୟ ହାୱାଇନ୍ ବିଷୟବସ୍ତୁ: ଉପସ୍ଥାପନା, ସାକ୍ଷାତକାର, ସ୍ୱର ଚିହ୍ନଟ, ଏବଂ ହାୱାଇନ୍ ରେ YouTube ବିଷୟବସ୍ତୁ ସବୁ କାମ କରୁଛି - URL କୁ /transcribe/youtube/ ରେ ଲଗାନ୍ତୁ କିମ୍ବା ଫାଇଲକୁ ସିଧାସଳଖ ଅପଲୋଡ କରନ୍ତୁ।

Whisper ପ୍ରତି ମିନିଟରେ ଧ୍ୱନି ପାଇଁ 50 ଟୋକନ ଖର୍ଚ୍ଚ କରେ, ତେଣୁ ଗୋଟିଏ ଘଣ୍ଟା ପାଇଁ ରେକର୍ଡିଂ ପାଇଁ ~3,000 ଟୋକନ ଖର୍ଚ୍ଚ ହୋଇଥାଏ। $1 750,000 ଟୋକନ କିଣେ, ଯାହାକି ପ୍ରତି ଡଲାରରେ ପ୍ରାୟ 250 ଘଣ୍ଟା ଧ୍ୱନିକୁ ଥାଏ। ଅଧିକାଂଶ ଚାଳକ କେବେ ବି କିଛି ଖର୍ଚ୍ଚ କରନ୍ତି ନାହିଁ - ମୁକ୍ତ ଦୈନିକ ପୁଲରେ ଛୋଟ ଛୋଟ କ୍ଲପ, ସ୍ୱର ଚିହ୍ନଟ ଏବଂ ଏକାଥରକେ ପଡୋଶୀ ପ

ହଁ — ଦୁଇଟି ଅଂଶ-ସ୍ତର (ପ୍ରତି ~10-30 ସେକଣ୍ଡ) ଏବଂ ଶବ୍ଦ-ସ୍ତର ସମୟସୀମା ଉପଲବ୍ଧ ଅଛି। ଶବ୍ଦ-ସ୍ତର VTT/SRT ଉପଶୀର୍ଷକ ରପ୍ତାନୀ ପାଇଁ ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଯେହେତୁ ଶୀର୍ଷକଗୁଡ଼ିକ ରେଖା-ଦ୍ୱାରା-ରେଖା ସମକାଳୀନ ହୁଏ। API ରେ ଅନୁରୋଧ ଶରୀରରେ ସମୟସୀମା="ଶବ୍ଦ" ସେଟ କରନ୍ତୁ। ହାୱାଇନ୍ ଅନୁବାଦଗୁଡ଼ିକ ଭାଷାର ସାଧାରଣ ବନାନ ସହିତ ମାନକ UTF-8 ରେ ଫେରାଇ ଦିଆଯାଏ।

ହଁ। /v1/transcribe/ ରେ POST ଧ୍ୱନି (ବହୁଭାଗ/ଫର୍ମ-ତାରିଖ, କ୍ଷେତ୍ର ନାମ "ଫାଇଲ") language=haw ସହିତ — କିମ୍ବା Whisper କୁ ସ୍ୱୟଂ-ଖୋଜିବା ପାଇଁ ଭାଷା ପ୍ରାଚଳକୁ ଛାଡ଼ନ୍ତୁ। ଅନୁବାଦ, ଅଂଶ, ସମୟସୀମା, ଏବଂ ବକ୍ତା ସୂଚକ ସହିତ JSON କୁ ଫେରାଇଥାଏ। ସମ୍ପୂର୍ଣ୍ଣ ସଂଯୋଗ ଏବଂ SDK ସ୍ନିପେଟଗୁଡ଼ିକ /api/ ରେ ଅଛି।

ହଁ — ଗୋଟିଏଥର ଅନୁବାଦ ସମାପ୍ତ ହେବା ପରେ, ଅନୁବାଦ କ୍ଲିକ କରନ୍ତୁ କିମ୍ବା ପାଠ୍ୟକୁ /translate/ ରେ ଲଗାନ୍ତୁ। ହାୱାଇନ୍ ଆମେ ସମର୍ଥନ କରୁଥିବା ପ୍ରତ୍ୟେକ ଅନ୍ୟ ଭାଷା ସହିତ ଯୋଡି ହୁଏ (200+)। ସଭା ମିନିଟଗୁଡ଼ିକ ପାଇଁ /summarize/ ମାଧ୍ୟମରେ ଅନୁବାଦକୁ ପାଇପ କରନ୍ତୁ; ଲକ୍ଷ୍ୟ ଭାଷାରେ ଧ୍ୱନି ପ୍ରଦାନ କରିବା ପାଇଁ ଏହାକୁ /voice/tts/ କୁ ପଠାନ୍ତୁ।

Whisper ର ଶବ୍ଦ ପ୍ରଶିକ୍ଷା ଏହି ସ୍ତରରେ କମ୍ ସହାୟତା କରିଥାଏ - ବଟନେକ୍ ହେଉଛି ହାୱାଇନ୍ ଧ୍ୱନି Whisper ପ୍ରଶିକ୍ଷା ସମୟରେ ଦେଖିଥିବା ପରିମାଣ, ଶବ୍ଦ ନୁହେଁ। ସ୍ୱଚ୍ଛ ଷ୍ଟୁଡିଓ ଧ୍ୱନି ବର୍ତ୍ତମାନ ମଧ୍ୟ ଶବ୍ଦ ପ୍ରଶିକ୍ଷାକୁ ପରାସ୍ତ କରିଥାଏ, କିନ୍ତୁ ଉଭୟ ଶବ୍ଦ ପ୍ରଶିକ୍ଷା ଏବଂ ଶବ୍ଦ ପ୍ରଶିକ୍ଷା ଉଚ୍ଚ-ସମ୍ପଦ ଭାଷାରେ ସଠିକତାକୁ ପହଞ୍ଚାଇ ପାରିବ ନାହିଁ।ଯଦି କୌଣସି ଅନୁବାଦଟି ବ୍ୟବହାର ନିଆରା ହୋଇଯାଏ, ତେବେ ଫାଇଲ ସହିତ contact@free.ai କୁ ଇମେଲ କରନ୍ତୁ - ଆମେ ଟୋକନଗୁଡ଼ିକୁ ଫେରସ୍ତ କରିଦେବୁ ଏବଂ ଦେଖିବୁ ଯେ ଅନ୍ୟ କୌଣସି ଇଞ୍ଜିନ ଆପଣଙ୍କର ଧ୍ୱନିକୁ ଭଲ ଭାବରେ ପରିଚାଳନା କରିପାରିବ କି ନାହିଁ।

Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଏହି ପୃଷ୍ଠାକୁ ଆକଳନ କରନ୍ତୁ