ମୁକ୍ତ ଆରବିକ୍ ଅନୁବାଦ

AI ସହିତ ଆରବିକ୍ ଧ୍ୱନି ଏବଂ ଭିଡିଓକୁ ପାଠ୍ୟରେ ଅନୁବାଦ କରନ୍ତୁ। ଦ୍ରୁତ, ସଠିକ ଏବଂ ମୁକ୍ତ।

ଏହା କିପରି କାମ କରେ

  1. ଏହି ସ୍ଥାନକୁ ଯାଆନ୍ତୁ Free.ai ଅନୁବାଦକ
  2. ଆପଣଙ୍କର ଆରବିକ୍ ଧ୍ୱନି କିମ୍ବା ଭିଡିଓ ଫାଇଲକୁ ଅଦ୍ୟତନ କରନ୍ତୁ
  3. ଆମର AI ସ୍ୱୟଂଚାଳିତ ଭାବରେ ଆରବିକ୍ କୁ ଚିହ୍ନଟ କରିଥାଏ ଏବଂ ଏହାକୁ ଅନୁବାଦ କରିଥାଏ
  4. ପାଠ୍ୟ କିମ୍ବା SRT ଉପଶୀର୍ଷକ ଭାବରେ ଆପଣଙ୍କର ଅନୁବାଦକୁ ଆହରଣ କରନ୍ତୁ

ଆରବିକ୍ ଅନୁବାଦ ବିଶେଷତାଗୁଡ଼ିକ

  • ଦ୍ରୁତ-ହସିବା ଦ୍ୱାରା ଶକ୍ତି ପ୍ରଦାନ (MIT ଲାଇସେନ୍ସିତ)
  • ସ୍ୱୟଂଚାଳିତ ଆରବିକ୍ ଭାଷା ଅନୁସନ୍ଧାନ
  • MP3, WAV, MP4, M4A, FLAC ଏବଂ ଅଧିକକୁ ସମର୍ଥନ କରେ
  • ସମୟସୀମା ଏବଂ ଉପଶୀର୍ଷକ ରପ୍ତାନୀ (SRT)
  • ପୈଠିତ ଯୋଜନାଗୁଡ଼ିକରେ କୌଣସି ଫାଇଲ ଆକାର ସୀମା ନାହିଁ
  • ବ୍ଯକ୍ତିଗତ ଏବଂ ସୁରକ୍ଷିତ -- ଫାଇଲଗୁଡ଼ିକୁ ପ୍ରକ୍ରିୟାକରଣ ପରେ ଅପସାରଣ କରାଯାଏ

ଭାଷା ବିବରଣୀName

ଭାଷାNameଆରବିକ୍
ISO ସଂକେତar
AI ଆକାରଦ୍ରୁତ-ହସିବା
ମୂଲ୍ୟମୁକ୍ତ

ସାଧାରଣ ପ୍ରଶ୍ନ

Whisper large-v3-turbo ଆରବିକ୍ କୁ ସଠିକ ଭାବରେ ପରିଚାଳନା କରେ - ବେଞ୍ଚମାର୍କ ଧ୍ୱନିରେ 7-15% ଶବ୍ଦ ତ୍ରୁଟି ହାର। ନାମିତ ସତ୍ତା, ସଂଖ୍ୟା, ଏବଂ ଘନ ବୈଷୟିକ ଶବ୍ଦଭଣ୍ଡାରରେ ଅଚାନକ ପ୍ରତିସ୍ଥାପନକୁ ଆଶା କରନ୍ତୁ; ଟ୍ରାନ୍ସକ୍ରିପ୍ଟର ଅଧିକାଂଶ ସଠିକ ହେବ।(ବେଂକମାର୍କ ସେଟ ଉପରେ ସ୍ତର B, 7-15% word error rate – ଆମେ ବିକ୍ରୟ ଦାବି ବଦଳରେ ସଚ୍ଚୋଟ WER ସ୍ତର ପ୍ରକାଶ କରୁ ।)

ହଁ — ଆରବିକ୍ ଅନୁବାଦ ପ୍ରଥମେ ଆପଣଙ୍କର ଦୈନିକ ମୁକ୍ତ ଟୋକନ ପୁଲରୁ ଆଣିଥାଏ। ଧ୍ୱନି ପ୍ରତି ମିନିଟରେ ପ୍ରାୟ 50 ଟୋକନ ଖର୍ଚ୍ଚ ହୋଇଥାଏ, ତେଣୁ ଅଜ୍ଞାତ ଦୈନିକ ପୁଲ ପ୍ରତିଦିନ ଧ୍ୱନିର କିଛି ଘଣ୍ଟାକୁ ଆବରଣ କରିଥାଏ। ଲଗଇନ ଖାତାଗୁଡ଼ିକ ବଡ଼ ପୁଲ ଏବଂ 10,000 ସଙ୍ଗୀକରଣ ଟୋକନ ପାଇଥାଏ। ଏହା ପରେ, $1 750,000 ଟୋକନ କିଣେ (~250 ଘଣ୍ଟା ଧ୍ୱନି)।

ଆରବୀକୁ ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଭାବରେ ଆଧୁନିକ ମାନକ ଆରବୀ (MSA) ସ୍ତରରେ ପରିଚାଳିତ ହୋଇଥାଏ। ଇଜିପ୍ଶୀୟ, ଲେଭାଣ୍ଟାଇନ, ଗଲଫ, ଏବଂ ମଗ୍ରେବି ସରଳ ଭାଷାଗୁଡ଼ିକ ପରିଚିତ ହେଲେ ମଧ୍ୟ MSA ବନାନରେ ଅନୁବାଦ କରାଯାଏ - Whisper Romanize କରିନଥାଏ କିମ୍ବା ଭାଷା-ନିର୍ଦ୍ଦିଷ୍ଟ ବନାନକୁ ସଂରକ୍ଷଣ କରିନଥାଏ। ପବିତ୍ର MSA ଖବର/ବକ୍ତବ୍ୟ ଧ୍ୱନି ପାଇଁ ସ୍ତର-B ସଠିକତା ଆଶା କରନ୍ତୁ; ତୀବ୍ର ମଗ୍ରେବି କିମ୍ବା ଇଜିପ୍ଶୀୟ ସରଳ ଭାଷାଗୁଡ଼ିକ ଏହାକୁ ନିମ୍ନକୁ ଦବାଇଥାଏ।

MP3, WAV, M4A, FLAC, OGG, OPUS, ଏବଂ WEBM କୁ ସିଧାସଳଖ ଗ୍ରହଣ କରାଯାଏ। ଭିଡିଓ ପାଇଁ (MP4, MOV, MKV) ଆମେ ଏହାକୁ Whisper କୁ ପଠାଇବା ପୂର୍ବରୁ ଧ୍ୱନି ଟ୍ରାକକୁ ସର୍ଭର-ପାର୍ଶ୍ୱରୁ କାଢ଼ିବା — ଆପଣ ନିଜେ କିଛି ପରିବର୍ତ୍ତନ କରିବାର ଆବଶ୍ୟକତା ନାହିଁ। ଉତ୍ସ ଭାଷା ସହିତ ସମାନ ପାଇପଲାଇନ, ଆରବିକ୍ ଅନ୍ତର୍ଗତ।

ବେନାମି ଅଦ୍ୟତନ ସୀମା ପ୍ରତି ଫାଇଲ ପାଇଁ ପ୍ରାୟ 500 MB। ଲଗଇନ ଖାତାଗୁଡ଼ିକ2GB ପର୍ଯ୍ୟନ୍ତ ଯାଇଥାଏ। ଅବଧିଟି ଏକ କଠିନ ସୀମା ନୁହଁ - ଲମ୍ବା ଫାଇଲଗୁଡ଼ିକୁ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ଚୁଣ୍ଟ କରାଯାଏ (30-ସେକଣ୍ଡର ୱିଣ୍ଡୋଗୁଡ଼ିକ ଅଲଗା ହୋଇଯାଏ) ଏବଂ ନିରନ୍ତର ସମୟସୀମା ସହିତ ଗୋଟିଏ ଏକକ ଟ୍ରାନ୍ସକ୍ରିପ୍ଟକୁ ଫେରିଥାଏ। ବହୁଘଣ୍ଟା ଆରବିକ୍ ରେକର୍ଡିଂଗୁଡ଼ିକ (ପଡକାଷ୍ଟ, ସମ୍ପୂର୍ଣ୍ଣ ପାଠ୍ୟ, ସାକ୍ଷାତକାର) ଭଲ ଭାବରେ କାମ କରିଥାଏ।

ହଁ - ପ୍ରତ୍ୟେକ ଆରବିକ୍ ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ ପାଇଁ ସ୍ପିକର ଡାଏରିଜମ ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଭାବରେ ଚାଲୁଅଛି। ନିର୍ଗମକୁ ସମୟସୀମା ସହିତ ସ୍ପିକର 1 / ସ୍ପିକର2/ ସ୍ପିକର3ପରି ବିଭକ୍ତ କରାଯାଇଛି, ତେଣୁ ସାକ୍ଷାତକାର, ପ୍ୟାନେଲ ଆଲୋଚନା, ଏବଂ ବହୁପକ୍ଷୀୟ ବୈଠକଗୁଡ଼ିକ ନାମ ଚିହ୍ନିତ ହୋଇ ଫେରି ଆସେ। ଡିଆରାଇଜମ ଗୋଟିଏ ବିଶେଷ ମଡେଲରେ ଚାଲିଥାଏ ଏବଂ ଆମେ ସମର୍ଥନ କରୁଥିବା ସମସ୍ତ ଭାଷାଗୁଡ଼ିକରେ ସମାନ ଭାବରେ କାମ କରେ।

ହଁ — ୟୁଟ୍ୟୁବ ପାଇଁ URL କୁ /transcribe/youtube/ ରେ ଲଗାନ୍ତୁ କିମ୍ବା ପୋଡକାଷ୍ଟ ଫୀଡ (Apple, Spotify, RSS) ପାଇଁ /transcribe/podcast/ ରେ ଲଗାନ୍ତୁ। ଆମେ ଧ୍ୱନିକୁ ଡାଉନଲୋଡ କରୁ, Whisper ମାଧ୍ୟମରେ language=ar ସହିତ ଚଲାଉ, ଏବଂ ସମୟସୀମା ଏବଂ ସ୍ଵରକ ସୂଚକ ସହିତ ଟ୍ରାନସ୍କ୍ରିପ୍ଟକୁ ଫେରାଇ ଦେଉ। ସାମାନ୍ୟ ଆରବିକ୍ ବିଷୟବସ୍ତୁ: ଆରବିକ୍ ରେ ଖବର କଲିପ, ପ୍ରଚାର, ଉପସ୍ଥାପନା, ଏବଂ ରାଜନୈତିକ ସାକ୍ଷାତକାର ସବୁଠାରୁ ସାଧାରଣ କାର୍ଯ୍ୟ ଧାରଣ; /transcribe/youtube/ ରେ YouTube URLକୁ ଚିପିଦିଅନ୍ତୁ କିମ୍ବା ଫାଇଲକୁ ଅପଲୋଡ କରନ୍ତୁ।

Whisper ପ୍ରତି ମିନିଟରେ ଧ୍ୱନି ପାଇଁ 50 ଟୋକନ ଖର୍ଚ୍ଚ କରେ, ତେଣୁ ଗୋଟିଏ ଘଣ୍ଟା ପାଇଁ ରେକର୍ଡିଂ ପାଇଁ ~3,000 ଟୋକନ ଖର୍ଚ୍ଚ ହୋଇଥାଏ। $1 750,000 ଟୋକନ କିଣେ, ଯାହାକି ପ୍ରତି ଡଲାରରେ ପ୍ରାୟ 250 ଘଣ୍ଟା ଧ୍ୱନିକୁ ଥାଏ। ଅଧିକାଂଶ ଚାଳକ କେବେ ବି କିଛି ଖର୍ଚ୍ଚ କରନ୍ତି ନାହିଁ - ମୁକ୍ତ ଦୈନିକ ପୁଲରେ ଛୋଟ ଛୋଟ କ୍ଲପ, ସ୍ୱର ଚିହ୍ନଟ ଏବଂ ଏକାଥରକେ ପଡୋଶୀ ପ

ହଁ — ଦୁଇଟି ଅଂଶ-ସ୍ତର (ପ୍ରତି ~10-30 ସେକଣ୍ଡ) ଏବଂ ଶବ୍ଦ-ସ୍ତର ସମୟସୀମା ଉପଲବ୍ଧ ଅଛି। ଶବ୍ଦ-ସ୍ତର VTT/SRT ଉପଶୀର୍ଷକ ରପ୍ତାନୀ ପାଇଁ ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଯେହେତୁ ଶୀର୍ଷକଗୁଡ଼ିକ ରେଖା-ଦ୍ୱାରା-ରେଖା ସମକାଳୀନ ହୁଏ। API ରେ ଅନୁରୋଧ ଶରୀରରେ ସମୟସୀମା="ଶବ୍ଦ" ସେଟ କରନ୍ତୁ। ଆରବିକ୍ ଟ୍ରାନ୍ସକ୍ରିପ୍ଟଗୁଡ଼ିକୁ ସେମାନଙ୍କର ସ୍ଥାନୀୟ ଡାହାଣରୁ ବାମ ସ୍କ୍ରିପ୍ଟରେ ଫେରାଇ ଦିଆଯାଏ ଏବଂ ଯେକୌଣସି RTL-ସଚେତନ ପ୍ରଦର୍ଶକ (ବ୍ରାଉଜର, ଶବ୍ଦ, Google Docs) ରେ ସଠିକ ଭାବରେ ପ୍ରଦର୍ଶନ କରିଥାଏ।

ହଁ। /v1/transcribe/ ରେ POST ଧ୍ୱନି (ବହୁଭାଗ/ଫର୍ମ-ତାରିଖ, କ୍ଷେତ୍ର ନାମ "ଫାଇଲ") language=ar ସହିତ — କିମ୍ବା Whisper କୁ ସ୍ୱୟଂ-ଖୋଜିବା ପାଇଁ ଭାଷା ପ୍ରାଚଳକୁ ଛାଡ଼ନ୍ତୁ। ଅନୁବାଦ, ଅଂଶ, ସମୟସୀମା, ଏବଂ ବକ୍ତା ସୂଚକ ସହିତ JSON କୁ ଫେରାଇଥାଏ। ସମ୍ପୂର୍ଣ୍ଣ ସଂଯୋଗ ଏବଂ SDK ସ୍ନିପେଟଗୁଡ଼ିକ /api/ ରେ ଅଛି।

ହଁ — ଗୋଟିଏଥର ଅନୁବାଦ ସମାପ୍ତ ହେବା ପରେ, ଅନୁବାଦ କ୍ଲିକ କରନ୍ତୁ କିମ୍ବା ପାଠ୍ୟକୁ /translate/ ରେ ଲଗାନ୍ତୁ। ଆରବିକ୍ ଆମେ ସମର୍ଥନ କରୁଥିବା ପ୍ରତ୍ୟେକ ଅନ୍ୟ ଭାଷା ସହିତ ଯୋଡି ହୁଏ (200+)। ସଭା ମିନିଟଗୁଡ଼ିକ ପାଇଁ /summarize/ ମାଧ୍ୟମରେ ଅନୁବାଦକୁ ପାଇପ କରନ୍ତୁ; ଲକ୍ଷ୍ୟ ଭାଷାରେ ଧ୍ୱନି ପ୍ରଦାନ କରିବା ପାଇଁ ଏହାକୁ /voice/tts/ କୁ ପଠାନ୍ତୁ।

Whisper କୁ ଶହ ହଜାର ଘଣ୍ଟା ଧାର୍ମିକ ଧ୍ୱନି ଉପରେ ପ୍ରଶିକ୍ଷଣ ଦିଆଯାଇଥାଏ, ତେଣୁ ଏହା ପୃଷ୍ଠଭୂମି ଧ୍ୱନି ଏବଂ ଆରବିକ୍ ରେ ଫୋନ-ଗୁଣମାନର ରେକର୍ଡିଂକୁ ସହ୍ୟ କରିଥାଏ। ଶ୍ରେଷ୍ଠ ଫଳାଫଳ ପାଇଁ, ସ୍ୱଚ୍ଛ ଧ୍ୱନି ଯୋଗାଇଦିଅନ୍ତୁ (ହେଡସେଟ ମାଇକ, କୌଣସି ସଂଗୀତ ବେଡ ନାହିଁ) - ଏହି ସ୍ତରରେ ଧ୍ୱନି ଆଧାର ତ୍ରୁଟି ହାରକୁ ବୃଦ୍ଧି କରିଥାଏ।ଯଦି କୌଣସି ଅନୁବାଦଟି ବ୍ୟବହାର ନିଆରା ହୋଇଯାଏ, ତେବେ ଫାଇଲ ସହିତ contact@free.ai କୁ ଇମେଲ କରନ୍ତୁ - ଆମେ ଟୋକନଗୁଡ଼ିକୁ ଫେରସ୍ତ କରିଦେବୁ ଏବଂ ଦେଖିବୁ ଯେ ଅନ୍ୟ କୌଣସି ଇଞ୍ଜିନ ଆପଣଙ୍କର ଧ୍ୱନିକୁ ଭଲ ଭାବରେ ପରିଚାଳନା କରିପାରିବ କି ନାହିଁ।

Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଏହି ପୃଷ୍ଠାକୁ ଆକଳନ କରନ୍ତୁ