အိုက်စ်လန် ဘာသာပြန်ချက်
AI နှင့်အတူစာသားကို transcribe အိုက်စ်လန် audio နှင့်ဗီဒီယို။ မြန်ဆန်, တိကျ, နှင့်အခမဲ့။
အလုပ်လုပ်ပုံ
- ဆီသို့သွားပါ Free.ai ဘာသာပြန်သူ
- အိုက်စ်လန် အသံ/ဗီဒီယိုဖိုင်ကိုတင်ပါ
- ကျွန်တော်တို့ရဲ့ AI အိုက်စ်လန် အလိုအလျောက်ရှာဖွေတွေ့ရှိပြီး transcribes
- စာသားသို့မဟုတ် SRT subtitles အဖြစ်သင်၏ transcript ကို download လုပ်ပါ
အိုက်စ်လန် ဘာသာပြန်ခြင်း အင်္ဂါရပ်များ
- ✓မြန်-အော်ဟစ်အားဖြင့် Powered (MIT လိုင်စင်)
- ✓အိုက်စ်လန် ဘာသာစကားကို အလိုအလျောက် ရှာဖွေ
- ✓MP3, WAV, MP4, M4A, FLAC, နှင့်ပိုမိုထောက်ခံ
- ✓အချိန်အမှတ်များနှင့်စာသားအောက်ခံများ တင်ပို့ခြင်း (SRT)
- ✓ပေးဆောင်ပရောဂျက်များပေါ်တွင်ဖိုင်အရွယ်အစားကန့်သတ်ချက်မရှိ
- ✓သီးခြားနှင့်လုံခြုံ -- ဖိုင်များကိုစီမံပြီးမှပယ်ဖျက်သည်
ဘာသာစကား အသေးစိတ်များ
| ဘာသာစကား | အိုက်စ်လန် |
| ISO ကုဒ် | is |
| AI မော်ဒယ် | မြန်မြန်-အော်ဟစ် |
| ဈေးနှုန်း | လွတ်လပ်မှု |
ဘာသာစကားများ
ဘာသာစကားအားလုံးကိုကြည့်ပါFAQ
အိုက်စ်လန် Whisper အတွက်နည်းနည်း-resourced ဘာသာစကားဖြစ်ပါသည် - ကြီးမားတဲ့-v3-turbo အပေါ်ထိုင် 25% စကားလုံးအမှားနှုန်း, တစ်ခါတစ်ရံကောင်းစွာအထက်တွင်. အဆိုပါ transcript ကိုရှာဖွေရေးနှင့် gist အတွက်အသုံးဝင်သည်, ဒါပေမယ့်ထုတ်ဝေ-အဆင်သင့်အဖြစ်ကုသခြင်းမခံသင့်. မြင့်မားသော-တိကျမှုအင်ဂျင် အိုက်စ်လန် အတွက်ရရှိနိုင်ဖြစ်လာလျှင်, ကျွန်တော်တို့ဟာအလိုအလျောက် wire ကိုထဲမှာ.(Tier D, over 25% word error rate benchmark sets အပေါ် - ကျွန်တော်တို့ဟာစျေးကွက်ရှာဖွေရေးတောင်းဆိုမှုများထက်ရိုးသားတဲ့ WER tiers ကိုထုတ်ဝေ။ )
ဟုတ်ကဲ့ — အိုက်စ်လန် transcription သင့်ရဲ့နေ့စဉ်အခမဲ့ token ကိုရေကန်ကနေပထမဦးဆုံးဆွဲ. Audio ကိုအကြောင်းကိုကုန်ကျစရိတ် 50 မိနစ်လျှင် tokens, ဒါကြောင့်အမည်မဲ့နေ့စဉ်ရေကန်တစ်နေ့လျှင် audio ကို၏နာရီအနည်းငယ်ကိုဖုံးလွှမ်း. Signed-in အကောင့်များပိုကြီးတဲ့ရေကန်ပထမဦးဆုံးရ 10,000 signup tokens. လွန်ခဲ့သော, $1 ဝယ် 750,000 tokens (~250 audio ကိုနာရီ).
အိုက်စ်လန် transcripts ဘာသာစကား၏ပုံမှန်စာလုံးပေါင်းနှင့်အတူစံ UTF-8 မှာပြန်လာကြသည်။
MP3, WAV, M4A, FLAC, OGG, OPUS, နှင့် WEBM တိုက်ရိုက်လက်ခံကြသည်။ ဗီဒီယိုများအတွက် (MP4, MOV, MKV) ကျွန်တော်တို့ဟာ Whisper သို့ပို့ဆောင်မတိုင်မီ audio track ကို server-side ကိုထုတ်ယူ — သင်ကိုယ်တိုင်ဘာမှပြောင်းလဲရန်မလိုပါ. တူညီတဲ့ပိုက်လိုင်းအရင်းအမြစ်ဘာသာစကားမပါဘဲ, အိုက်စ်လန် အပါအဝင်.
အမည်မဲ့ upload များအနည်းငယ်မှာခေါင်း 500 MB ကိုဖိုင်တစ်ဖိုင်. မှတ်ပုံတင်-in အကောင့်များ2GB အထိသွား. ကြာချိန်သည်အလွန်အမင်းအကနင်းမဟုတ်ပါ - ကြာရှည်ဖိုင်များကိုအလိုအလျောက် chunked နေကြတယ် (30-စက္ကန့် windows များအထပ်ထပ်နှင့်အတူ) နှင့်ဆက်လက်အချိန်စင်ကြယ်သောအတူတစ်ဦးတည်း transcript သို့ပြန်ချည်. Multi-နာရီ အိုက်စ်လန် မှတ်တမ်းတင် (podcasts, အပြည့်အဝသင်တန်း, တွေ့ဆုံ) ကောင်းစွာအလုပ်လုပ်.
ဟုတ်ကဲ့ — speaker diarization အားလုံး အိုက်စ်လန် transcript အတွက် default အားဖြင့်ပေါ်တွင်ဖြစ်ပါသည်. ထုတ်ကုန် Speaker အဖြစ် segmented ခံရသည် 1 / Speaker2/ Speaker3timestamps နှင့်အတူ, ဒါကြောင့်အင်တာဗျူး, panel ကိုဆွေးနွေး, နှင့် multi-ပါတီအစည်းအဝေးများ label ကိုပြန်လာ. Diarization သီးခြားမော်ဒယ်ပေါ်တွင် runs နှင့်ကျွန်ုပ်တို့ထောက်ခံသောဘာသာစကားအားလုံးအကြားတူညီသောအလုပ်လုပ်.
ဟုတ်ကဲ့ — YouTube ကိုသို့မဟုတ် podcast feeds များအတွက် / transcribe / podcast / ထဲသို့ URL ကို paste (Apple, Spotify, RSS). ကျနော်တို့အသံကိုဒေါင်းလုပ်, language = is နှင့်အတူ Whisper မှတဆင့်၎င်းကို run, နှင့်အချိန်စတိုင်နှင့်ပြောဆိုသူလိပ်စာများနှင့်အတူ transcript ကိုပြန်ပို့. ယေဘုယျအားဖြင့် အိုက်စ်လန် အကြောင်းအရာ: အိုက်စ်လန် အားလုံးအလုပ် — / transcribe / youtube / သို့ URL ကို paste သို့မဟုတ်တိုက်ရိုက်ဖိုင်ကို upload.
Whisper အကြောင်းကိုကုန်ကျစရိတ် 50 audio ကိုမိနစ်လျှင် tokens, ဒါကြောင့်တစ်နာရီမှတ်တမ်းတင် ~3,000 tokens ဖြစ်ပါတယ်။ $1 ဝယ် 750,000 tokens, မည်သည့်အကြမ်းဖျင်းအလုပ်လုပ် 250 ဒေါ်လာတစ်ဒေါ်လာလျှင် audio ကိုနာရီ။ အများစုမှာအသုံးပြုသူများသည်ဘာမှမသုံးစွဲပါ - အခမဲ့နေ့စဉ်ရေကန်အတိုကောက် clip များကိုဖုံးလွှမ်း, အသံမှတ်စုများ, နှင့်တစ်ဦး-off podcasts ။
ဟုတ်ကဲ့ — နှစ်ဦးစလုံး segment-အဆင့် (တစ်ခါတစ်ရံ ~ 10-30 စက္ကန့်) နှင့်စကားလုံး-အဆင့် timestamps ရရှိနိုင်. စကားလုံး-အဆင့် VTT / SRT ရုပ်သံဇာတ်လမ်းတွဲတင်ပို့ဖို့ default ဖြစ်ပါတယ်ဒါကြောင့်စာသားလိုင်း-by-line ကို sync. API ကို set ကို timestamps အပေါ် "စကားလုံး" တောင်းဆိုချက်ကိုယ်ခန္ဓာထဲမှာ. အိုက်စ်လန် transcripts ဘာသာစကား၏ပုံမှန်စာလုံးပေါင်းနှင့်အတူစံ UTF-8 မှာပြန်လာကြသည်။
ဟုတ်ကဲ့. POST audio (multipart / form-data, field name "file") to /v1/transcribe/ with language=is — or omit the language parameter to let Whisper auto-detect. အဆိုပါ transcript နှင့်အတူ JSON ကိုပြန်လာ, segments, timestamps, နှင့် Speaker labels. Full reference and SDK snippets at /api/.
ဟုတ်ကဲ့ — တစ်ခါ transcription ပြီးဆုံး, ကလစ်နှိပ်ပါ ဘာသာပြန်သို့မဟုတ် / translate / ထဲသို့စာသားကို paste. အိုက်စ်လန် ကျွန်တော်တို့ထောက်ခံသောအခြားဘာသာစကားအားလုံးနှင့်အတူစုံတွဲများ (200+). တွေ့ဆုံမိနစ် pipe ကို / summarize / မှတဆင့် transcript ကိုများအတွက်; ဘာသာပြန်များအတွက် / voice / tts / ရည်မှန်းချက်ဘာသာစကားတွင်အသံကို render ဖို့ပို့.
Whisper ရဲ့အသံအသံလေ့ကျင့်ခန်းဒီအဆင့်မှာနည်းနည်းကူညီ - တံတားပေါက်အရေအတွက် အိုက်စ်လန် audio Whisper လေ့ကျင့်ခန်းအတွင်းမြင်, အသံမဟုတ်. Clean စတူဒီယိုအသံကအစဉ်အဆက်အနိုင်ရ, ဒါပေမယ့်သင်အမြင့်-အရင်းအမြစ်ဘာသာစကားအပေါ်ရလိမ့်မယ်တိကျမှုရောက်ရှိမည်မဟုတ်.မှတ်တမ်းတစ်စောင်ကို အသုံးပြုလို့မရတော့လျှင် contact@free.ai သို့ အီးမေးလ်ပို့ပါ။