Wizper (Whisper v3)
Free.ai
·
stt
·
~500 တန်ဖိုးများ minute
Wizper (Whisper v3) a ဘာသာစကားမှစာသားသို့ ပုံစံ ဖြစ်ပါတယ်။ ပြင်ပမော်ဒယ်များမှတဆင့်လမ်းကြောင်း - ~ 500 tokens မိနစ် (50% upstream ကုန်ကျစရိတ်ထက် markup).
API မှတဆင့်အသုံးပြု
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
API မှတ်တမ်း
API Key ကိုရယူပါ
မေးလေ့ရှိသောမေးခွန်းများ
Wizper (Whisper v3) text ကိုသို့ပြောဆိုအသံ transcribes. MP3 ကို upload, WAV, M4A, သို့မဟုတ်ဗီဒီယိုဖိုင်နှင့် Wizper (Whisper v3) ချိန်ညှိချက်များနှင့်အတူ optional SRT / VTT ဇာတ်ညွှန်းများပထမဦးဆုံးအပြည့်အဝ transcript ထပ်မံပြန်လာ.
Wizper (Whisper v3) ဘာသာစကားများထောင်ပေါင်းများစွာကိုကိုင်တွယ် - Whisper-မိသားစုမော်ဒယ်များ 90+, Parakeet ~25 ကိုဖုံးလွှမ်း, အခြားသူများကွဲပြားခြားနား. Pick "အလိုအလျောက်-ရှာဖွေတွေ့ရှိ" သို့မဟုတ်အမြင့်ဆုံးတိကျမှုအတွက်ဘာသာစကားကိုသတ်မှတ်.
စကားလုံး-အမှားနှုန်း 5-10% ရှင်းလင်းသောအင်္ဂလိပ်အသံအပေါ်ဖြစ်ပါသည်, 10-20% မြည်တမ်းသို့မဟုတ် accented အသံအပေါ်. တူညီတဲ့ဗိသုကာ၏ကြီးမားသောအမျိုးအစားများအလွန်ခက်ခဲသောကိစ္စများတွင်ပိုမိုအဓိပ္ပါယ်ရှိရှိလုပ် - အသံကခက်ခဲတဲ့အခါပိုကြီး pick.
ဟုတ်ကဲ့ - အားလုံးအပိုင်းအစစတင် / ပြီးဆုံးအချိန်စတိုင်များပါဝင်သည်. SRT သို့မဟုတ် VTT အဖြစ်တင်ပို့ခြင်းနှင့်အချိန်ဇယားကိုသင့်ရဲ့ဗီဒီယိုပေါ်သို့တိုက်ရိုက်.
Wizper (Whisper v3) တစ်ဦးပရီမီယံ transcription အင်ဂျင်ဖြစ်ပါသည်. အကြောင်းကို ~500–1,500 audio ကိုမိနစ်လျှင် tokens. $1 = 750,000 tokens.
MP3, WAV, M4A, FLAC, OGG, ပေါင်းစပ်ဗီဒီယို (MP4, MOV, WebM) — ကျွန်တော်တို့ဟာအသံဖိုင်ကိုထုတ်ယူ. Max 500 MB ကို upload ကိုတစ်ဦးချင်းစီ. ပိုမိုရှည်လျားသောဖိုင်များ? Split / audio / cut / သို့မဟုတ်အသုံးပြု / v1 / stt / batch /.
Speaker diarization တစ်ခုတည်းသော pass ကိုဖြစ်ပါသည် - toggle "diarize" / transcribe / အပေါ်. Wizper (Whisper v3) ဘာသာပြန်ချက်ကိုင်တွယ်; diarization Speaker 1 / Speaker2/ စသည်တို့နှင့်အတူတစ်ဦးချင်းစီကို segment များ labels.
ဟုတ်ကဲ့ — / batch / audio files များ၏ folder ကိုလက်ခံ. တစ်ခုချင်းစီကို transcript / account /?tab = မူရင်း filename နှင့်အတူသမိုင်းမြေ. folder-သစ်ပင်ထိန်းသိမ်းရေးအတွက် API ကိုအသုံးပြု.
ဟုတ်ကဲ့ — model ဖြင့် /v1/stt/transcribe / သို့သင်၏အသံကို POST ရန် "Wizper (Whisper v3)" ။ စာသားနှင့်အတူ JSON ကိုပြန်လာ + segments + word-level timestamps ။ /api/ သည်အပြည့်အဝအညွှန်းရှိသည်။
Self-hosted မော်ဒယ်များကျွန်တော်တို့ရဲ့ GPUs အပေါ်အသံကိုထိန်းသိမ်းထား; တစ်ဦး DPA နှင့်အတူပရီမီယံဖြတ်ပြီးသွား. အသံကိုမျှဝေ-window ကိုပြီးနောက်ဖျက်ပစ်သည် (24h anon, 7d မှတ်ပုံတင်-in ကို). ကျွန်တော်တို့ဟာသင်၏ inputs တွေကိုအပေါ်လေ့ကျင့်မထား.
ဟုတ်ကဲ့ — Free.ai transcripts ၏စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုခွင့်ပြုချက်. သင် uploaded အသံကိုပိုင်ခွင့်လိုအပ် (သင့်ရဲ့ကိုယ်ပိုင်မှတ်တမ်းတင်, လိုင်စင်ပစ္စည်း, သို့မဟုတ်သဘောတူညီချက်နှင့်အတူအကြောင်းအရာ).
အမှန်တကယ်အချိန်အကြောင်းရင်းသည်အနည်းငယ် 0.05-0.2 × ဖြစ်ပါတယ်။ - 60-မိနစ် podcast ကို 3-12 မိနစ်အတွင်း transcribes ။ ပရီမီယံမော်ဒယ်များမကြာခဏပိုမိုမြန်ဆန်ပြီးစီး. tab ကိုပိတ်ရန်အတန်းခလုတ်ကိုသုံးပါ။