Wizper (Whisper v3)

Free.ai · stt · ~500 တန်ဖိုးများ minute

အသံ/ဗီဒီယိုဖိုင်ကိုချလိုက်၊ ဒါမှမဟုတ် အောက်က URL ကို ကူးထည့်

~500 တန်ဖိုးများ minute
ကျွန်တော်တို့ရဲ့ GPUs အပေါ်အခမဲ့ Runs ။ များအတွက်အဆင့်မြှင့် Wizper (Whisper v3) →

Wizper (Whisper v3) a ဘာသာစကားမှစာသားသို့ ပုံစံ ဖြစ်ပါတယ်။ ပြင်ပမော်ဒယ်များမှတဆင့်လမ်းကြောင်း - ~ 500 tokens မိနစ် (50% upstream ကုန်ကျစရိတ်ထက် markup).

API မှတဆင့်အသုံးပြု

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'
API မှတ်တမ်း API Key ကိုရယူပါ

မေးလေ့ရှိသောမေးခွန်းများ

Wizper (Whisper v3) text ကိုသို့ပြောဆိုအသံ transcribes. MP3 ကို upload, WAV, M4A, သို့မဟုတ်ဗီဒီယိုဖိုင်နှင့် Wizper (Whisper v3) ချိန်ညှိချက်များနှင့်အတူ optional SRT / VTT ဇာတ်ညွှန်းများပထမဦးဆုံးအပြည့်အဝ transcript ထပ်မံပြန်လာ.

Wizper (Whisper v3) ဘာသာစကားများထောင်ပေါင်းများစွာကိုကိုင်တွယ် - Whisper-မိသားစုမော်ဒယ်များ 90+, Parakeet ~25 ကိုဖုံးလွှမ်း, အခြားသူများကွဲပြားခြားနား. Pick "အလိုအလျောက်-ရှာဖွေတွေ့ရှိ" သို့မဟုတ်အမြင့်ဆုံးတိကျမှုအတွက်ဘာသာစကားကိုသတ်မှတ်.

စကားလုံး-အမှားနှုန်း 5-10% ရှင်းလင်းသောအင်္ဂလိပ်အသံအပေါ်ဖြစ်ပါသည်, 10-20% မြည်တမ်းသို့မဟုတ် accented အသံအပေါ်. တူညီတဲ့ဗိသုကာ၏ကြီးမားသောအမျိုးအစားများအလွန်ခက်ခဲသောကိစ္စများတွင်ပိုမိုအဓိပ္ပါယ်ရှိရှိလုပ် - အသံကခက်ခဲတဲ့အခါပိုကြီး pick.

ဟုတ်ကဲ့ - အားလုံးအပိုင်းအစစတင် / ပြီးဆုံးအချိန်စတိုင်များပါဝင်သည်. SRT သို့မဟုတ် VTT အဖြစ်တင်ပို့ခြင်းနှင့်အချိန်ဇယားကိုသင့်ရဲ့ဗီဒီယိုပေါ်သို့တိုက်ရိုက်.

Wizper (Whisper v3) တစ်ဦးပရီမီယံ transcription အင်ဂျင်ဖြစ်ပါသည်. အကြောင်းကို ~500–1,500 audio ကိုမိနစ်လျှင် tokens. $1 = 750,000 tokens.

MP3, WAV, M4A, FLAC, OGG, ပေါင်းစပ်ဗီဒီယို (MP4, MOV, WebM) — ကျွန်တော်တို့ဟာအသံဖိုင်ကိုထုတ်ယူ. Max 500 MB ကို upload ကိုတစ်ဦးချင်းစီ. ပိုမိုရှည်လျားသောဖိုင်များ? Split / audio / cut / သို့မဟုတ်အသုံးပြု / v1 / stt / batch /.

Speaker diarization တစ်ခုတည်းသော pass ကိုဖြစ်ပါသည် - toggle "diarize" / transcribe / အပေါ်. Wizper (Whisper v3) ဘာသာပြန်ချက်ကိုင်တွယ်; diarization Speaker 1 / Speaker2/ စသည်တို့နှင့်အတူတစ်ဦးချင်းစီကို segment များ labels.

ဟုတ်ကဲ့ — / batch / audio files များ၏ folder ကိုလက်ခံ. တစ်ခုချင်းစီကို transcript / account /?tab = မူရင်း filename နှင့်အတူသမိုင်းမြေ. folder-သစ်ပင်ထိန်းသိမ်းရေးအတွက် API ကိုအသုံးပြု.

ဟုတ်ကဲ့ — model ဖြင့် /v1/stt/transcribe / သို့သင်၏အသံကို POST ရန် "Wizper (Whisper v3)" ။ စာသားနှင့်အတူ JSON ကိုပြန်လာ + segments + word-level timestamps ။ /api/ သည်အပြည့်အဝအညွှန်းရှိသည်။

Self-hosted မော်ဒယ်များကျွန်တော်တို့ရဲ့ GPUs အပေါ်အသံကိုထိန်းသိမ်းထား; တစ်ဦး DPA နှင့်အတူပရီမီယံဖြတ်ပြီးသွား. အသံကိုမျှဝေ-window ကိုပြီးနောက်ဖျက်ပစ်သည် (24h anon, 7d မှတ်ပုံတင်-in ကို). ကျွန်တော်တို့ဟာသင်၏ inputs တွေကိုအပေါ်လေ့ကျင့်မထား.

ဟုတ်ကဲ့ — Free.ai transcripts ၏စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုခွင့်ပြုချက်. သင် uploaded အသံကိုပိုင်ခွင့်လိုအပ် (သင့်ရဲ့ကိုယ်ပိုင်မှတ်တမ်းတင်, လိုင်စင်ပစ္စည်း, သို့မဟုတ်သဘောတူညီချက်နှင့်အတူအကြောင်းအရာ).

အမှန်တကယ်အချိန်အကြောင်းရင်းသည်အနည်းငယ် 0.05-0.2 × ဖြစ်ပါတယ်။ - 60-မိနစ် podcast ကို 3-12 မိနစ်အတွင်း transcribes ။ ပရီမီယံမော်ဒယ်များမကြာခဏပိုမိုမြန်ဆန်ပြီးစီး. tab ကိုပိတ်ရန်အတန်းခလုတ်ကိုသုံးပါ။

ချစ်ခြင်းမေတ္တာ Free.ai? သင့်မိတ်ဆွေများကိုပြောပါ!

ဒီစာမျက်နှာကိုတန်ဖိုးထား