faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 ටොකන minute

ශ්‍රව්‍ය හෝ වීඩියෝ ගොනුවක් පහතට දමන්න, හෝ URL ලිපිනයක් ඇලවීම

~500 ටොකන minute

faster-whisper large-v3 යනු a කථා-පෙළ ආකෘතිය විසින් OpenAI / SYSTRAN විසින් ඉදිකරන ලද කථා-පෙළ ආකෘතිය වේ. ෆ්‍රෙඩී Free.ai GPUs මත ස්වයං-සත්කාරක - ඔබේ දෛනික ටොකන් පූල් එරෙහිව නිදහස් ධාවනය (500 ටොකන් මිනිත්තුවට). MIT යටතේ නිදහස් කරන ලදී — වාණිජමය භාවිතය සඳහා Free.ai මත අවසර ලබා දී ඇත.

API හරහා භාවිත කරන්න

OpenAI අනුකූල REST API. යතුරක් ජනනය කර තත්පර කිහිපයකින් මෙම ආකෘතිය ඇමතීමට.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
API ලේඛන API යතුර ලබාගන්න

නිතර අසන ප්රශ්න

faster-whisper large-v3 පෙළ බවට කතා ශ්රව්ය පරිවර්තනය. MP3 එකක් උඩුගත, WAV, M4A, හෝ වීඩියෝ ගොනුවක් සහ faster-whisper large-v3 කාලය මුද්රා සමග විකල්ප SRT / VTT උපසිරැසි පූර්ණ පරිවර්තනය ප්ලස් ආපසු.

faster-whisper large-v3 භාෂා දස දහස් ගණනක් හැසිරවීම - Whisper-පවුලේ ආකෘති ආවරණය 90+, Parakeet ආවරණය ~25, අනෙක් අය වෙනස්. "ස්වයංක්රීයව හඳුනා" තෝරන්න හෝ ඉහළම නිරවද් යතාව සඳහා භාෂාව සඳහන් කරන්න.

වචන-දෝෂ අනුපාතය පිරිසිදු ඉංග්රීසි ශ්රව්ය මත 5-10% වේ, 10-20% ශබ්ද හෝ accented ශ්රව්ය මත. එම ගෘහ නිර්මාණ ශිල්පය විශාල විකල්ප අසීරු නඩු මත අර්ථවත් වඩා හොඳ කරන්නේ - ශ්රව්ය දෘඩ විට විශාල තෝරන්න.

ඔව් - සෑම කොටසක් ආරම්භ / අවසන් timestamps ඇතුළත් වේ. SRT හෝ VTT ලෙස අපනයනය සහ ඔබේ වීඩියෝව මත කෙලින්ම කාලය සිතියම.

faster-whisper large-v3 ඔබේ දෛනික නිදහස් පූල් පළමු එරෙහිව අපගේ ම GPUs මත ධාවනය; $5 → 200,000 ඒ පසු ගෙවනු ලබන ටොකන්. ~ මිනිත්තුවකට ටොකන් 500 ගැන.

MP3, WAV, M4A, FLAC, OGG, ප්ලස් වීඩියෝ (MP4, MOV, WebM) — අපි ශ්රව්ය උපුටා. මැක්ස් 500 MB එකකට. දිගු ගොනු? /audio/cut/ සමග බෙදා හෝ /v1/stt/batch/ භාවිතා කරන්න.

කථානායක diarization වෙනම අවසර - /transcribe/ මත "diarize" මාරු කරන්න. faster-whisper large-v3 පරිවර්තනය හැසිරවීම; diarization කථානායක 1 / කථානායක 2/ ආදිය සමග එක් එක් කොටස ලේබල්.

ඔව් — / කණ්ඩායම / ශ්රව්ය ගොනු බහාලුමක් පිළිගනී. එක් එක් පරිවර්තනය මුල් ගොනු නාමය සමග / ගිණුම /?tab = ඉතිහාසය ගොඩබිම්. බහාලුම්-ගස සංරක්ෂණය සඳහා API භාවිතා කරන්න.

ඔව් — ඔබේ ශ්රව්ය ප්රකාශනය /v1/stt/transcribe/ සමග ආකෘතිය සමග POST="faster-whisper large-v3". පෙළ සමග JSON ආපසු + කොටස් + වචන මට්ටමේ timestamps. /api/ සම්පූර්ණ උපුටා දැක්වීම ඇත.

ස්වයං-සත්කාරක ආකෘති අපගේ GPUs මත ශ්රව්ය තබා; වට්ටම් DPA සමග හරහා ගමන්. ශ්රව්ය කොටස්-කවුළුව පසු මකා දමයි (24h anon, 7d සභාපති-in). අපි ඔබේ ආදාන පුහුණු නැහැ.

ඔව් - Free.ai පරිවර්තන වාණිජ භාවිතය ලබා දෙයි. ඔබ ඔබ උඩුගත ශ්රව්ය අයිතිවාසිකම් අවශ්ය (ඔබේම පටිගත, බලපත්ර ද්රව්ය, හෝ අනුමැතිය සමග අන්තර්ගතය).

තත්ත්ව සාධකය දළ වශයෙන් 0.05-0.2 × වේ - මිනිත්තු 60 ක පොඩ්කාස්ට් මිනිත්තු 3-12 ක් තුළ පරිවර්තනය කරයි. ප් රතිලාභ ආකෘති බොහෝ විට වේගයෙන් අවසන් වේ. ටැබය වසා දැමීමට පෝලිම් බොත්තම භාවිතා කරන්න.

Free.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

මෙම පිටුව අගය කරන්න