faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 _Göçür minute

Bir audio ýa-da video faýly düşür ýa-da bir URL'i şuňa goý

~500 _Göçür minute

sözden-metine model by OpenAI / SYSTRAN Accurate transcription-da iň güýçli Free.ai GPUs üstünde öz-özüne-hosting — siziň gündelik token pool (500 tokens minutda) garşy azat işleýär. MIT astynda çykaryldy — Free.ai-de söwda ulanmak üçin rugsat berildi.

API arkaly ullan

OpenAI-gabat gelýän REST API. Bir açary döret we bu modeli sekuntlarda çagyr.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
Senedler API Adyny Al

Gynançly Soraglar

faster-whisper large-v3 sözlenen sesleri metinlere geçirýär. Bir MP3, WAV, M4A ýa-da wideo faýly ýükläň we faster-whisper large-v3 doly geçirmäni we opsion SRT/VTT subtitleleri wagt möhürleri bilen gaýtarýar.

faster-whisper large-v3 onlaýn dilleri dolandyrýar — Whisper-family modelleri 90+, Parakeet ~25, beýlekiler üýtgeýär. "otomatik tap" saýla ýa-da iň ýokary dogrylyk üçin dili bellik et.

Söz-hata derejesi 5-10% arassa ingliz sesde, 10-20% gürleşikli ýa-da aksentli sesde. Aynı binagärligiň uly görnüşleri has gowy iş görýär - ses çylşyrymly bolsa ulysyny saýla.

Eý — her bir bölek başlan/son wagt möhürlerini içer. SRT ýa VTT olarak eksport et we wagtlar mapyny wideoňa dogrydan ýaz.

faster-whisper large-v3 biziň öz GPUsymyza garşy her günlik mugt pulyňyza garşy işleýär; $5 → 200,000 tölegli tokeni ondan soň. Bir minutda ~500 tokeni.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — biz sesleri çykarýarys. Bir ýükleme üçin iň köp 500 MB. Uly faýllar? /audio/cut/ bilen böle ýa-da /v1/stt/batch/ ullan.

Sesçi diaryzasiýasy bir tapawutlanan geçişdir — /transcribe/-de "diarize"-i çalşyň. faster-whisper large-v3 transkripsiýany dolandyrýar; diaryzasiýa her bir segmenti Sesçi 1 / Sesçi 2 / we ş.m. bilen etiketleýär

Eý — /batch/ ses faýllarynyň haltany kabul edýär. Her bir transkript /account/?tab=history'da orjinal faýl ad bilen galýar. Haltany-bakja saklamak üçin API'den ullan.

Eý — POST audiony /v1/stt/transcribe/ bilen model="faster-whisper large-v3". Metin + segmentler + söz derejeli wagt möhürleri bilen JSON'y gaýtarýar. /api/ doly salgy bar.

Öz-özüne hosturlanan modeller sesleri GPU-larda saklaýar; premium DPA bilen geçýär. Ses paýlaşma äpişgesinden soň pozylýar (24 sag anonim, 7 gün giren). Biz siziň girişleriňizi öwrenmänis.

Eý — Free.ai transkripleriň söwdaly ulanmak hukugyny berýär. Siz ýüklän ses haklarynyň (öz ýazgyňyz, lisenziyaly material ýa-da ygtyýar bilen mazmun) zerurlygyny duýýarsyňyz.

Raýat wagtyň faktory takmynan 0.05-0.2× — 60 minutlyk podkast 3-12 minutda transkribe bolýar. Premium modeller köplenç çalt tamamlanýar. Täbi ýapmak üçin nobat batlygyny ullan.

Free.ai-i söýýäňmi? Dostlaryňa aýt!

Bu sahypany bahala