faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 100 žetónov na minute

Nahrať audio súbor

Umiestnite zvukový súbor alebo videosúbor alebo prilepte URL adresu nižšie

~500 100 žetónov na minute

faster-whisper large-v3 je a Model premeny reči na text vytvorený OpenAI / SYSTRAN. Najsilnejší na Accurate transcription. Vlastné hosťovanie na Free.ai grafických procesoroch – beží bezplatne proti vášmu dennému fondu tokenov (500 tokenov za minútu). Vydané pod licenciou MIT — komerčné použitie povolené na Free.ai.

Použitie cez API

REST API kompatibilné s OpenAI. Generujte kľúč a zavolajte tento model v priebehu niekoľkých sekúnd.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

Dokumentácia API Získať API kľúč

Podobné modely

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Prehľadávať všetky modely →

Často kladené otázky

faster-whisper large-v3 transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and faster-whisper large-v3 returns the full transcript plus optional SRT/VTT subtitles with timestamps.

faster-whisper large-v3 zvláda desiatky jazykov — modely Whisper pokrývajú 90+, Parakeet pokrýva ~25, ostatné sa líšia.Zvoľte "auto-detect" alebo zadajte jazyk pre najvyššiu presnosť.

Miera chýb slov je 5-10% na čistom anglickom zvuku, 10-20% na hlučnom alebo akcentovanom zvuku.Veľké varianty rovnakej architektúry fungujú výrazne lepšie na tvrdých prípadoch - vyberte väčšie, keď je zvuk drsný.

Áno, každý segment obsahuje časové značky začiatku a konca.Exportujte ako SRT alebo VTT a priraďte časy priamo do videa.

faster-whisper large-v3 beží na našich vlastných GPU proti vášmu dennému voľnému bazénu najprv; $5 → 200,000 platených žetónov potom.Okolo ~500 žetónov za minútu.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — extrahujeme audio. Max 500 MB na upload. Dlhšie súbory? Rozdeliť pomocou /audio/cut/ alebo použite /v1/stt/batch/.

Diarizácia hovoriacich je samostatný priechod — prepnite "diarize" na /transcribe/. faster-whisper large-v3 sa stará o prepis; diarizácia označuje každý segment ako Rečník 1 / Rečník 2 / atď.

Áno — /batch/ prijíma priečinok so zvukovými súbormi. Každý prepis skončí v /account/?tab=history s pôvodným názvom súboru. Pre zachovanie stromu priečinkov použite API.

Áno — POST svoj zvuk do /v1/stt/transcribe/ s modelom "faster-whisper large-v3". Vráti JSON s textom + segmenty + časové značky na úrovni slov. /api/ má úplný odkaz.

Samohostiteľské modely ukladajú zvuk na naše GPU; prémiové modely prechádzajú cez DPA. Zvuk sa po uplynutí okna zdieľania (24 hodín anon, 7 dní prihlásenia) vymaže.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Faktor reálneho času je približne 0,05 – 0,2× – 60-minútový podcast sa prepíše za 3 – 12 minút. Prémiové modely často dokončia prepis rýchlejšie.

faster-whisper large-v3

Použitie cez API

Podobné modely

Často kladené otázky

Čo robí faster-whisper large-v3?

Koľko jazykov podporuje faster-whisper large-v3?

Ako presné je faster-whisper large-v3?

Obsahuje faster-whisper large-v3 časové pečiatky?

Koľko stojí faster-whisper large-v3 za minútu?

Aké audio formáty môžem nahrať na faster-whisper large-v3?

Môže faster-whisper large-v3 identifikovať rôznych rečníkov?

Môžem hromadne prepisovať s faster-whisper large-v3?

Existuje API pre faster-whisper large-v3?

A čo súkromie, keď prepisujem s faster-whisper large-v3?

Je výstup faster-whisper large-v3 bezpečný pre komerčné použitie?

Ako dlho trvá faster-whisper large-v3?

Získajte 10 000 žetónov zadarmo

Počkajte — Získajte 10K Žetónov zadarmo!

Chcete viac?