faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 token/s minute

Arrastatu audio- edo bideo-fitxategia, edo itsatsi URL bat behean

~500 token/s minute

faster-whisper large-v3 a hizketa-testurako eredua da, {provider__k} eraikia. (Gaztelaniaz) "La mejor"-en webgunea. Free.ai GPUtan auto-ostatua — zure eguneroko token pool-aren aurka doan exekutatzen da (500 tokens minutuko). MIT lizentziapean argitaratua — erabilera komertziala baimenduta Free.ai-n.

Erabili API bidez

OpenAI-rekin bateragarria den REST APIa. Sortu gako bat eta deitu eredu honi segundo gutxitan.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
API dokumentazioa Eskuratu API gakoa

Maiz egiten diren galderak

faster-whisper large-v3 transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and faster-whisper large-v3 returns the full transcript plus optional SRT/VTT subtitles with timestamps.

faster-whisper large-v3-ek dozenaka hizkuntza kudeatzen ditu — Whisper-familiako modeloek 90+ hizkuntza hartzen dituzte, Parakeet-ek ~25, beste batzuk aldakorrak dira. Hautatu "autodetektatu" edo zehaztu hizkuntza zehaztasun handiena lortzeko.

Hitzen errore-tasa %5-10 da ingeles garbiko audioan, %10-20 zaratatsu edo azentudun audioan. Arkitektura bereko aldaera handiek hobeto funtzionatzen dute kasu gogorretan — aukeratu handiagoa audioa gogorra denean.

Bai — segmentu bakoitzak hasierako/amaierako denbora-zigilua du. Esportatu SRT edo VTT gisa, eta denbora-mapa zuzenean bideoan ezarriko da.

faster-whisper large-v3 gure GPU propioetan exekutatzen da, lehenik zure eguneroko pool librearen aurka; $5 → 200.000 ordaindutako token ondoren. Minutuko ~500 token inguru.

MP3, WAV, M4A, FLAC, OGG, eta bideoa (MP4, MOV, WebM) — audioa erauzten dugu. Gehienez 500 MB igoera bakoitzeko. Fitxategi luzeagoak? Zatitu /audio/cut/ erabiliz edo erabili /v1/stt/batch/.

Hizlarien diarizazioa pasabide bereizi bat da — "diarize" /transcribe/-n aktibatzea. faster-whisper large-v3-k transkribapena kudeatzen du; diarizazioak segmentu bakoitza 1. hiztuna / 2. hiztuna / etab. etiketekin etiketatzen du.

Bai — /batch/-ek audio-fitxategien karpeta bat onartzen du. Transkriptu bakoitza /account/?tab=history-n jartzen da jatorrizko fitxategi-izena erabiliz. Karpeta-zuhaitza gordetzeko, erabili APIa.

Bai — POST zure audioa /v1/stt/transcribe/-ra model="faster-whisper large-v3" erabiliz. JSON itzultzen du testuarekin + segmentuekin + hitzen mailako denbora-zigiluekin. /api/-k erreferentzia osoa du.

Auto-ostatutako modeloek audioa gure GPUetan gordetzen dute; premium-ek DPA bidez pasatzen dute. Audioa ezabatzen da partekatze-leihoaren ondoren (24 ordu anon, 7 egun saioa hasita). Ez dugu zure sarrerak entrenatzen.

Bai — Free.aik transkribapenen erabilera komertziala onartzen du. Igo duzun audioaren eskubideak behar dituzu (zure grabazioa, lizentziadun materiala edo baimenarekin edukia).

Denbora errealeko faktorea 0,05-0,2× da gutxi gorabehera — 60 minutuko podcast bat 3-12 minututan transkribatzen da. Premium modeloek askotan azkarrago amaitzen dute. Erabili ilara botoia fitxa ixteko.

Free.ai maite duzu?

Balioetsi orrialde hau