faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 tokens għal kull minute

Aqta' fajl awdjo jew vidjo, jew waħħal URL hawn taħt

~500 tokens għal kull minute

faster-whisper large-v3 huwa a mudell minn diskors għal test mibni minn OpenAI / SYSTRAN. L-aktar b'saħħitha fil-Accurate transcription. Awto-ospitati fuq Free.ai GPUs — timxi b'xejn kontra pool token kuljum tiegħek (500 tokens kull minuta). Rilaxxat taħt MIT — użu kummerċjali permess fuq Free.ai.

Użu permezz tal-API

OpenAI-kompatibbli REST API. Jiġġeneraw ċavetta u sejħa dan il-mudell f'sekondi.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
Dokumentazzjoni tal-API Ikseb il-Kwalità API

Mistoqsijiet li jsiru ta’ spiss

faster-whisper large-v3 jittraskrivi l-awdjo mitkellem f’test.Upload MP3, WAV, M4A, jew vidjo fajl u faster-whisper large-v3 jirritorna t-traskrizzjoni sħiħa flimkien ma’ sottotitli SRT/VTT mhux obbligatorji b’timestamps.

faster-whisper large-v3 jimmaniġġja għexieren ta' lingwi — Whisper-il-familja ta' mudelli tkopri 90%, Parakeet tkopri ~25, oħrajn ivarjaw.

Ir-rata ta' żball tal-kelma hija 5-10% fuq awdjo Ingliż nadif, 10-20% fuq awdjo storbjuż jew aċċent.Varjanti kbar tal-istess arkitettura jagħmlu b'mod sinifikanti aħjar fuq każijiet iebsa - agħżel akbar meta l-awdjo huwa mhux maħdum.

Iva — kull segment jinkludi timbri tal-ħin tal-bidu/tmiem. Esportazzjoni bħala SRT jew VTT u l-ħinijiet mappa dritt fuq il-vidjo tiegħek.

faster-whisper large-v3 timxi fuq GPUs tagħna stess kontra pool kuljum ħielsa tiegħek l-ewwel; $ 5 → 200,000 tokens imħallsa wara li.Madwar ~ 500 tokens kull minuta.

MP3, WAV, M4A, FLAC, OGG, kif ukoll vidjo (MP4, MOV, WebM) — aħna estratt l-awdjo. Max 500 MB għal kull upload. fajls itwal? maqsuma ma / awdjo / maqtugħa / jew jużaw / v1 / stt / batch /.

Id-dijarizzazzjoni tal-kelliem hija pass separat — toggle "diarize" fuq /transcribe/. faster-whisper large-v3 jimmaniġġja t-traskrizzjoni; id-dijarizzazzjoni tittikketta kull segment b'Speaker 1 / Speaker 2 / eċċ.

Iva — /batch/ jaċċetta folder ta' fajls awdjo. Kull traskrizzjoni tinżel f'/account/?tab=history bl-isem tal-fajl oriġinali. Għall-preservazzjoni tas-siġra tal-folders uża l-API.

Iva — POST l-awdjo tiegħek għal /v1/stt/transcribe/ b'model="faster-whisper large-v3". Jirritorna JSON b'test + segmenti + timestamps fil-livell tal-kelma. /api/ għandu r-referenza sħiħa.

Mudelli awto-ospitati jżommu l-awdjo fuq il-GPUs tagħna; premium jgħaddu minn DPA. L-awdjo jitħassar wara t-tieqa tal-qsim (24 siegħa anon, 7d iffirmat).

Iva — Free.ai jagħti użu kummerċjali tat-transkrizzjonijiet.Jeħtieġlek drittijiet għall-awdjo li ttella' (ir-reġistrazzjoni tiegħek stess, materjal liċenzjat, jew kontenut bil-kunsens).

Il-fattur tal-ħin reali huwa bejn wieħed u ieħor 0.05–0.2× — podcast ta’ 60 minuta jittraskrivi fi 3–12-il minuta. Mudelli premium spiss jispiċċaw aktar malajr.

Imħabba Free.ai? Għid lill-ħbieb tiegħek!

Irraporta din il-paġna