faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 tocynnau y eiliad minute

Rholio ffeil sain neu fideo, neu gludo URL isod

~500 tocynnau y eiliad minute

faster-whisper large-v3 yw a model siarad-i-destun a adeiladwyd gan OpenAI / SYSTRAN. Mwyaf gryf ar Accurate transcription. Hunan-gartrefedig ar Free.ai GPUs — rhedeg yn rhad ac am ddim yn erbyn eich pool tocynnau bob dydd (500 tokens bob munud). Rhyddhawyd o dan MIT — caniateir defnydd masnachol ar Free.ai.

Defnyddio trwy API

API REST OpenAI-cydnaws. Creu allwedd a galw'r model hwn mewn eiliad.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
Dogfennaeth API Nôl Allwedd API

Cwestiynau a Ofynnir yn Aml

Mae faster-whisper large-v3 yn trosysgrifo sain a ddywedir i destun. Lawrlwythwch ffeil MP3, WAV, M4A, neu fideo a bydd faster-whisper large-v3 yn dychwelyd y trosysgrifiad llawn ynghyd ag isdeitlau SRT/VTT dewisol gyda stampiau amser.

Mae faster-whisper large-v3 yn trin dociau o ieithoedd — mae modelau Whisper-family yn cwmpasu 90+, mae Parakeet yn cwmpasu ~25, mae eraill yn amrywio. Dewiswch "auto-detect" neu penodi'r iaith am y cywirdeb uchaf.

Mae'r gyfradd gwallau geiriau yn 5-10% ar sain Saesneg glir, 10-20% ar sain swnllyd neu â chaneuon. Mae newidiadau mawr o'r un strwythur yn gwneud yn well ar achosion anodd - dewiswch fwy pan fo'r sain yn anodd.

Ie — mae pob rhan yn cynnwys stampiau amser dechrau/diwedd. Allforio fel SRT neu VTT a'r map amser yn uniongyrchol i'ch fideo.

Mae faster-whisper large-v3 yn rhedeg ar ein GPUs ein hunain yn erbyn eich pool di-dâl bob dydd yn gyntaf; $5 → 200,000 o tocynnau wedi'u talu ar ôl hynny. Amcangyfrifir bod ~500 o tocynnau bob munud.

MP3, WAV, M4A, FLAC, OGG, yn ogystal â fideo (MP4, MOV, WebM) — rydym yn echdynnu'r sain. Uchafswm o 500 MB y lanlwythiad. Ffeiliau hirach? Rhannu gyda /audio/cut/ neu ddefnyddio /v1/stt/batch/.

Mae diareiddio siaradwr yn gam ar wahân — toglu "diarize" ar /transcribe/. Mae faster-whisper large-v3 yn trin y trosysgrifiad; mae diareiddio yn labeli pob rhan gyda siaradwr 1 / siaradwr 2 / ac ati.

Ie — /batch/ yn derbyn plygell o ffeiliau sain. Mae pob trosglwyddiad yn cyrraedd /account/?tab=history gyda'r enw ffeil gwreiddiol. Ar gyfer cadw coeden plygellau defnyddiwch yr API.

Ie — POST eich sain i /v1/stt/transcribe/ gyda model="faster-whisper large-v3". Dychwelyd JSON gyda testun + segmentau + stampiau amser lefel gair. Mae gan /api/ y cyfeiriad llawn.

Modelau hunan-westeiedig yn cadw sain ar ein GPUs; premium yn mynd drwy gyda DPA. Mae sain yn cael ei ddileu ar ôl y ffenestr rhannu (24 awr yn anon, 7 diwrnod wedi mewngofnodi). Ni ydym yn hyfforddi ar eich mewnbwn.

Ie — Free.ai yn rhoi defnydd masnachol o drosysgrifau. Mae angen hawl arnoch ar y sain a lwythoch i fyny (eich recordiad eich hun, deunydd trwyddededig, neu gynnwys gyda chaniatâd).

Mae'r ffactor amser real yn oddeutu 0.05–0.2× — mae podcast 60 munud yn trosysgrifo mewn 3–12 munud. Mae modelau premiwm yn aml yn gorffen yn gyflymach. Defnyddiwch y botwm ciw i gau'r tab.

Hoffwch Free.ai? Meddwl am eich ffrindiau!

Graddio'r dudalen hon