Wizper (Whisper v3)
Free.ai
·
stt
·
~500 mynter per minute
Wizper (Whisper v3) is a tale-til-tekst-modell. Rutet gjennom eksterne modeller — ~500 tokens per minutt (50% oppmerking over oppstrømskostnadene).
Bruk via API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
API- dokumentasjon
Hent API- nøkkel
Ofte stilte spørsmål
Wizper (Whisper v3) transcribes talte lyd til tekst. Last opp en MP3, WAV, M4A eller videofil og Wizper (Whisper v3) returnerer fullstendig utskrift pluss valgfri SRT/VTT teksting med tidsstempel.
Wizper (Whisper v3) håndterer dusinvis av språk — Whisper-familiemodeller dekker 90+, Parakeet deksler ~25, andre varierer. Velg « Autooppdag» eller oppgi språk for høyeste nøyaktighet.
Word- error rate er 5–10% på ren engelsk lyd, 10–20% på støy eller aksent lyd. Store varianter av samme arkitektur gjør meningsfylt bedre på hard- tilfeller – plukke større når lyden er grov.
Ja, hvert segment inneholder start - og slutt-tidsstempler. Eksporter som SRT eller VTT, og tidskartet rett på videoen.
Wizper (Whisper v3) er en premium transkription motor. Om ~ 500– 1. 500 tokens per minutt lyd. $ 1 = 75 000 tokens.
MP3, WAV, M4A, FLAC, OGG, pluss video (MP4, MOV, WebM) – vi trekker ut lyden. Maks 500 MB per opplasting. Lengere filer? Del med /audio/ cut/ eller bruk / v1/ st/ batch /.
Høyttalerdiarisering er en egen pass – slå av/ på « diarize » på / transcribe /. Wizper (Whisper v3) _ håndterer transkriptionen; diaarisering merker hvert segment med høyttaler 1 / høyttaler 2 / osv.
Ja – /atch/ acceptar en mappe med lydfiler. Hver utskrift lander i / account /? tab=historie med det opprinnelige filnavnet. Bruk API for mappe- tre.
Ja — POST din lyd til /v1/st/ trancribe/ with model="Wizper (Whisper v3) _". Returnerer JSON med tekst + segmenter + tidsstempel på ordnivå. /api/ har full referanse.
Selvværte modeller holder lyden på våre GPUer, premium passerer gjennom med en DPA. Lyden slettes etter delingsvinduet (24h anon, 7d signert). Vi trener ikke på dine inndata.
Ja – Free.ai tildeler kommersiell bruk av utskrifter. Du trenger rettigheter til lyden du opplastet (deres eget opptak, lisensiert materiale eller innhold med samtykke).
Sanntidsfaktoren er omtrent 0. 05– 0. 2× – en 60- minutters podkasttranskriber på 3– 12 minutter. Premiummodeller avsluttes ofte raskere. Bruk køknappen for å lukke fanen.