Wizper (Whisper v3)
Free.ai
·
stt
·
~500 tákn á minute
Wizper (Whisper v3) er a tal- í- texta líkan. Leiðir í gegnum ytri módel - ~ 500 tákn á mínútu (50% merking yfir uppstreymiskostnað).
Notaðu í gegnum API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
API skjölun
Fá API lykil
Algengar spurningar
Hlaða upp MP3, WAV, M4A eða myndskeiðsskrá og Wizper (Whisper v3) skilar fullri afritunarskrá auk valfrjáls SRT / VTT texta með tímastimpil.
Wizper (Whisper v3) meðhöndlar heilmikið af tungumálum - Whisper-fjölskyldu módel ná yfir 90+, Parakeet nær yfir ~ 25, aðrir eru mismunandi.
Orðvillahlutfall er 5-10% á hreinu ensku hljóði, 10-20% á háværu eða hreimuðu hljóði.Stóra afbrigði af sömu arkitektúr gera merkingarbetri á erfiðum tilvikum - veldu stærri þegar hljóðið er gróft.
Já - hver hluti inniheldur upphaf / lok tímastimpil. Flytja út sem SRT eða VTT og tímakort beint á myndbandið þitt.
Wizper (Whisper v3) er hágæða uppskrift vél. Um ~ 500-1.500 tákn á mínútu af hljóði. $ 1 = 750.000 tákn.
MP3, WAV, M4A, FLAC, OGG, auk myndskeiða (MP4, MOV, WebM) — við tökum út hljóðin. Hámark 500 MB á hverja upphleðslu. Lengri skrár? Skipta með /audio/cut/ eða nota /v1/stt/batch/.
Höfundur diarization er sérstakt framhjá - skipta "diarize" á / transcribe /. Wizper (Whisper v3) meðhöndlar uppskrift; diarization merkir hvern hluta með Hátalari 1 / Hátalari 2 / osfrv.
Já — / batch / tekur við möppu með hljóðskrám. Hver afritunarskrá lendir í / account/? tab=history með upprunalegu skráarheitinu. Til að varðveita möpputré notaðu API.
Já — POST hljóðið þitt í /v1/stt/transcribe/ með model="Wizper (Whisper v3)". Sýnir JSON með texta + hlutum + tímastimpli á orðastigi. /api/ hefur fulla tilvísun.
Self-hosted módel halda hljóð á GPU okkar; Premium fara í gegnum með DPA. Hljóð er eytt eftir að deila glugga (24h anon, 7d skráður-í).
Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).
Rauntímaþátturinn er um það bil 0,05-0,2 × - 60 mínútna podcast afrita á 3-12 mínútum. Premium módel klárast oft hraðar. Notaðu biðröð hnappinn til að loka flipanum.