Wizper (Whisper v3)
Free.ai
·
stt
·
~500 unit synonyms for matching user input minute
Wizper (Whisper v3) a beszéd-szöveg modell. Külső modelleken keresztül vezetve ~500 tokens Percenként (50%-os felár a upstream költség felett).
Alkalmazása API-n keresztül
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
API dokumentáció
Szerezd meg az API kulcsot
Gyakran ismételt kérdések
Wizper (Whisper v3) átírja a beszélt audiót szövegbe. MP3, WAV, M4A vagy videó fájl feltöltése és Wizper (Whisper v3) visszaadja a teljes átiratot plusz az opcionális SRT/VTT feliratokat időbélyegekkel.
Wizper (Whisper v3) kezeli több tucat nyelv • Whisper-családi modellek fedez 90+, Parakeet fedi ~25, mások változó. Válassza ki a "auto-detect" vagy adja meg a nyelvet a legmagasabb pontosság érdekében.
A Word-error arány 50% 10% a tiszta angol audió, 100%20% a zajos vagy kihangsúlyozott audió. Nagy változatok az azonos architektúra nem jelentõsen jobb a kemény esetekben, ha az audió durva.
Igen, minden szegmens tartalmaz start/end időbélyegeket. Exportálás SRT vagy VTT és az idő térkép egyenesen a videóra.
Wizper (Whisper v3) egy prémium átirati motor. Körülbelül ~500 ~1,500 token per perc audio. $750,000 token.
MP3, WAV, M4A, FLAC, OGG, plusz videó (MP4, MOV, WebM) kivonjuk az audiót. Max 500 MB/feltöltés. Hosszabb fájlok? /audio/cut/ vagy /v1/stt/batch/.
A szónoki diarization egy külön pass "diarize" a /transcribe/. Wizper (Whisper v3) kezeli az átírást; diarization címkék minden szegmensben a hangszóró 1 / hangszóró 2 / stb.
Igen /batch / elfogad egy mappát audio fájlokat. Minden átirat a /account/?tab=történelem az eredeti fájlnévvel. Mappa-fa megőrzéshez használja az API-t.
Igen, Post your audio to /v1/stt/transscribe/ with model="Wizper (Whisper v3)". Returns JSON with text + szegmensek + word-level timestamps. /api/ has the full reference.
Önálló modellek tartsa hang a GPU-k; prémium át egy DPA. Audio törlésre kerül után a megosztás-ablak (24h anon, 7d signated-in). Mi nem vonat a bemenetek.
Igen, Free.ai ad kereskedelmi használatát átiratok. Szüksége van jogok audio feltöltött (a saját felvétel, engedéllyel rendelkező anyag, vagy tartalom hozzájárulás).
Real-time faktor nagyjából 0.05-0,2× · 60 perces podcast trascribe-ok 36-12 perc alatt. Premium modellek gyakran gyorsabban befejezik. Használja a sor gombot, hogy bezárja a fület.