Wizper (Whisper v3)
Free.ai
·
stt
·
~500 kuponkeja per minute
Wizper (Whisper v3) on a puheesta tekstiin -malli. Routed through external models — ~500 tokens minuutissa (50% markup over upstream cost).
Käyttö API:n kautta
OpenAI-yhteensopiva REST API. Luo avain ja soita tähän malliin sekunneissa.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
API-dokumentaatio
Hae API-avain
Usein kysyttyjä kysymyksiä
â € € #Wizper (Whisper v3) _ transscripteds speed audio into text. Lataa MP3, WAV, M4A tai videotiedosto ja â €Wizper (Whisper v3) returned the full transkript plus optional SRT/VTT tekstitys aikaleimalla.
Wizper (Whisper v3) handles dozens of languages — Whisper-family models cover 90+, Parakeet covers ~25, others vary. Pick "auto-detect" or specify the language for highest accuracy.
Sanavirheiden määrä on 5–10 prosenttia puhtaassa englanninkielisessä äänessä, 10–20 prosenttia äänekkäässä tai korostetussa äänessä. Suuret saman arkkitehtuurin variaatiot ovat huomattavasti parempia vaikeissa tapauksissa – valitse suurempi, kun ääni on karkeaa.
Kyllä – jokaisessa segmentissä on start/end-leimat. Vie SRT:nä tai VTT:nä ja aikakartta suoraan videollesi.
Wizper (Whisper v3) on premium-transkriptiomoottori, noin 500–1 500 kuponkia minuutissa. 1 $ = 750 000 kuponkia.
MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) – poistamme äänen. Max 500 MB per lataus. Pidemmät tiedostot? Jaa /audio/cut/ or use /v1/st/batch/.
Kaiuttimen diarisointi on erillinen kulkukortti, jossa "diarisoidaan" /transcription/. Wizper (Whisper v3) käsittelee transkriptiota; diarisoinnin tarroja kussakin segmentissä kaiuttimella 1 / kaiutin 2 / jne.
Kyllä – /batch/ hyväksyy äänitiedostojen kansion. Jokainen transkriptio laskeutuu /country/?tab=historiaan alkuperäisellä tiedostonimellä. Kansioiden ja puiden säilytykseen käytetään API:tä.
Yes — POST your audio to /v1/stt/transcribe/ with model="Wizper (Whisper v3)". Returns JSON with text + segments + word-level timestamps. /api/ has the full reference.
Itseohjautuvat mallit pitävät äänen GPU:issamme; premium kulkee läpi DPA:lla. Ääni poistetaan osakeikkunan jälkeen (24h anon, 7d kirjautuneena). Emme harjoittele tuloksillasi.
Kyllä – Free.ai myöntää transkriptioiden kaupallisen käytön. Tarvitset oikeudet lataamaasi äänitteeseen (omaan tallenteeseen, luvanvaraiseen materiaaliin tai sisältöön suostumuksella).
Reaaliaikakerroin on noin 0,05–0,2 x – 60 minuutin podcast kirjoitetaan 3–12 minuutissa. Premium-mallit valmistuvat usein nopeammin. Sulje välilehti jonon painikkeella.