faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 kuponkeja per minute

Pudota ääni- tai videotiedosto tai liitä alla oleva URL

~500 kuponkeja per minute

faster-whisper large-v3 on a puheesta tekstiin -malli rakentanut OpenAI / SYSTRAN. Vahvin osoitteessa Accurate transcription. Itsekeskeinen Free.ai GPU:lla – kulkee vapaasti päivittäistä pokaalia vastaan ({tpm_tokeno},minuutissa). Vapautettu nimellä MIT, kaupallinen käyttö sallittu Free.ai:lla.

Käyttö API:n kautta

OpenAI-yhteensopiva REST API. Luo avain ja soita tähän malliin sekunneissa.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
API-dokumentaatio Hae API-avain

Usein kysyttyjä kysymyksiä

â € € #faster-whisper large-v3 _ transscripteds speed audio into text. Lataa MP3, WAV, M4A tai videotiedosto ja â €faster-whisper large-v3 returned the full transkript plus optional SRT/VTT tekstitys aikaleimalla.

faster-whisper large-v3 käsittelee kymmeniä kieliä – Whisper-perhemallit kattavat 90+, Parakeet kattaa ~25, muut vaihtelevat. Valitse "auto-havaitse" tai määrittele kieli mahdollisimman tarkasti.

Sanavirheiden määrä on 5–10 prosenttia puhtaassa englanninkielisessä äänessä, 10–20 prosenttia äänekkäässä tai korostetussa äänessä. Suuret saman arkkitehtuurin variaatiot ovat huomattavasti parempia vaikeissa tapauksissa – valitse suurempi, kun ääni on karkeaa.

Kyllä – jokaisessa segmentissä on start/end-leimat. Vie SRT:nä tai VTT:nä ja aikakartta suoraan videollesi.

faster-whisper large-v3 kulkee omilla GPU:illamme ensin päivittäistä ilmaista uima-allasta vastaan; $5 → 200 000 maksettua kuponkia sen jälkeen. Noin ~500 kuponkia minuutissa.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) – poistamme äänen. Max 500 MB per lataus. Pidemmät tiedostot? Jaa /audio/cut/ or use /v1/st/batch/.

Kaiuttimen diarisointi on erillinen kulkukortti, jossa "diarisoidaan" /transcription/. faster-whisper large-v3 käsittelee transkriptiota; diarisoinnin tarroja kussakin segmentissä kaiuttimella 1 / kaiutin 2 / jne.

Kyllä – /batch/ hyväksyy äänitiedostojen kansion. Jokainen transkriptio laskeutuu /country/?tab=historiaan alkuperäisellä tiedostonimellä. Kansioiden ja puiden säilytykseen käytetään API:tä.

Kyllä – PYSÄYTTÄÄ äänen tasolle /v1/st/transcribe/ with model="faster-whisper large-v3". Palauttaa JSONin tekstillä + segmenteillä + sanatasolla. /apilla on koko viite.

Itseohjautuvat mallit pitävät äänen GPU:issamme; premium kulkee läpi DPA:lla. Ääni poistetaan osakeikkunan jälkeen (24h anon, 7d kirjautuneena). Emme harjoittele tuloksillasi.

Kyllä – Free.ai myöntää transkriptioiden kaupallisen käytön. Tarvitset oikeudet lataamaasi äänitteeseen (omaan tallenteeseen, luvanvaraiseen materiaaliin tai sisältöön suostumuksella).

Reaaliaikakerroin on noin 0,05–0,2 x – 60 minuutin podcast kirjoitetaan 3–12 minuutissa. Premium-mallit valmistuvat usein nopeammin. Sulje välilehti jonon painikkeella.

Love this tool? Share it!

Arvostele tätä sivua