faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 kuponkeja per minute

Lataa ääni

Pudota ääni- tai videotiedosto tai liitä alla oleva URL

~500 kuponkeja per minute

faster-whisper large-v3 on a puheesta tekstiin -malli rakentanut OpenAI / SYSTRAN. Vahvin osoitteessa Accurate transcription. Itsekeskeinen Free.ai GPU:lla – kulkee vapaasti päivittäistä pokaalia vastaan ({tpm_tokeno},minuutissa). Vapautettu nimellä MIT, kaupallinen käyttö sallittu Free.ai:lla.

Käyttö API:n kautta

OpenAI-yhteensopiva REST API. Luo avain ja soita tähän malliin sekunneissa.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

API-dokumentaatio Hae API-avain

Samankaltaiset mallit

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Selaa kaikkia malleja →

Usein kysyttyjä kysymyksiä

â € € #faster-whisper large-v3 _ transscripteds speed audio into text. Lataa MP3, WAV, M4A tai videotiedosto ja â €faster-whisper large-v3 returned the full transkript plus optional SRT/VTT tekstitys aikaleimalla.

faster-whisper large-v3 käsittelee kymmeniä kieliä – Whisper-perhemallit kattavat 90+, Parakeet kattaa ~25, muut vaihtelevat. Valitse "auto-havaitse" tai määrittele kieli mahdollisimman tarkasti.

Sanavirheiden määrä on 5–10 prosenttia puhtaassa englanninkielisessä äänessä, 10–20 prosenttia äänekkäässä tai korostetussa äänessä. Suuret saman arkkitehtuurin variaatiot ovat huomattavasti parempia vaikeissa tapauksissa – valitse suurempi, kun ääni on karkeaa.

Kyllä – jokaisessa segmentissä on start/end-leimat. Vie SRT:nä tai VTT:nä ja aikakartta suoraan videollesi.

faster-whisper large-v3 kulkee omilla GPU:illamme ensin päivittäistä ilmaista uima-allasta vastaan; $5 → 200 000 maksettua kuponkia sen jälkeen. Noin ~500 kuponkia minuutissa.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) – poistamme äänen. Max 500 MB per lataus. Pidemmät tiedostot? Jaa /audio/cut/ or use /v1/st/batch/.

Kaiuttimen diarisointi on erillinen kulkukortti, jossa "diarisoidaan" /transcription/. faster-whisper large-v3 käsittelee transkriptiota; diarisoinnin tarroja kussakin segmentissä kaiuttimella 1 / kaiutin 2 / jne.

Kyllä – /batch/ hyväksyy äänitiedostojen kansion. Jokainen transkriptio laskeutuu /country/?tab=historiaan alkuperäisellä tiedostonimellä. Kansioiden ja puiden säilytykseen käytetään API:tä.

Kyllä – PYSÄYTTÄÄ äänen tasolle /v1/st/transcribe/ with model="faster-whisper large-v3". Palauttaa JSONin tekstillä + segmenteillä + sanatasolla. /apilla on koko viite.

Itseohjautuvat mallit pitävät äänen GPU:issamme; premium kulkee läpi DPA:lla. Ääni poistetaan osakeikkunan jälkeen (24h anon, 7d kirjautuneena). Emme harjoittele tuloksillasi.

Kyllä – Free.ai myöntää transkriptioiden kaupallisen käytön. Tarvitset oikeudet lataamaasi äänitteeseen (omaan tallenteeseen, luvanvaraiseen materiaaliin tai sisältöön suostumuksella).

Reaaliaikakerroin on noin 0,05–0,2 x – 60 minuutin podcast kirjoitetaan 3–12 minuutissa. Premium-mallit valmistuvat usein nopeammin. Sulje välilehti jonon painikkeella.

faster-whisper large-v3

Käyttö API:n kautta

Samankaltaiset mallit

Usein kysyttyjä kysymyksiä

Mitä faster-whisper large-v3 tekee?

Kuinka monta kieltä faster-whisper large-v3 tukee?

Kuinka tarkka faster-whisper large-v3 on?

Sisältääkö faster-whisper large-v3 aikaleimat?

Paljonko "faster-whisper large-v3" maksaa minuutissa?

Mitä ääniformaatteja voin ladata osoitteeseen faster-whisper large-v3?

Voikofaster-whisper large-v3 tunnistaa eri kaiuttimet?

Voinko kirjoittaa erään faster-whisper large-v3?

Onko faster-whisper large-v3-rajapintaa?

Entä yksityisyys, kun kirjoitan faster-whisper large-v3?

Onko faster-whisper large-v3-ulostulo turvallinen kaupalliseen käyttöön?

Kuinka kauan faster-whisper large-v3 kestää?

Hanki 10 000 ilmaista tokenia

Odota – hanki 10 000 ilmaista tokenia!

Haluatko lisää?