faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 tokens per minute

_Učitaj

Ispusti audio ili video datoteku, ili zalijepi URL ispod

~500 tokens per minute

faster-whisper large-v3 is a model govor-u-tekst built by OpenAI / SYSTRAN. 2013. (en) Rezultati za IC 555. Free.ai GPU-a — radi besplatno protiv vašeg dnevnog token poola (500 tokens u minuti). Objavljen pod MIT — komercijalna upotreba dozvoljena na Free.ai.

Korištenje putem API

OpenAI-kompatibilni REST API. Generiraj ključ i pozovi ovaj model u sekundi.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

API dokumentacija Pribavi API ključ

Slični modeli

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Pregledaj sve modele →

Često postavljana pitanja

faster-whisper large-v3 transkribira govoreni zvuk u tekst. Učitaj MP3, WAV, M4A, ili video datoteku i faster-whisper large-v3 će vratiti potpuni transkript plus opcionalne SRT/VTT titlove sa vremenskim oznakama.

faster-whisper large-v3 upravlja sa desetinama jezika — modeli Whisper-familije pokrivaju 90%, Parakeet pokrivaju ~25, ostali variraju. Odaberite "auto-detect" ili navedite jezik za najveću tačnost.

Stopa grešaka u riječima je 5-10% na čistom engleskom audio, 10-20% na bučnom ili naglašenom audio.Velike varijante iste arhitekture rade značajno bolje na teškim slučajevima - odaberite veće kada je audio grub.

Da — svaki segment uključuje početni/zadnji vremenski pečat. Izvozi kao SRT ili VTT i vremenska mapa će se direktno prikazati na video.

faster-whisper large-v3 radi na našim vlastitim GPU-ovima protiv vašeg dnevnog besplatnog bazena prvo; $5 → 200.000 plaćenih žetona nakon toga. Oko ~500 žetona u minuti.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — izvlačimo audio. Maksimalno 500 MB po uploadu. Dulje datoteke? Podijelite sa /audio/cut/ ili koristite /v1/stt/batch/.

Diarizacija govornika je zasebni prolaz — prebacite "diarize" na /transcribe/. faster-whisper large-v3 se bavi transkripcijom; diarizacija označava svaki segment sa Speaker 1 / Speaker 2 / itd.

Da — /batch/ prihvata direktorij audio datoteka. Svaki transkript završava u /account/?tab=history sa originalnim imenom datoteke. Za očuvanje stabla direktorija koristite API.

"The 100 Greatest Albums of All Time". "The 100 Greatest Albums of All Time". "The 100 Greatest Albums of All Time". "The 100 Greatest Albums of All Time". "The 100 Greatest Albums of All Time".

Modeli koji se sami hostaju zadržavaju zvuk na našim GPU-ovima; premium prolazi kroz DPA. Zvuk se briše nakon prozora za dijeljenje (24h anon, 7d prijave). Mi ne treniramo na vašim ulazima.

Da — Free.ai dozvoljava komercijalnu upotrebu transkripta. Trebate prava na audio koji ste učitali (vaša vlastita snimka, licencirani materijal, ili sadržaj sa pristankom).

Faktor realnog vremena je otprilike 0.05-0.2× — 60-minutni podcast se transkribira za 3-12 minuta. Premium modeli često završavaju brže. Koristite dugme reda da zatvorite karticu.

faster-whisper large-v3

Korištenje putem API

Slični modeli

Često postavljana pitanja

Šta radi faster-whisper large-v3?

Koliko jezika podržava faster-whisper large-v3?

Koliko je tačno faster-whisper large-v3?

Da li faster-whisper large-v3 uključuje vremenske pečate?

Koliko košta faster-whisper large-v3 po minuti?

Koje audio formate mogu da prenesem na faster-whisper large-v3?

Može li faster-whisper large-v3 identificirati različite govornike?

Mogu li da prepisem paket sa faster-whisper large-v3?

Da li postoji API za faster-whisper large-v3?

Šta je sa privatnošću kada transkribiram sa faster-whisper large-v3?

Da li je faster-whisper large-v3 izlaz siguran za komercijalnu upotrebu?

Koliko dugo traje faster-whisper large-v3?

Dobijte 10.000 besplatnih žetona

Čekajte - Uzmite 10K besplatnih žetona!

Hoćeš još?