faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 tokens per minute

Ispusti audio ili video datoteku, ili zalijepi URL ispod

~500 tokens per minute

faster-whisper large-v3 is a model govor-u-tekst built by OpenAI / SYSTRAN. 2013.  (en) Rezultati za IC 555. Free.ai GPU-a — radi besplatno protiv vašeg dnevnog token poola (500 tokens u minuti). Objavljen pod MIT — komercijalna upotreba dozvoljena na Free.ai.

Korištenje putem API

OpenAI-kompatibilni REST API. Generiraj ključ i pozovi ovaj model u sekundi.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
API dokumentacija Pribavi API ključ

Često postavljana pitanja

faster-whisper large-v3 transkribira govoreni zvuk u tekst. Učitaj MP3, WAV, M4A, ili video datoteku i faster-whisper large-v3 će vratiti potpuni transkript plus opcionalne SRT/VTT titlove sa vremenskim oznakama.

faster-whisper large-v3 upravlja sa desetinama jezika — modeli Whisper-familije pokrivaju 90%, Parakeet pokrivaju ~25, ostali variraju. Odaberite "auto-detect" ili navedite jezik za najveću tačnost.

Stopa grešaka u riječima je 5-10% na čistom engleskom audio, 10-20% na bučnom ili naglašenom audio.Velike varijante iste arhitekture rade značajno bolje na teškim slučajevima - odaberite veće kada je audio grub.

Da — svaki segment uključuje početni/zadnji vremenski pečat. Izvozi kao SRT ili VTT i vremenska mapa će se direktno prikazati na video.

faster-whisper large-v3 radi na našim vlastitim GPU-ovima protiv vašeg dnevnog besplatnog bazena prvo; $5 → 200.000 plaćenih žetona nakon toga. Oko ~500 žetona u minuti.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — izvlačimo audio. Maksimalno 500 MB po uploadu. Dulje datoteke? Podijelite sa /audio/cut/ ili koristite /v1/stt/batch/.

Diarizacija govornika je zasebni prolaz — prebacite "diarize" na /transcribe/. faster-whisper large-v3 se bavi transkripcijom; diarizacija označava svaki segment sa Speaker 1 / Speaker 2 / itd.

Da — /batch/ prihvata direktorij audio datoteka. Svaki transkript završava u /account/?tab=history sa originalnim imenom datoteke. Za očuvanje stabla direktorija koristite API.

"The 100 Greatest Albums of All Time".  "The 100 Greatest Albums of All Time".  "The 100 Greatest Albums of All Time".  "The 100 Greatest Albums of All Time".  "The 100 Greatest Albums of All Time".

Modeli koji se sami hostaju zadržavaju zvuk na našim GPU-ovima; premium prolazi kroz DPA. Zvuk se briše nakon prozora za dijeljenje (24h anon, 7d prijave). Mi ne treniramo na vašim ulazima.

Da — Free.ai dozvoljava komercijalnu upotrebu transkripta. Trebate prava na audio koji ste učitali (vaša vlastita snimka, licencirani materijal, ili sadržaj sa pristankom).

Faktor realnog vremena je otprilike 0.05-0.2× — 60-minutni podcast se transkribira za 3-12 minuta. Premium modeli često završavaju brže. Koristite dugme reda da zatvorite karticu.

Volite Free.ai?

Ocijeni ovu stranicu