faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 unit synonyms for matching user input minute

Audió feltöltése

Dobjon le egy audio vagy video fájlt, vagy illessze be egy URL-t az alábbi

~500 unit synonyms for matching user input minute

faster-whisper large-v3 a beszéd-szöveg modell készítette OpenAI / SYSTRAN. A legerősebb aAccurate transcription. Önálló, Free.ai GPU-n fut ingyenes ellen a napi token medence (500 tokens Percenként). A MIT alatt kiadott kereskedelmi célú felhasználás megengedett Free.ai-en.

Alkalmazása API-n keresztül

OpenAI-kompatibilis REST API. Létrehoz egy kulcsot, és hívja ezt a modellt másodpercek alatt.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

API dokumentáció Szerezd meg az API kulcsot

Hasonló modellek

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Az összes modell böngészése →

Gyakran ismételt kérdések

faster-whisper large-v3 átírja a beszélt audiót szövegbe. MP3, WAV, M4A vagy videó fájl feltöltése és faster-whisper large-v3 visszaadja a teljes átiratot plusz az opcionális SRT/VTT feliratokat időbélyegekkel.

faster-whisper large-v3 kezeli több tucat nyelv • Whisper-családi modellek fedez 90+, Parakeet fedi ~25, mások változó. Válassza ki a "auto-detect" vagy adja meg a nyelvet a legmagasabb pontosság érdekében.

A Word-error arány 50% 10% a tiszta angol audió, 100%20% a zajos vagy kihangsúlyozott audió. Nagy változatok az azonos architektúra nem jelentõsen jobb a kemény esetekben, ha az audió durva.

Igen, minden szegmens tartalmaz start/end időbélyegeket. Exportálás SRT vagy VTT és az idő térkép egyenesen a videóra.

faster-whisper large-v3 fut a saját GPU ellen a napi ingyenes medence először; $5 → 200 000 fizetett zseton után. Körülbelül ~500 zseton percenként.

MP3, WAV, M4A, FLAC, OGG, plusz videó (MP4, MOV, WebM) kivonjuk az audiót. Max 500 MB/feltöltés. Hosszabb fájlok? /audio/cut/ vagy /v1/stt/batch/.

A szónoki diarization egy külön pass "diarize" a /transcribe/. faster-whisper large-v3 kezeli az átírást; diarization címkék minden szegmensben a hangszóró 1 / hangszóró 2 / stb.

Igen /batch / elfogad egy mappát audio fájlokat. Minden átirat a /account/?tab=történelem az eredeti fájlnévvel. Mappa-fa megőrzéshez használja az API-t.

Igen, Post your audio to /v1/stt/transscribe/ with model="faster-whisper large-v3". Returns JSON with text + szegmensek + word-level timestamps. /api/ has the full reference.

Önálló modellek tartsa hang a GPU-k; prémium át egy DPA. Audio törlésre kerül után a megosztás-ablak (24h anon, 7d signated-in). Mi nem vonat a bemenetek.

Igen, Free.ai ad kereskedelmi használatát átiratok. Szüksége van jogok audio feltöltött (a saját felvétel, engedéllyel rendelkező anyag, vagy tartalom hozzájárulás).

Real-time faktor nagyjából 0.05-0,2× · 60 perces podcast trascribe-ok 36-12 perc alatt. Premium modellek gyakran gyorsabban befejezik. Használja a sor gombot, hogy bezárja a fület.

faster-whisper large-v3

Alkalmazása API-n keresztül

Hasonló modellek

Gyakran ismételt kérdések

Mit csinál afaster-whisper large-v3 do?

Hány nyelvet támogat a faster-whisper large-v3?

Mennyire pontos a faster-whisper large-v3?

A faster-whisper large-v3 tartalmazza az időbélyegeket?

Mennyibe kerül per perc faster-whisper large-v3?

Milyen hangformátumokba tudok feltölteni faster-whisper large-v3-re?

Képes azonosítani a különböző hangszórókat?

Átírhatom faster-whisper large-v3-el?

Van-e API a faster-whisper large-v3-re?

Mi a helyzet a magánélettel, ha átírom a faster-whisper large-v3-t?

A faster-whisper large-v3 kimenet biztonságos kereskedelmi használatra?

Mennyi ideig tart a faster-whisper large-v3?

Szerezz 10 000 ingyen zsetont!

Várj, kapsz 10K ingyen zsetont!

Kérsz még?