Fal Speech-to-Text

Free.ai · stt · ~500 unit synonyms for matching user input minute

Dobjon le egy audio vagy video fájlt, vagy illessze be egy URL-t az alábbi

~500 unit synonyms for matching user input minute
Szabadon fut a GPU-n. Frissítés Fal Speech-to-Text →

Fal Speech-to-Text a beszéd-szöveg modell. Külső modelleken keresztül vezetve ~500 tokens Percenként (50%-os felár a upstream költség felett).

Alkalmazása API-n keresztül

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
API dokumentáció Szerezd meg az API kulcsot

Gyakran ismételt kérdések

Fal Speech-to-Text átírja a beszélt audiót szövegbe. MP3, WAV, M4A vagy videó fájl feltöltése és Fal Speech-to-Text visszaadja a teljes átiratot plusz az opcionális SRT/VTT feliratokat időbélyegekkel.

Fal Speech-to-Text kezeli több tucat nyelv • Whisper-családi modellek fedez 90+, Parakeet fedi ~25, mások változó. Válassza ki a "auto-detect" vagy adja meg a nyelvet a legmagasabb pontosság érdekében.

A Word-error arány 50% 10% a tiszta angol audió, 100%20% a zajos vagy kihangsúlyozott audió. Nagy változatok az azonos architektúra nem jelentõsen jobb a kemény esetekben, ha az audió durva.

Igen, minden szegmens tartalmaz start/end időbélyegeket. Exportálás SRT vagy VTT és az idő térkép egyenesen a videóra.

Fal Speech-to-Text egy prémium átirati motor. Körülbelül ~500 ~1,500 token per perc audio. $750,000 token.

MP3, WAV, M4A, FLAC, OGG, plusz videó (MP4, MOV, WebM) kivonjuk az audiót. Max 500 MB/feltöltés. Hosszabb fájlok? /audio/cut/ vagy /v1/stt/batch/.

A szónoki diarization egy külön pass "diarize" a /transcribe/. Fal Speech-to-Text kezeli az átírást; diarization címkék minden szegmensben a hangszóró 1 / hangszóró 2 / stb.

Igen /batch / elfogad egy mappát audio fájlokat. Minden átirat a /account/?tab=történelem az eredeti fájlnévvel. Mappa-fa megőrzéshez használja az API-t.

Igen, Post your audio to /v1/stt/transscribe/ with model="Fal Speech-to-Text". Returns JSON with text + szegmensek + word-level timestamps. /api/ has the full reference.

Önálló modellek tartsa hang a GPU-k; prémium át egy DPA. Audio törlésre kerül után a megosztás-ablak (24h anon, 7d signated-in). Mi nem vonat a bemenetek.

Igen, Free.ai ad kereskedelmi használatát átiratok. Szüksége van jogok audio feltöltött (a saját felvétel, engedéllyel rendelkező anyag, vagy tartalom hozzájárulás).

Real-time faktor nagyjából 0.05-0,2× · 60 perces podcast trascribe-ok 36-12 perc alatt. Premium modellek gyakran gyorsabban befejezik. Használja a sor gombot, hogy bezárja a fület.

Love this tool? Share it!

Szavazz erre az oldalra