ElevenLabs STT

Free.ai · stt · ~500 kuponkeja per minute

Pudota ääni- tai videotiedosto tai liitä alla oleva URL

~500 kuponkeja per minute
GPU:t ovat ilmaisia. Päivitys ElevenLabs STT →

ElevenLabs STT on a puheesta tekstiin -malli. Routed through external models — ~500 tokens minuutissa (50% markup over upstream cost).

Käyttö API:n kautta

OpenAI-yhteensopiva REST API. Luo avain ja soita tähän malliin sekunneissa.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
API-dokumentaatio Hae API-avain

Usein kysyttyjä kysymyksiä

â € € #ElevenLabs STT _ transscripteds speed audio into text. Lataa MP3, WAV, M4A tai videotiedosto ja â €ElevenLabs STT returned the full transkript plus optional SRT/VTT tekstitys aikaleimalla.

ElevenLabs STT handles dozens of languages — Whisper-family models cover 90+, Parakeet covers ~25, others vary. Pick "auto-detect" or specify the language for highest accuracy.

Sanavirheiden määrä on 5–10 prosenttia puhtaassa englanninkielisessä äänessä, 10–20 prosenttia äänekkäässä tai korostetussa äänessä. Suuret saman arkkitehtuurin variaatiot ovat huomattavasti parempia vaikeissa tapauksissa – valitse suurempi, kun ääni on karkeaa.

Kyllä – jokaisessa segmentissä on start/end-leimat. Vie SRT:nä tai VTT:nä ja aikakartta suoraan videollesi.

ElevenLabs STT on premium-transkriptiomoottori, noin 500–1 500 kuponkia minuutissa. 1 $ = 750 000 kuponkia.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) – poistamme äänen. Max 500 MB per lataus. Pidemmät tiedostot? Jaa /audio/cut/ or use /v1/st/batch/.

Kaiuttimen diarisointi on erillinen kulkukortti, jossa "diarisoidaan" /transcription/. ElevenLabs STT käsittelee transkriptiota; diarisoinnin tarroja kussakin segmentissä kaiuttimella 1 / kaiutin 2 / jne.

Kyllä – /batch/ hyväksyy äänitiedostojen kansion. Jokainen transkriptio laskeutuu /country/?tab=historiaan alkuperäisellä tiedostonimellä. Kansioiden ja puiden säilytykseen käytetään API:tä.

Yes — POST your audio to /v1/stt/transcribe/ with model="ElevenLabs STT". Returns JSON with text + segments + word-level timestamps. /api/ has the full reference.

Itseohjautuvat mallit pitävät äänen GPU:issamme; premium kulkee läpi DPA:lla. Ääni poistetaan osakeikkunan jälkeen (24h anon, 7d kirjautuneena). Emme harjoittele tuloksillasi.

Kyllä – Free.ai myöntää transkriptioiden kaupallisen käytön. Tarvitset oikeudet lataamaasi äänitteeseen (omaan tallenteeseen, luvanvaraiseen materiaaliin tai sisältöön suostumuksella).

Reaaliaikakerroin on noin 0,05–0,2 x – 60 minuutin podcast kirjoitetaan 3–12 minuutissa. Premium-mallit valmistuvat usein nopeammin. Sulje välilehti jonon painikkeella.

Love this tool? Share it!

Arvostele tätä sivua