ElevenLabs STT
Free.ai
·
stt
·
~500 mynter per minute
ElevenLabs STT is a tale-til-tekst-modell. Rutet gjennom eksterne modeller — ~500 tokens per minutt (50% oppmerking over oppstrømskostnadene).
Bruk via API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
API- dokumentasjon
Hent API- nøkkel
Ofte stilte spørsmål
ElevenLabs STT transcribes talte lyd til tekst. Last opp en MP3, WAV, M4A eller videofil og ElevenLabs STT returnerer fullstendig utskrift pluss valgfri SRT/VTT teksting med tidsstempel.
ElevenLabs STT håndterer dusinvis av språk — Whisper-familiemodeller dekker 90+, Parakeet deksler ~25, andre varierer. Velg « Autooppdag» eller oppgi språk for høyeste nøyaktighet.
Word- error rate er 5–10% på ren engelsk lyd, 10–20% på støy eller aksent lyd. Store varianter av samme arkitektur gjør meningsfylt bedre på hard- tilfeller – plukke større når lyden er grov.
Ja, hvert segment inneholder start - og slutt-tidsstempler. Eksporter som SRT eller VTT, og tidskartet rett på videoen.
ElevenLabs STT er en premium transkription motor. Om ~ 500– 1. 500 tokens per minutt lyd. $ 1 = 75 000 tokens.
MP3, WAV, M4A, FLAC, OGG, pluss video (MP4, MOV, WebM) – vi trekker ut lyden. Maks 500 MB per opplasting. Lengere filer? Del med /audio/ cut/ eller bruk / v1/ st/ batch /.
Høyttalerdiarisering er en egen pass – slå av/ på « diarize » på / transcribe /. ElevenLabs STT _ håndterer transkriptionen; diaarisering merker hvert segment med høyttaler 1 / høyttaler 2 / osv.
Ja – /atch/ acceptar en mappe med lydfiler. Hver utskrift lander i / account /? tab=historie med det opprinnelige filnavnet. Bruk API for mappe- tre.
Ja — POST din lyd til /v1/st/ trancribe/ with model="ElevenLabs STT _". Returnerer JSON med tekst + segmenter + tidsstempel på ordnivå. /api/ har full referanse.
Selvværte modeller holder lyden på våre GPUer, premium passerer gjennom med en DPA. Lyden slettes etter delingsvinduet (24h anon, 7d signert). Vi trener ikke på dine inndata.
Ja – Free.ai tildeler kommersiell bruk av utskrifter. Du trenger rettigheter til lyden du opplastet (deres eget opptak, lisensiert materiale eller innhold med samtykke).
Sanntidsfaktoren er omtrent 0. 05– 0. 2× – en 60- minutters podkasttranskriber på 3– 12 minutter. Premiummodeller avsluttes ofte raskere. Bruk køknappen for å lukke fanen.