ElevenLabs STT

Free.ai · stt · ~500 mynter per minute

Last opp lyd

Slipp en lyd- eller video- fil, eller lim inn en URL nedenfor

~500 mynter per minute

Kjører gratis på våre GPUer. Oppgradering til ElevenLabs STT →

ElevenLabs STT is a tale-til-tekst-modell. Rutet gjennom eksterne modeller — ~500 tokens per minutt (50% oppmerking over oppstrømskostnadene).

Bruk via API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'

API- dokumentasjon Hent API- nøkkel

Similar models

Fal Speech-to-Text

Wizper (Whisper v3)

Browse all models →

Ofte stilte spørsmål

ElevenLabs STT transcribes talte lyd til tekst. Last opp en MP3, WAV, M4A eller videofil og ElevenLabs STT returnerer fullstendig utskrift pluss valgfri SRT/VTT teksting med tidsstempel.

ElevenLabs STT håndterer dusinvis av språk — Whisper-familiemodeller dekker 90+, Parakeet deksler ~25, andre varierer. Velg « Autooppdag» eller oppgi språk for høyeste nøyaktighet.

Word- error rate er 5–10% på ren engelsk lyd, 10–20% på støy eller aksent lyd. Store varianter av samme arkitektur gjør meningsfylt bedre på hard- tilfeller – plukke større når lyden er grov.

Ja, hvert segment inneholder start - og slutt-tidsstempler. Eksporter som SRT eller VTT, og tidskartet rett på videoen.

ElevenLabs STT er en premium transkription motor. Om ~ 500– 1. 500 tokens per minutt lyd. $ 1 = 75 000 tokens.

MP3, WAV, M4A, FLAC, OGG, pluss video (MP4, MOV, WebM) – vi trekker ut lyden. Maks 500 MB per opplasting. Lengere filer? Del med /audio/ cut/ eller bruk / v1/ st/ batch /.

Høyttalerdiarisering er en egen pass – slå av/ på « diarize » på / transcribe /. ElevenLabs STT _ håndterer transkriptionen; diaarisering merker hvert segment med høyttaler 1 / høyttaler 2 / osv.

Ja – /atch/ acceptar en mappe med lydfiler. Hver utskrift lander i / account /? tab=historie med det opprinnelige filnavnet. Bruk API for mappe- tre.

Ja — POST din lyd til /v1/st/ trancribe/ with model="ElevenLabs STT _". Returnerer JSON med tekst + segmenter + tidsstempel på ordnivå. /api/ har full referanse.

Selvværte modeller holder lyden på våre GPUer, premium passerer gjennom med en DPA. Lyden slettes etter delingsvinduet (24h anon, 7d signert). Vi trener ikke på dine inndata.

Ja – Free.ai tildeler kommersiell bruk av utskrifter. Du trenger rettigheter til lyden du opplastet (deres eget opptak, lisensiert materiale eller innhold med samtykke).

Sanntidsfaktoren er omtrent 0. 05– 0. 2× – en 60- minutters podkasttranskriber på 3– 12 minutter. Premiummodeller avsluttes ofte raskere. Bruk køknappen for å lukke fanen.

ElevenLabs STT

Bruk via API

Similar models

Ofte stilte spørsmål

Hva gjør ElevenLabs STT?

Hvor mange språk støtter ElevenLabs STT?

Hvor nøyaktig er ElevenLabs STT?

Ta med tidsstempel ElevenLabs STT?

Hvor mye koster ElevenLabs STT i minuttet?

Hvilke lydformater kan jeg laste opp til ElevenLabs STT?

Can ElevenLabs STT identify different speakers?

Kan I batch transkribere med ElevenLabs STT?

Finnes det et API for ElevenLabs STT?

Hva med personvern når jeg transkriber med ElevenLabs STT?

Er ElevenLabs STT output sikkert for kommersiell bruk?

Hvor lang tid tar ElevenLabs STT?

Få 10 000 frie tegn

Vent - få 10K gratis tegn!

Vil du ha mer?