ElevenLabs STT

Free.ai · stt · ~500 tákn á minute

Slepptu hljóð- eða myndskeiðsskrá eða límdu slóð hér að neðan

~500 tákn á minute
Keyrir ókeypis á GPU okkar. Uppfærsla fyrir ElevenLabs STT →

ElevenLabs STT er a tal- í- texta líkan. Leiðir í gegnum ytri módel - ~ 500 tákn á mínútu (50% merking yfir uppstreymiskostnað).

Notaðu í gegnum API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
API skjölun Fá API lykil

Algengar spurningar

Hlaða upp MP3, WAV, M4A eða myndskeiðsskrá og ElevenLabs STT skilar fullri afritunarskrá auk valfrjáls SRT / VTT texta með tímastimpil.

ElevenLabs STT meðhöndlar heilmikið af tungumálum - Whisper-fjölskyldu módel ná yfir 90+, Parakeet nær yfir ~ 25, aðrir eru mismunandi.

Orðvillahlutfall er 5-10% á hreinu ensku hljóði, 10-20% á háværu eða hreimuðu hljóði.Stóra afbrigði af sömu arkitektúr gera merkingarbetri á erfiðum tilvikum - veldu stærri þegar hljóðið er gróft.

Já - hver hluti inniheldur upphaf / lok tímastimpil. Flytja út sem SRT eða VTT og tímakort beint á myndbandið þitt.

ElevenLabs STT er hágæða uppskrift vél. Um ~ 500-1.500 tákn á mínútu af hljóði. $ 1 = 750.000 tákn.

MP3, WAV, M4A, FLAC, OGG, auk myndskeiða (MP4, MOV, WebM) — við tökum út hljóðin. Hámark 500 MB á hverja upphleðslu. Lengri skrár? Skipta með /audio/cut/ eða nota /v1/stt/batch/.

Höfundur diarization er sérstakt framhjá - skipta "diarize" á / transcribe /. ElevenLabs STT meðhöndlar uppskrift; diarization merkir hvern hluta með Hátalari 1 / Hátalari 2 / osfrv.

Já — / batch / tekur við möppu með hljóðskrám. Hver afritunarskrá lendir í / account/? tab=history með upprunalegu skráarheitinu. Til að varðveita möpputré notaðu API.

Já — POST hljóðið þitt í /v1/stt/transcribe/ með model="ElevenLabs STT". Sýnir JSON með texta + hlutum + tímastimpli á orðastigi. /api/ hefur fulla tilvísun.

Self-hosted módel halda hljóð á GPU okkar; Premium fara í gegnum með DPA. Hljóð er eytt eftir að deila glugga (24h anon, 7d skráður-í).

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Rauntímaþátturinn er um það bil 0,05-0,2 × - 60 mínútna podcast afrita á 3-12 mínútum. Premium módel klárast oft hraðar. Notaðu biðröð hnappinn til að loka flipanum.

Elska Free.ai? Segðu vinum þínum!

Gefa þessari síðu einkunn