ElevenLabs STT
Free.ai
·
stt
·
~500 märgid per minute
ElevenLabs STT on a kõne-teksti mudel. Marsruudil läbivad välised mudelid ~500 märgid minuti kohtaunit synonyms for matching user input (50% allahindlus võrreldes eelneva kuluga).
Kasutamine API kaudu
OpenAI ühilduv REST API. Genereeri võti ja kutsu seda mudelit sekundites.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
API dokumentatsioon
API võtme hankimine
Korduma kippuvad küsimused
ElevenLabs STT transcribes voed audio into text. Lae MP3, WAV, M4A või videofail ja ElevenLabs STT tagastab täieliku ärakirja pluss valikulised SRT/VTT subtiitrid ajatemplitega.
ElevenLabs STT tegeleb kümnete keeltega Whisper-peremudelid hõlmavad 90+, Parakeet katavad ~25, teised erinevad. Vali "automaatne tuvastamine" või määra keel kõrgeima täpsuse jaoks.
Word-error määr on 57-10% puhas inglise heli, 10-20% müra või aktsent heli. Suured variandid sama arhitektuuri teha tähendusrikkalt parem rasketel juhtudel ~ valida suurem, kui heli on töötlemata.
Jah, igas segmendis on stardi/lõpu ajatemplid. Ekspordi kui SRT või VTT ja ajad kaardi otse oma videole.
ElevenLabs STT on premium transkriptsiooni mootor. Umbes ~500- 1,500 märgid minutis heli. $1 = 750,000 märgid.
MP3, WAV, M4A, FLAC, OGG, pluss video (MP4, MOV, WebM) ~ me eraldada audio. Max 500 MB kohta üles laadida. Pikemad failid? Split with /audio/cut / või kasutada /v1/stt/batch /.
Speaker diarization on eraldi pass ~ toggle "diarize" on / trancribe /. ElevenLabs STT hands the transcription; diarization sildid iga segmendiga Speaker 1 / Speaker 2 / jne.
Jah / batch/ a kaust / audio failid Iga transkript asukohas konto /? tab=ajalugu koos originaal failinimi. Kaustapuu säilitamine kasutamine API.
Jah ~ POSTI audio /v1/stt/transcribe/ with model="ElevenLabs STT". Tagastab JSON- i teksti + segmentidega + sõnataseme ajatemplitega. /api/ on täielik viide.
Isehostitud mudelid hoida audio meie GPUs; premium läbida DPA. Audio kustutatakse pärast share-aken (24h anon, 7d signed-in). Me ei treeni oma sisendeid.
Jah Free.ai annab transkriptide kaubandusliku kasutamise. Vajad õigusi üleslaaditud audiole (oma salvestusele, litsentsitud materjalile või sisule koos nõusolekuga).
Reaalajas tegur on umbes 0.05-0.2× ~ 60-minutiline podcast trancribes 3~12 minutit. Premium mudelid sageli lõpetada kiiremini. Kasutage järjekorda nuppu sulgeda kaart.