ElevenLabs STT
Free.ai
·
stt
·
~500 жетон/ секунд minute
ElevenLabs STT — a және сөйлеуден мәтінге модель. 1995 жылы 100% акциялар (100% акциялар) «Қазақстан темір жолы» ҰК» АҚ-на (бұдан әрі – «ҚТЖ») сатылған.
API арқылы қолдану
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
API құжаттамасы
API кілтін алу
Жиі қойылатын сұрақтар
ElevenLabs STT сөйлеген дыбыстарды мәтінге аударады. MP3, WAV, M4A немесе видео файлды жүктеп алыңыз, ElevenLabs STT толық транскриптті және таңдаулы SRT/VTT субтитрлерін уақыт белгісімен қайтарады.
ElevenLabs STT бірнеше тілдерді қолдайды — Whisper-семейлігінің үлгілері 90+ тілді қамтиды, Parakeet ~25 тілді қамтиды, басқалары әртүрлі. Ең дәл болу үшін "авто-табу" дегенді таңдаңыз немесе тілді келтіріңіз.
Сөз қателерінің деңгейі таза ағылшын тілінде 5- 10%, шулы немесе акцентті дыбыстарда 10- 20% құрайды. Осы архитектураның үлкен нұсқалары қатты дыбыстарда жақсы жұмыс істейді - дыбыс қатты болса, үлкенін таңдаңыз.
Иә — әрбір сегмент бастау/ аяқтау уақыт белгісін қамтиды. SRT не VTT түрінде экспорттау және уақыт белгілерін тікелей бейнеге түсіру.
ElevenLabs STT - бұл жоғары сапалы транскрипция тетігі. Аудио минутына шамамен ~500-1500 жетон. $1 = 750 000 жетон.
MP3, WAV, M4A, FLAC, OGG, сонымен қатар видео (MP4, MOV, WebM) — аудионы тарқатамыз. Бір жүктеу үшін максимум 500 МБ. Ұзын файлдар? /audio/cut/ арқылы бөліңіз немесе /v1/stt/batch/ қолданыңыз.
Диаграммада 1-ші және 2-ші нұсқалар арасындағы айырмашылықтар көрсетілген: 1-ші нұсқада 1-ші нұсқада 2-ші нұсқада 3-ші нұсқада 4-ші нұсқада 5-ші нұсқада 6-шы нұсқада 7-ші нұсқада 8-ші нұсқада 9-шы нұсқада 10-шы нұсқада 11-ші нұсқада 12-ші нұсқада 13-ші нұсқада 14-ші нұсқада 15-ші нұсқада 16-шы нұсқада 17-ші нұсқада 18-ші нұсқада 19-шы нұсқада 20-шы нұсқада 21-ші нұсқада 22-ші нұсқада 23-ші нұсқада 24-ші нұсқада 25-ші нұсқада 26-шы нұсқада 27-ші нұсқада 28-ші нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы
Иә — / batch / аудио файлдар қапшығын қабылдайды. Әрбір транскрипция / account /? tab=history дегенге бастапқы файл атауымен түседі. Қапшық- бұтақты сақтау үшін API- ны қолданыңыз.
Иә — Аудиоңызды /v1/stt/transcribe/ дегенге POST етіп, model="ElevenLabs STT" деп жазыңыз. JSON мәтіні + сегменттері + сөз деңгейіндегі уақыт белгісімен қайтарылады. /api/ толық сілтемесі бар.
Өз- өзіміздің хосттағы модельдеріміз аудионы GPU- ларда сақтайды; премиум модельдер DPA арқылы өткізеді. Аудио бөлісу терезесінен кейін өшіріледі (24 сағат анонимді, 7 күн жүйеге кірген). Біз сіздің кірістеріңізді оқымаймыз.
Иә — Free.ai транскрипттерді коммерциялық пайдалануға рұқсат береді. Жүктелген аудиоға құқықтарыңыз болуы керек (өзіңіздің жазбаңыз, лицензияланған материал немесе рұқсатпен мазмұн).
Реал уақыт коэффициенті шамамен 0.05-0.2× — 60 минуттық подкаст 3-12 минутта жазылады. Premium үлгілері көбінесе тезірек аяқталады. Қойындыны жабу үшін кезек батырмасын басыңыз.