ElevenLabs STT
Free.ai
·
stt
·
~500 бирдик minute
ElevenLabs STT - a сүйлөмдөн-текстке моделдөө. Сырткы моделдер аркылуу багытталган — ~500 токендери мүнөтүнө (50% маркировка жогорудагы баадан).
API аркылуу колдонуу
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
Документация
API ачкычын алуу
Кайсы убакта суроолор берилет
ElevenLabs STT сүйлөмдү аудиого которуп берет. MP3, WAV, M4A же видеофайлды жүктөп алыңыз, ElevenLabs STT толук транскрипт жана кошумча SRT/VTT субтитрлерин убакыт белгилери менен кайтарат.
ElevenLabs STT бир нече тилдер менен иштей алат — Whisper-family моделдери 90+, Parakeet ~25, башкалары ар кандай. "авто-обнаружение" тандаңыз же эң жогорку тактык үчүн тилдин аталышын белгилеңиз.
Сөз каталардын деңгээли таза англис аудиосунда 5-10%, ызы-чуу же акцент менен жазылган аудиодо 10-20%. Ошол эле архитектуранын чоң варианттары оор учурларда жакшы иштешет — аудио катуу болгондо чоңураак вариантты тандаңыз.
Ооба — ар бир сегментте башталыш/аяктоо убактысы бар. Экспорттоо SRT же VTT форматында, убакытты түз эле видеого киргизүү.
ElevenLabs STT - бул премиум транскрипциялоо тутуму. Аудио мүнөтүнө ~500-1,500 жетон. $1 = 750,000 жетон.
MP3, WAV, M4A, FLAC, OGG, плюс видео (MP4, MOV, WebM) — аудиону чыгарабыз. Максимум 500 МБ жүктөп алууга. Узак файлдар? /audio/cut/ менен бөлүп чыгаруу же /v1/stt/batch/ колдонуп чыгаруу.
Диализ - бул өзүнчө процесс — /transcribe/-де "diarize" дегенди тандаңыз. ElevenLabs STT транскрипцияны аткарат; диализ ар бир сегментке сүйлөгөн 1 / сүйлөгөн 2 / ж.б. деген белгини берет.
Да — /batch/ аудиофайлдардын папкасын кабыл алат. Ар бир транскрипция /account/?tab=history каталогуна оригиналдуу файл аты менен түшөт. Папка-дарагын сактоо үчүн API колдонулат.
Да — аудиону /v1/stt/transcribe/ менен POST кылыңыз, model="ElevenLabs STT". JSON текст + сегменттер + сөз деңгээлиндеги убакыт белгилери менен кайтарылат. /api/ толук шилтемени камтыйт.
Автономдук моделдер аудиону биздин GPU-да сакташат; премиум моделдер DPA менен өткөрүшөт. Аудио бөлүшүү терезеси аяктагандан кийин өчүрүлөт (24 саат анонимдүү, 7 күндүк кирүү). Биз сиздин киргизүүңүздү тренировка кылбайбыз.
Да — Free.ai транскрипттерди коммерциялык максатта колдонууга уруксат берет. Сизге жүктөп алган аудионун укуктары керек (өзүңүздүн жаздыруу, лицензияланган материалдар же уруксат берилген мазмун).
Реальный коэффициент приблизительно 0.05-0.2× — 60-минутный подкаст транскрибируется в 3-12 минутах. Премиум модели обычно заканчиваются быстрее. Используйте кнопку очереди, чтобы закрыть заголовок.