ElevenLabs STT

Free.ai · stt · ~500 жетони на minute

Пускане на аудио или видео файл, или поставяне на URL по-долу

~500 жетони на minute
Тече безплатно на нашите ГПУ. Подновяване за ElevenLabs STT →

ElevenLabs STT е a модел на изказване-в-текст. Посочена през външни модели — ~500 žeтони за минута (50% маркиране над разходите на горния поток).

Използване чрез API

Съгласен с OpenAI REST API. Генерирайте ключ и се обадете на този модел в секунди.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
API документация Вземете API ключ

Често задавани въпроси

ElevenLabs STT transscribes говори аудио в текст. Качете MP3, WAV, M4A или видео файл и ElevenLabs STT _ връща пълния транскрипт плюс опционални SRT/VTT субтитри с часове.

ElevenLabs STT обработва десетки езици — Whisper-семейни модели покриват 90+, Parakeet обхваща ~25, други варират. Изберете "автодетектор" или посочете езика за най-висока точност.

Честотата на Word-terror е 5-10% на чист английски аудио, 10-20% на шумен или акцентиран аудио. Големи варианти на една и съща архитектура са значително по-добри в трудни случаи — избират по-големи, когато звукът е груб.

Да — всеки сегмент включва часове за старт/край. Експортирайте като SRT или VTT и времевата карта директно на видеото ви.

ElevenLabs STT е премиум транскрипционен двигател. Около ~500–1,500 жетона на минута аудио. $1 = 750 000 жетона.

MP3, WAV, M4A, FLAC, OGG, плюс видео (MP4, MOV, WebM) — ние извличаме звука. Макс. 500 MB за качане. По-дълги файлове? Разделите с /audio/cut/ или използвайте /v1/stt/batch /.

Диаграфизацията на спикера е отделно пропускане — включване на "диаризиране" на /transcribe/. ElevenLabs STT обработва транскрипцията; диаризация етикети всеки сегмент с Speaker 1 / Speaker 2 / etc.

Да — /batch/ приема папка от аудио файлове. Всеки транскрипт се качва в /account /?tab=история с оригиналното име на име. За запазване на папка- дърво използвайте API.

Да — ПОСТ аудиото си на /v1/stt/transcribe/ с модел="ElevenLabs STT". Връща JSON с текст + сегменти + времеви табели на нивото на думи. /api/ има пълното позоваване.

Самоу домакинските модели държат звука на нашите GPU; премиум преминаване с DPA. Аудио се изтрива след акционерния прозорец (24h anon, 7d sign-in). Ние не тренираме на вашите входове.

Да — Free.ai предоставя търговско използване на транскрипти. Нуждаете се от права на аудиото, което качвате (всички ваши записи, лицензирани материали или съдържание с съгласие).

Факторът в реално време е около 0.05–0.2× — 60-минутен транскрипт за подкаст за 3—12 минути. Премиум модели често завършват по-бързо. Използвайте бутона за редица, за да затворите разпространението.

Love this tool? Share it!

Оцени тази страница