ElevenLabs STT

Free.ai · stt · ~500 жетони на minute

Качване на звук

Пускане на аудио или видео файл, или поставяне на URL по-долу

~500 жетони на minute

Тече безплатно на нашите ГПУ. Подновяване за ElevenLabs STT →

ElevenLabs STT е a модел на изказване-в-текст. Посочена през външни модели — ~500 žeтони за минута (50% маркиране над разходите на горния поток).

Използване чрез API

Съгласен с OpenAI REST API. Генерирайте ключ и се обадете на този модел в секунди.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'

API документация Вземете API ключ

Подобни модели

Fal Speech-to-Text

Wizper (Whisper v3)

Преглед на всички модели →

Често задавани въпроси

ElevenLabs STT transscribes говори аудио в текст. Качете MP3, WAV, M4A или видео файл и ElevenLabs STT _ връща пълния транскрипт плюс опционални SRT/VTT субтитри с часове.

ElevenLabs STT обработва десетки езици — Whisper-семейни модели покриват 90+, Parakeet обхваща ~25, други варират. Изберете "автодетектор" или посочете езика за най-висока точност.

Честотата на Word-terror е 5-10% на чист английски аудио, 10-20% на шумен или акцентиран аудио. Големи варианти на една и съща архитектура са значително по-добри в трудни случаи — избират по-големи, когато звукът е груб.

Да — всеки сегмент включва часове за старт/край. Експортирайте като SRT или VTT и времевата карта директно на видеото ви.

ElevenLabs STT е премиум транскрипционен двигател. Около ~500–1,500 жетона на минута аудио. $1 = 750 000 жетона.

MP3, WAV, M4A, FLAC, OGG, плюс видео (MP4, MOV, WebM) — ние извличаме звука. Макс. 500 MB за качане. По-дълги файлове? Разделите с /audio/cut/ или използвайте /v1/stt/batch /.

Диаграфизацията на спикера е отделно пропускане — включване на "диаризиране" на /transcribe/. ElevenLabs STT обработва транскрипцията; диаризация етикети всеки сегмент с Speaker 1 / Speaker 2 / etc.

Да — /batch/ приема папка от аудио файлове. Всеки транскрипт се качва в /account /?tab=история с оригиналното име на име. За запазване на папка- дърво използвайте API.

Да — ПОСТ аудиото си на /v1/stt/transcribe/ с модел="ElevenLabs STT". Връща JSON с текст + сегменти + времеви табели на нивото на думи. /api/ има пълното позоваване.

Самоу домакинските модели държат звука на нашите GPU; премиум преминаване с DPA. Аудио се изтрива след акционерния прозорец (24h anon, 7d sign-in). Ние не тренираме на вашите входове.

Да — Free.ai предоставя търговско използване на транскрипти. Нуждаете се от права на аудиото, което качвате (всички ваши записи, лицензирани материали или съдържание с съгласие).

Факторът в реално време е около 0.05–0.2× — 60-минутен транскрипт за подкаст за 3—12 минути. Премиум модели често завършват по-бързо. Използвайте бутона за редица, за да затворите разпространението.

ElevenLabs STT

Използване чрез API

Подобни модели

Често задавани въпроси

Какво прави ElevenLabs STT?

Колко езика подкрепя ElevenLabs STT?

Колко точно е ElevenLabs STT?

ElevenLabs STT включва ли часове?

Колко струва ElevenLabs STT на минута?

Какви аудио формати мога да кача на ElevenLabs STT?

Може ли ElevenLabs STT да идентифицира различни говорители?

Мога ли да се запиша с ElevenLabs STT?

Има ли API за ElevenLabs STT?

Какво ще кажеш за поверителност, когато се записвам с ElevenLabs STT?

Безопасно ли е ElevenLabs STT изход за търговска употреба?

Колко време отнема ElevenLabs STT?

Вземете 10 000 свободни токове

Почакай, вземи безплатни токове от 10 км!

Искаш ли още?