faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 Символы в расчете на minute

Загрузить звук

Оставить аудио- или видео файл или вставить URL ниже

~500 Символы в расчете на minute

faster-whisper large-v3 a модель " от слова к тексту " построено OpenAI / SYSTRAN. Самый сильный при Accurate transcription. Самоорганизуется на Free.ai GPU — бесплатно против вашего ежедневного символического пула ( 500 жетонов в минуту). Выпущено согласно MIT - Коммерческое использование разрешено Free.ai.

Использование через API

OpenAI-совместимый REST API. Создайте ключ и вызовите эту модель за секунды.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

Документация API Выбрать ключ API

Аналогичные модели

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Просмотр всех моделей →

Часто задаваемые вопросы

faster-whisper large-v3 transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and faster-whisper large-v3 returns the full transcript plus optional SRT/VTT subtitles with timestamps.

faster-whisper large-v3 обрабатывает десятки языков — Whisper семейные модели охватывают 90+, Parakeet охватывает ~25, другие различаются.

Крупные варианты одной и той же архитектуры значительно лучше работают в сложных случаях — выбирайте больше, когда звук груб.

Да — каждый сегмент включает в себя стартовую/конец времени.

faster-whisper large-v3 runs on our own GPUs against your daily free pool first; $5 → 200,000 paid tokens after that. About ~500 tokens per minute.

MP3, WAV, M4A, FLAC, OGG, плюс видео (MP4, MOV, WebM) — мы извлекаем аудио. Макс 500 MB за загрузку. Более длинные файлы? Разделить с /audio/cut/ или использовать /v1/stt/batch/.

Диааризация спикера — это отдельный пропуск — манипулировать «диаризацией» на /Tranrap/. faster-whisper large-v3 занимается стенографией; диарейные этикетки на каждом сегменте с спикером 1/ спикером 2/ и т.д.

Да — / batch/ принимает папку аудиофайлов. Каждая транскрипция попадает в /account/?tab=историю с оригинальным именем файла. Для сохранения папки-три используйте API.

Да — POST Ваш звук на /v1/stt/tranrip/ с моделью=" faster-whisper large-v3 Возвращает JSON с текстом + сегменты + временнóе время уровня слов. /api/ имеет полную ссылку.

Самодельные модели хранят аудио на наших GPU; премиальные проходят через DDR. Аудио удаляется после совместного окна (24h anon, 7d подписано). Мы не тренируемся на ваших входных данных.

Да — Free.ai предоставляет коммерческое использование стенограмм. Вам нужны права на загрузку аудиозаписи (ваша собственная запись, лицензированный материал или контент с согласия).

Коэффициент реального времени примерно 0,05-0,2 × — 60-минутные транскрипции через 3-12 минут. Премиум модели часто заканчивают быстрее. Используйте кнопку очереди для закрытия вкладки.

faster-whisper large-v3

Использование через API

Аналогичные модели

Часто задаваемые вопросы

Что делает faster-whisper large-v3?

How many languages does faster-whisper large-v3 support?

Насколько точно faster-whisper large-v3?

Включает ли faster-whisper large-v3 время?

Сколько стоит faster-whisper large-v3 в минуту?

Какие аудиоформаты я могу загрузить в faster-whisper large-v3?

Могут ли faster-whisper large-v3 идентифицироваться разные ораторы?

Могу ли я собрать транквилизаторы с faster-whisper large-v3?

Есть ли API для faster-whisper large-v3?

А как насчет уединения, когда я переписываюсь с faster-whisper large-v3?

Безопасна ли выпускная продукция faster-whisper large-v3 для коммерческого использования?

How long does faster-whisper large-v3 take?

Получить 10 000 бесплатных токенов

Подождите — найдите 10 тысяч бесплатных токенов!

Хочешь еще?