faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 tags per minute

Вивантажити звук

Скинути звуковий або відео файл або вставити адресу URL нижче

~500 tags per minute

faster-whisper large-v3 is a Модель синтезу мовлення з тексту built by OpenAI / SYSTRAN. Настирливі у _ {best} for _ _. Self- host on Free.ai GPUs } безкоштовно йде проти вашого щоденного набору (500 _ на хвилинуunit synonyms for matching user input _). Випущено під MIT * _ комерційне використання на Free.ai.

Використовувати через API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

Документація з API Отримати ключ API

Similar models

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Browse all models →

Часті запитання

faster-whisper large-v3 trancuts вимовлений звуковий файл в текст. Вивантажити субтитри MP3, WAV, M4A або відеофайл і _ faster-whisper large-v3 _ повертає повний запис та необов' язкові субтитри SRT/ VTTT з часовими штампами.

faster-whisper large-v3 handles dozens of languages — Whisper-family models cover 90+, Parakeet covers ~25, others vary. Pick "auto-detect" or specify the language for highest accuracy.

Word-error rate is 5–10% on clean English audio, 10–20% on noisy or accented audio. Large variants of the same architecture do meaningfully better on hard cases — pick larger when the audio is rough.

Так, ♫ Кожен відрізок містить часові штампи початку/ завершення. Експортується як STRT або VTT і карти часу безпосередньо на ваше відео.

faster-whisper large-v3 _ running on our own GPUs on your DA free pool first; $5 → 200 000 оплачуваних маркерів після цього. Близько ~500 жетонів за хвилину.

MP3, WAV, M4A, FLAC, OGG, плюс відео (MP4, MOV, WebM) ми витягуємо звуковий файл. Макс. 500 МБ на вивантаження. Довші файли? Розділити за допомогою / audio/cut / або використовувати / v1/ st/ batch /.

Speaker diarization is a separate pass — toggle "diarize" on /transcribe/. faster-whisper large-v3 handles the transcription; diarization labels each segment with Speaker 1 / Speaker 2 / etc.

Так, } / batch/ приймає теку звукових файлів. Кожна з тек трансляцій у / account /? tab=історій з початковою назвою файла. Для збереження теки- дерева використовуйте API.

Yes — POST your audio to /v1/stt/transcribe/ with model="faster-whisper large-v3". Returns JSON with text + segments + word-level timestamps. /api/ has the full reference.

Самоавтомні моделі зберігають звукові дані у наших GPU; внесокний прохід за допомогою DPA. Звук буде вилучено після вікна спільного ресурсу (24h anon, 7d підписаний- in). Ми не тренуємо ваші вхідні дані.

Так, Free.ai дає комерційне використання трансляцій. Вам потрібні права на вивантажений звук (ваш власний запис, ліцензований матеріал або контент за згодою).

Real-time factor is roughly 0.05–0.2× — a 60-minute podcast transcribes in 3–12 minutes. Premium models often finish faster. Use the queue button to close the tab.

faster-whisper large-v3

Використовувати через API

Similar models

Часті запитання

Що робить faster-whisper large-v3 _?

Скільки мов підтримує faster-whisper large-v3 *?

Наскільки точним є faster-whisper large-v3 _?

Does faster-whisper large-v3 include timestamps?

Скільки коштує ___ за хвилину?

Які формати звукових даних можна вивантажувати на _ faster-whisper large-v3 _?

Чи може faster-whisper large-v3 _ ідентифікувати різних гучномовців?

Чи можна пакетизувати traned з _ _ faster-whisper large-v3 _?

Чи існує API для faster-whisper large-v3 _?

А як щодо конфіденційності під час роботи з записом _ _ faster-whisper large-v3 _?

Чи вивід _ _ faster-whisper large-v3 _ для комерційного використання?

Скільки часу займе faster-whisper large-v3 _?

Дістати 10 000 безпосадочних тонів

Чекайте! Отримайте 10 кілків безкоштовно!

Хочеш ще?