Wizper (Whisper v3)

Free.ai · stt · ~500 жетон/ секунд minute

Аудио не бейне файлды сүйреп апарыңыз, не URL-ді төменде орналастырыңыз

~500 жетон/ секунд minute
Бұлар әдетте гүлшоғырларда өседі. Жаңарту Wizper (Whisper v3) →

Wizper (Whisper v3) — a және сөйлеуден мәтінге модель. 1995 жылы 100% акциялар (100% акциялар) «Қазақстан темір жолы» ҰК» АҚ-на (бұдан әрі – «ҚТЖ») сатылған.

API арқылы қолдану

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'
API құжаттамасы API кілтін алу

Жиі қойылатын сұрақтар

Wizper (Whisper v3) сөйлеген дыбыстарды мәтінге аударады. MP3, WAV, M4A немесе видео файлды жүктеп алыңыз, Wizper (Whisper v3) толық транскриптті және таңдаулы SRT/VTT субтитрлерін уақыт белгісімен қайтарады.

Wizper (Whisper v3) бірнеше тілдерді қолдайды — Whisper-семейлігінің үлгілері 90+ тілді қамтиды, Parakeet ~25 тілді қамтиды, басқалары әртүрлі. Ең дәл болу үшін "авто-табу" дегенді таңдаңыз немесе тілді келтіріңіз.

Сөз қателерінің деңгейі таза ағылшын тілінде 5- 10%, шулы немесе акцентті дыбыстарда 10- 20% құрайды. Осы архитектураның үлкен нұсқалары қатты дыбыстарда жақсы жұмыс істейді - дыбыс қатты болса, үлкенін таңдаңыз.

Иә — әрбір сегмент бастау/ аяқтау уақыт белгісін қамтиды. SRT не VTT түрінде экспорттау және уақыт белгілерін тікелей бейнеге түсіру.

Wizper (Whisper v3) - бұл жоғары сапалы транскрипция тетігі. Аудио минутына шамамен ~500-1500 жетон. $1 = 750 000 жетон.

MP3, WAV, M4A, FLAC, OGG, сонымен қатар видео (MP4, MOV, WebM) — аудионы тарқатамыз. Бір жүктеу үшін максимум 500 МБ. Ұзын файлдар? /audio/cut/ арқылы бөліңіз немесе /v1/stt/batch/ қолданыңыз.

Диаграммада 1-ші және 2-ші нұсқалар арасындағы айырмашылықтар көрсетілген: 1-ші нұсқада 1-ші нұсқада 2-ші нұсқада 3-ші нұсқада 4-ші нұсқада 5-ші нұсқада 6-шы нұсқада 7-ші нұсқада 8-ші нұсқада 9-шы нұсқада 10-шы нұсқада 11-ші нұсқада 12-ші нұсқада 13-ші нұсқада 14-ші нұсқада 15-ші нұсқада 16-шы нұсқада 17-ші нұсқада 18-ші нұсқада 19-шы нұсқада 20-шы нұсқада 21-ші нұсқада 22-ші нұсқада 23-ші нұсқада 24-ші нұсқада 25-ші нұсқада 26-шы нұсқада 27-ші нұсқада 28-ші нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы

Иә — / batch / аудио файлдар қапшығын қабылдайды. Әрбір транскрипция / account /? tab=history дегенге бастапқы файл атауымен түседі. Қапшық- бұтақты сақтау үшін API- ны қолданыңыз.

Иә — Аудиоңызды /v1/stt/transcribe/ дегенге POST етіп, model="Wizper (Whisper v3)" деп жазыңыз. JSON мәтіні + сегменттері + сөз деңгейіндегі уақыт белгісімен қайтарылады. /api/ толық сілтемесі бар.

Өз- өзіміздің хосттағы модельдеріміз аудионы GPU- ларда сақтайды; премиум модельдер DPA арқылы өткізеді. Аудио бөлісу терезесінен кейін өшіріледі (24 сағат анонимді, 7 күн жүйеге кірген). Біз сіздің кірістеріңізді оқымаймыз.

Иә — Free.ai транскрипттерді коммерциялық пайдалануға рұқсат береді. Жүктелген аудиоға құқықтарыңыз болуы керек (өзіңіздің жазбаңыз, лицензияланған материал немесе рұқсатпен мазмұн).

Реал уақыт коэффициенті шамамен 0.05-0.2× — 60 минуттық подкаст 3-12 минутта жазылады. Premium үлгілері көбінесе тезірек аяқталады. Қойындыны жабу үшін кезек батырмасын басыңыз.

Free.ai-ды ұнатасыз ба? Достарыңызға хабарлаңыз!

Парақты бағалау