Wizper (Whisper v3)
Free.ai
·
stt
·
~500 жетон/ секунд minute
Wizper (Whisper v3) — a және сөйлеуден мәтінге модель. 1995 жылы 100% акциялар (100% акциялар) «Қазақстан темір жолы» ҰК» АҚ-на (бұдан әрі – «ҚТЖ») сатылған.
API арқылы қолдану
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
API құжаттамасы
API кілтін алу
Жиі қойылатын сұрақтар
Wizper (Whisper v3) сөйлеген дыбыстарды мәтінге аударады. MP3, WAV, M4A немесе видео файлды жүктеп алыңыз, Wizper (Whisper v3) толық транскриптті және таңдаулы SRT/VTT субтитрлерін уақыт белгісімен қайтарады.
Wizper (Whisper v3) бірнеше тілдерді қолдайды — Whisper-семейлігінің үлгілері 90+ тілді қамтиды, Parakeet ~25 тілді қамтиды, басқалары әртүрлі. Ең дәл болу үшін "авто-табу" дегенді таңдаңыз немесе тілді келтіріңіз.
Сөз қателерінің деңгейі таза ағылшын тілінде 5- 10%, шулы немесе акцентті дыбыстарда 10- 20% құрайды. Осы архитектураның үлкен нұсқалары қатты дыбыстарда жақсы жұмыс істейді - дыбыс қатты болса, үлкенін таңдаңыз.
Иә — әрбір сегмент бастау/ аяқтау уақыт белгісін қамтиды. SRT не VTT түрінде экспорттау және уақыт белгілерін тікелей бейнеге түсіру.
Wizper (Whisper v3) - бұл жоғары сапалы транскрипция тетігі. Аудио минутына шамамен ~500-1500 жетон. $1 = 750 000 жетон.
MP3, WAV, M4A, FLAC, OGG, сонымен қатар видео (MP4, MOV, WebM) — аудионы тарқатамыз. Бір жүктеу үшін максимум 500 МБ. Ұзын файлдар? /audio/cut/ арқылы бөліңіз немесе /v1/stt/batch/ қолданыңыз.
Диаграммада 1-ші және 2-ші нұсқалар арасындағы айырмашылықтар көрсетілген: 1-ші нұсқада 1-ші нұсқада 2-ші нұсқада 3-ші нұсқада 4-ші нұсқада 5-ші нұсқада 6-шы нұсқада 7-ші нұсқада 8-ші нұсқада 9-шы нұсқада 10-шы нұсқада 11-ші нұсқада 12-ші нұсқада 13-ші нұсқада 14-ші нұсқада 15-ші нұсқада 16-шы нұсқада 17-ші нұсқада 18-ші нұсқада 19-шы нұсқада 20-шы нұсқада 21-ші нұсқада 22-ші нұсқада 23-ші нұсқада 24-ші нұсқада 25-ші нұсқада 26-шы нұсқада 27-ші нұсқада 28-ші нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы нұсқада 29-шы
Иә — / batch / аудио файлдар қапшығын қабылдайды. Әрбір транскрипция / account /? tab=history дегенге бастапқы файл атауымен түседі. Қапшық- бұтақты сақтау үшін API- ны қолданыңыз.
Иә — Аудиоңызды /v1/stt/transcribe/ дегенге POST етіп, model="Wizper (Whisper v3)" деп жазыңыз. JSON мәтіні + сегменттері + сөз деңгейіндегі уақыт белгісімен қайтарылады. /api/ толық сілтемесі бар.
Өз- өзіміздің хосттағы модельдеріміз аудионы GPU- ларда сақтайды; премиум модельдер DPA арқылы өткізеді. Аудио бөлісу терезесінен кейін өшіріледі (24 сағат анонимді, 7 күн жүйеге кірген). Біз сіздің кірістеріңізді оқымаймыз.
Иә — Free.ai транскрипттерді коммерциялық пайдалануға рұқсат береді. Жүктелген аудиоға құқықтарыңыз болуы керек (өзіңіздің жазбаңыз, лицензияланған материал немесе рұқсатпен мазмұн).
Реал уақыт коэффициенті шамамен 0.05-0.2× — 60 минуттық подкаст 3-12 минутта жазылады. Premium үлгілері көбінесе тезірек аяқталады. Қойындыны жабу үшін кезек батырмасын басыңыз.