Wizper (Whisper v3)

Free.ai · stt · ~500 біт minute

Загрузіць гук

Выцягніце аўдыё- ці відэафайл, або ўстаўце URL ніжэй

~500 біт minute

Уваходзіць у склад Глыбоцкага раёна. Абнавіць на Wizper (Whisper v3) →

Фрэйзер (фр.: Fréderic Fréderic) — французскі пісьменнік. У 1999 годзе ў выніку рэструктурызацыі кампаніі «Фрэйзер» (Freizer) 50 % акцый перайшлі ў «Фрэйзер-Мінск» (Freizer-Minsk).

Выкарыстаць праз API

OpenAI- сумяшчальны REST API. Стварыць ключ і выклікаць гэтую мадэль за некалькі секунд.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'

Дакументацыя API Атрымаць ключ API

Падобныя мадэлі

ElevenLabs STT

Fal Speech-to-Text

Прагляд усіх мадэляў →

Часта задаваемыя пытанні

Wizper (Whisper v3) перакладае гукавы файл у тэкст. Загрузіце файл MP3, WAV, M4A або відэа, і Wizper (Whisper v3) верне поўны пераклад і дадатковыя субтытры SRT/VTT з часовымі знакамі.

Wizper (Whisper v3) абслугоўвае дзясяткі моў — мадэлі сямейства Whisper ахопліваюць 90%, Parakeet ахопліваюць ~25, іншыя вар'іруюцца. Выберыце "аўтаматычнае выяўленне" або вызначце мову для найвышэйшай дакладнасці.

Частата памылак у словах складае 5- 10% на чыстай англійскай мове, 10- 20% на шумнай або акцэнтаванай мове. Большыя варыянты адной і той жа архітэктуры значна лепш працуюць на цяжкіх выпадках - выбірайце большыя, калі гук не роўны.

Так - кожны сегмент утрымлівае час пачатку/ канца. Экспартаваць як SRT або VTT і адлюстраваць час на відэа.

Wizper (Whisper v3) — гэта бясплатны рухавік транскрыпцыі. Прыблізна ~500–1500 знакаў за хвіліну гуку. $1 = 750 000 знакаў.

MP3, WAV, M4A, FLAC, OGG, плюс відэа (MP4, MOV, WebM) — мы выцягваем аўдыё. Макс. 500 МБ за загрузку. Большыя файлы? Раздзяляйце з /audio/cut/ або выкарыстоўвайце /v1/stt/batch/.

У тэксце тэкстападобнай мовы (напрыклад, у тэксце тэкстападобнай мовы 1) тэкстападобная мова (напрыклад, тэкстападобная мова 2) тэкстападобная мова (напрыклад, тэкстападобная мова 3) тэкстападобная мова (напрыклад, тэкстападобная мова 4) тэкстападобная мова (напрыклад, тэкстападобная мова 5)

Так — / batch / прымае тэчку з аўдыё файламі. Кожны транскрыпт запісваецца ў / account/? tab=history з арыгінальнай назвай файла. Для захавання дрэва тэчак выкарыстоўвайце API.

Так — POST ваш аўдыё ў /v1/stt/transcribe/ з model="Wizper (Whisper v3)". Верне JSON з тэкстам + сегментамі + часамі на ўзроўні слова. /api/ мае поўную спасылку.

У мадэлях з уласным хостынгам гук захоўваецца на нашых GPU; у мадэлях з платным хостынгам гук праходзіць праз DPA. Гук выдаляецца пасля заканчэння часу абмену (24 гадзіны пасля завяршэння, 7 дзён пасля ўваходу). Мы не трэніруемся на вашых уводах.

Так - Free.ai дазваляе выкарыстанне транскрыптаў у камерцыйных мэтах. Вам патрэбныя правы на загружаны гукавы файл (ваш уласны запіс, ліцэнзаваны матэрыял або змест з дазволам).

Коэфіцыент рэальнага часу складае каля 0. 05- 0. 2 × - 60- хвілінны подкаст транскрыптуецца за 3- 12 хвілін. Модэлі Premium звычайна заканчваюцца хутчэй. Выкарыстоўвайце кнопку чаргі, каб закрыць картку.

Wizper (Whisper v3)

Выкарыстаць праз API

Падобныя мадэлі

Часта задаваемыя пытанні

Што робіць Wizper (Whisper v3)?

Колькі моў падтрымлівае Wizper (Whisper v3)?

Як дакладна Wizper (Whisper v3)?

Ці ўключае Wizper (Whisper v3) часовыя меткі?

Колькі каштуе Wizper (Whisper v3) за хвіліну?

Якія фарматы гуку я магу загрузіць на Wizper (Whisper v3)?

Ці можа Wizper (Whisper v3) вызначыць розных гульцоў?

Ці магу я перапісаць пакет з Wizper (Whisper v3)?

Ці ёсць API для Wizper (Whisper v3)?

Які эфект ад карыстання Wizper (Whisper v3)?

Ці бяспечны вывад Wizper (Whisper v3) для камерцыйнага выкарыстання?

Колькі часу займае Wizper (Whisper v3)?

Атрымаць 10,000 бясплатных жетонаў

Застаецца чакаць — атрымайце 10K бясплатных жетонаў!

Хочаце больш?