Wizper (Whisper v3)

Free.ai · stt · ~500 біт minute

Выцягніце аўдыё- ці відэафайл, або ўстаўце URL ніжэй

~500 біт minute
Уваходзіць у склад Глыбоцкага раёна. Абнавіць на Wizper (Whisper v3) →

Фрэйзер (фр.: Fréderic Fréderic) — французскі пісьменнік. У 1999 годзе ў выніку рэструктурызацыі кампаніі «Фрэйзер» (Freizer) 50 % акцый перайшлі ў «Фрэйзер-Мінск» (Freizer-Minsk).

Выкарыстаць праз API

OpenAI- сумяшчальны REST API. Стварыць ключ і выклікаць гэтую мадэль за некалькі секунд.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'
Дакументацыя API Атрымаць ключ API

Часта задаваемыя пытанні

Wizper (Whisper v3) перакладае гукавы файл у тэкст. Загрузіце файл MP3, WAV, M4A або відэа, і Wizper (Whisper v3) верне поўны пераклад і дадатковыя субтытры SRT/VTT з часовымі знакамі.

Wizper (Whisper v3) абслугоўвае дзясяткі моў — мадэлі сямейства Whisper ахопліваюць 90%, Parakeet ахопліваюць ~25, іншыя вар'іруюцца. Выберыце "аўтаматычнае выяўленне" або вызначце мову для найвышэйшай дакладнасці.

Частата памылак у словах складае 5- 10% на чыстай англійскай мове, 10- 20% на шумнай або акцэнтаванай мове. Большыя варыянты адной і той жа архітэктуры значна лепш працуюць на цяжкіх выпадках - выбірайце большыя, калі гук не роўны.

Так - кожны сегмент утрымлівае час пачатку/ канца. Экспартаваць як SRT або VTT і адлюстраваць час на відэа.

Wizper (Whisper v3) — гэта бясплатны рухавік транскрыпцыі. Прыблізна ~500–1500 знакаў за хвіліну гуку. $1 = 750 000 знакаў.

MP3, WAV, M4A, FLAC, OGG, плюс відэа (MP4, MOV, WebM) — мы выцягваем аўдыё. Макс. 500 МБ за загрузку. Большыя файлы? Раздзяляйце з /audio/cut/ або выкарыстоўвайце /v1/stt/batch/.

У тэксце тэкстападобнай мовы (напрыклад, у тэксце тэкстападобнай мовы 1) тэкстападобная мова (напрыклад, тэкстападобная мова 2) тэкстападобная мова (напрыклад, тэкстападобная мова 3) тэкстападобная мова (напрыклад, тэкстападобная мова 4) тэкстападобная мова (напрыклад, тэкстападобная мова 5)

Так — / batch / прымае тэчку з аўдыё файламі. Кожны транскрыпт запісваецца ў / account/? tab=history з арыгінальнай назвай файла. Для захавання дрэва тэчак выкарыстоўвайце API.

Так — POST ваш аўдыё ў /v1/stt/transcribe/ з model="Wizper (Whisper v3)". Верне JSON з тэкстам + сегментамі + часамі на ўзроўні слова. /api/ мае поўную спасылку.

У мадэлях з уласным хостынгам гук захоўваецца на нашых GPU; у мадэлях з платным хостынгам гук праходзіць праз DPA. Гук выдаляецца пасля заканчэння часу абмену (24 гадзіны пасля завяршэння, 7 дзён пасля ўваходу). Мы не трэніруемся на вашых уводах.

Так - Free.ai дазваляе выкарыстанне транскрыптаў у камерцыйных мэтах. Вам патрэбныя правы на загружаны гукавы файл (ваш уласны запіс, ліцэнзаваны матэрыял або змест з дазволам).

Коэфіцыент рэальнага часу складае каля 0. 05- 0. 2 × - 60- хвілінны подкаст транскрыптуецца за 3- 12 хвілін. Модэлі Premium звычайна заканчваюцца хутчэй. Выкарыстоўвайце кнопку чаргі, каб закрыць картку.

Любіце Free.ai? Раскажыце сваім сябрам!

Ацэнка гэтай старонкі