Question 1

Як правільна перакладаць панджабі у Whisper?

Accepted Answer

панджабі - гэта менш рэсурсная мова для Whisper - large-v3-turbo мае больш за 25% памылак у словах, часам значна больш. Транскрипт карысны для пошуку і выяўлення, але не павінен разглядацца як гатовы да публікацыі. Калі для панджабі стане даступным рухавік большай дакладнасці, мы аўтаматычна яго ўбудуем. (Tier D, over 25% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Question 2

Ці бясплатная транскрыпцыя панджабі з аўдыё ў тэкст?

Accepted Answer

Так — панджабі транскрыпцыя спачатку бярэ з вашага штодзённага вольнага фонду. Аудыа каштуе каля 50 жетонаў за хвіліну, таму анімаваны штодзённы фонд ахоплівае некалькі гадзінаў гуку ў дзень. Уваходныя рахункі атрымліваюць большы фонд плюс 10, 000 рэгістрацыйных жетонаў. Пасля гэтага, $1 купляе 750, 000 жетонаў (~250 гадзінаў гуку).

Question 3

Які сцэнар і правапіс выкарыстоўвае транскрыпт панджабі?

Accepted Answer

панджабі транскрыпты будуць вярнутыя ў стандартным UTF- 8 з звычайным правапісам мовы.

Question 4

Якія фарматы гуку падтрымліваюцца для транскрыпцыі панджабі?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS і WEBM прымаюцца без прамежкавых фарматаў. Для відэа (MP4, MOV, MKV) мы выцягваем аўдыё- трэк з боку сервера перад адпраўкай яго ў Whisper - вам не трэба нічога пераўтвараць. Тым жа канвеерам незалежна ад зыходнай мовы, уключаючы панджабі.

Question 5

Як доўгі можа быць аўдыё файл панджабі?

Accepted Answer

Анімаваныя загрузкі могуць мець памер да 500 Мб на файл. Уваходныя рахункі могуць мець памер да 2 Гб. Працягласць не абмежавана - доўгія файлы аўтаматычна разбіраюцца на часткі (30-секундныя вокны з перакрываннем) і злучаюцца ў адзіны транскрыпт з працяглымі часовымі штампамі. Некалькігадзінныя запісы панджабі (подкаст, поўная лекцыя, сустрэча) працуюць добра.

Question 6

Ці панджабі транскрыпцыя ідэнтыфікацыю розных гаворцаў?

Accepted Answer

Так — па змаўчанні дыярызацыя гаворкі ўключана для кожнай панджабі транскрыпцыі. Вывад падзяляецца на сегменты: Говорящий 1 / Говорящий 2 / Говорящий 3 з часовымі знакамі, таму інтэрв' ю, абмеркаванні і шматбаковыя сустрэчы будуць змешчаны ў сегментах. Дыярызацыя працуе па адмысловай мадэлі і працуе аднолькава для ўсіх моў, якія мы падтрымліваем.

Question 7

Ці магу я перапісаць відэа YouTube ці падкаст панджабі?

Accepted Answer

Так — устаўце URL у / transcribe/ youtube / для YouTube або / transcribe/ podcast / для падкаст- стужак (Apple, Spotify, RSS). Мы загружаем аўдыё, запускаем яго праз Whisper з language=pa, і вяртаем транскрыпцыю з часовымі штампамі і этыкеткамі спевака. Тыповы змест панджабі: лекцыі, інтэрв'ю, галасавыя запісы і YouTube-кантэнт у панджабі працуюць — устаўце URL у /transcribe/youtube/ або загрузіце файлы прама.

Question 8

Колькі каштуе гадзіна гуку панджабі у знаках?

Accepted Answer

Whisper каштуе каля 50 жетонаў за хвіліну гуку, таму гадзінная запіска каштуе каля 3000 жетонаў. $1 купляе 750 000 жетонаў, што складае каля 250 гадзін гуку за даляр. Большасць карыстальнікаў ніколі нічога не трацяць — бясплатны штодзённы фонд уключае кароткія кліпы, галасавыя запіскі і адну падкаст-праграму.

Question 9

Ці магу я атрымаць часовыя знакі ўзроўню слова для панджабі audio?

Accepted Answer

Так — даступныя як часопісы ўзроўню сегмента (каля 10-30 секунд), так і ўзроўню слова. Узровень слова - гэта па змаўчанні для экспарту субтытраў VTT/SRT, таму субтытры сінхранізуюць па радках. На API ўсталюйце timestamps="word" у тэкст запыту. панджабі транскрыпты будуць вярнутыя ў стандартным UTF- 8 з звычайным правапісам мовы.

Question 10

Ці існуе API для перакладу панджабі?

Accepted Answer

Так. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=pa — або абмяжоўвайце параметр мовы, каб Whisper мог аўтаматычна вызначыць мову. Верне JSON з транскрыптам, сегментамі, часовымі штампамі і этыкеткамі гукарэжысёра. Поўная спасылка і выразкі SDK у /api/.

Question 11

Ці магу я перакласці панджабі на іншую мову?

Accepted Answer

Так — пасля завяршэння транскрыпцыі націсніце Пераклад або ўстаўце тэкст у /translate/. панджабі працуе з усімі іншымі мовамі, якія мы падтрымліваем (200+). Для пратаколаў сустрэч транскрыпцыя праходзіць праз /summarize/; для дубліравання адпраўце яе ў /voice/tts/, каб атрымаць гук на мэтавай мове.

Question 12

Што рабіць, калі гук панджабі шумны або нізкай якасці?

Accepted Answer

Праграма Whisper не дае такой дакладнасці, як мова з высокім узроўнем рэсурсаў. У гэтым выпадку праблема заключаецца ў колькасці гуку, якое панджабі чуў падчас трэніроўкі, а не ў шуме. Праграма Whisper дае лепшую дакладнасць, чым мова з нізкім узроўнем рэсурсаў.Калі аўдыё не працуе, напішыце на contact@free.ai з файлам — мы вярнем вам грошы і паглядзім, ці іншы рухавік працуе з вашым аўдыё лепш.

Мова	панджабі
Код ISO	`pa`
Модэль ШІ	хутчэй-шэптам
Кошт	Вольна

Вольная панджабі транскрыпцыя

Як гэта працуе

панджабі Функцыі перапіскі

Падрабязнасці мовы

Больш моў

Частыя пытанні