Question 1

Як правільна перакладаць кантонскі дыялект кітайскай у Whisper?

Accepted Answer

кантонскі дыялект кітайскай - гэта менш рэсурсная мова для Whisper - large-v3-turbo мае больш за 25% памылак у словах, часам значна больш. Транскрипт карысны для пошуку і выяўлення, але не павінен разглядацца як гатовы да публікацыі. Калі для кантонскі дыялект кітайскай стане даступным рухавік большай дакладнасці, мы аўтаматычна яго ўбудуем. (Tier D, over 25% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Question 2

Ці бясплатная транскрыпцыя кантонскі дыялект кітайскай з аўдыё ў тэкст?

Accepted Answer

Так — кантонскі дыялект кітайскай транскрыпцыя спачатку бярэ з вашага штодзённага вольнага фонду. Аудыа каштуе каля 50 жетонаў за хвіліну, таму анімаваны штодзённы фонд ахоплівае некалькі гадзінаў гуку ў дзень. Уваходныя рахункі атрымліваюць большы фонд плюс 10, 000 рэгістрацыйных жетонаў. Пасля гэтага, $1 купляе 750, 000 жетонаў (~250 гадзінаў гуку).

Question 3

Які сцэнар і правапіс выкарыстоўвае транскрыпт кантонскі дыялект кітайскай?

Accepted Answer

кантонскі дыялект кітайскай транскрыпты будуць вярнутыя ў стандартным UTF- 8 з звычайным правапісам мовы.

Question 4

Якія фарматы гуку падтрымліваюцца для транскрыпцыі кантонскі дыялект кітайскай?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS і WEBM прымаюцца без прамежкавых фарматаў. Для відэа (MP4, MOV, MKV) мы выцягваем аўдыё- трэк з боку сервера перад адпраўкай яго ў Whisper - вам не трэба нічога пераўтвараць. Тым жа канвеерам незалежна ад зыходнай мовы, уключаючы кантонскі дыялект кітайскай.

Question 5

Як доўгі можа быць аўдыё файл кантонскі дыялект кітайскай?

Accepted Answer

Анімаваныя загрузкі могуць мець памер да 500 Мб на файл. Уваходныя рахункі могуць мець памер да 2 Гб. Працягласць не абмежавана - доўгія файлы аўтаматычна разбіраюцца на часткі (30-секундныя вокны з перакрываннем) і злучаюцца ў адзіны транскрыпт з працяглымі часовымі штампамі. Некалькігадзінныя запісы кантонскі дыялект кітайскай (подкаст, поўная лекцыя, сустрэча) працуюць добра.

Question 6

Ці кантонскі дыялект кітайскай транскрыпцыя ідэнтыфікацыю розных гаворцаў?

Accepted Answer

Так — па змаўчанні дыярызацыя гаворкі ўключана для кожнай кантонскі дыялект кітайскай транскрыпцыі. Вывад падзяляецца на сегменты: Говорящий 1 / Говорящий 2 / Говорящий 3 з часовымі знакамі, таму інтэрв' ю, абмеркаванні і шматбаковыя сустрэчы будуць змешчаны ў сегментах. Дыярызацыя працуе па адмысловай мадэлі і працуе аднолькава для ўсіх моў, якія мы падтрымліваем.

Question 7

Ці магу я перапісаць відэа YouTube ці падкаст кантонскі дыялект кітайскай?

Accepted Answer

Так — устаўце URL у / transcribe/ youtube / для YouTube або / transcribe/ podcast / для падкаст- стужак (Apple, Spotify, RSS). Мы загружаем аўдыё, запускаем яго праз Whisper з language=yue, і вяртаем транскрыпцыю з часовымі штампамі і этыкеткамі спевака. Тыповы змест кантонскі дыялект кітайскай: лекцыі, інтэрв'ю, галасавыя запісы і YouTube-кантэнт у кантонскі дыялект кітайскай працуюць — устаўце URL у /transcribe/youtube/ або загрузіце файлы прама.

Question 8

Колькі каштуе гадзіна гуку кантонскі дыялект кітайскай у знаках?

Accepted Answer

Whisper каштуе каля 50 жетонаў за хвіліну гуку, таму гадзінная запіска каштуе каля 3000 жетонаў. $1 купляе 750 000 жетонаў, што складае каля 250 гадзін гуку за даляр. Большасць карыстальнікаў ніколі нічога не трацяць — бясплатны штодзённы фонд уключае кароткія кліпы, галасавыя запіскі і адну падкаст-праграму.

Question 9

Ці магу я атрымаць часовыя знакі ўзроўню слова для кантонскі дыялект кітайскай audio?

Accepted Answer

Так — даступныя як часопісы ўзроўню сегмента (каля 10-30 секунд), так і ўзроўню слова. Узровень слова - гэта па змаўчанні для экспарту субтытраў VTT/SRT, таму субтытры сінхранізуюць па радках. На API ўсталюйце timestamps="word" у тэкст запыту. кантонскі дыялект кітайскай транскрыпты будуць вярнутыя ў стандартным UTF- 8 з звычайным правапісам мовы.

Question 10

Ці існуе API для перакладу кантонскі дыялект кітайскай?

Accepted Answer

Так. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=yue — або абмяжоўвайце параметр мовы, каб Whisper мог аўтаматычна вызначыць мову. Верне JSON з транскрыптам, сегментамі, часовымі штампамі і этыкеткамі гукарэжысёра. Поўная спасылка і выразкі SDK у /api/.

Question 11

Ці магу я перакласці кантонскі дыялект кітайскай на іншую мову?

Accepted Answer

Так — пасля завяршэння транскрыпцыі націсніце Пераклад або ўстаўце тэкст у /translate/. кантонскі дыялект кітайскай працуе з усімі іншымі мовамі, якія мы падтрымліваем (200+). Для пратаколаў сустрэч транскрыпцыя праходзіць праз /summarize/; для дубліравання адпраўце яе ў /voice/tts/, каб атрымаць гук на мэтавай мове.

Question 12

Што рабіць, калі гук кантонскі дыялект кітайскай шумны або нізкай якасці?

Accepted Answer

Праграма Whisper не дае такой дакладнасці, як мова з высокім узроўнем рэсурсаў. У гэтым выпадку праблема заключаецца ў колькасці гуку, якое кантонскі дыялект кітайскай чуў падчас трэніроўкі, а не ў шуме. Праграма Whisper дае лепшую дакладнасць, чым мова з нізкім узроўнем рэсурсаў.Калі аўдыё не працуе, напішыце на contact@free.ai з файлам — мы вярнем вам грошы і паглядзім, ці іншы рухавік працуе з вашым аўдыё лепш.

Мова	кантонскі дыялект кітайскай
Код ISO	`yue`
Модэль ШІ	хутчэй-шэптам
Кошт	Вольна

Вольная кантонскі дыялект кітайскай транскрыпцыя

Як гэта працуе

кантонскі дыялект кітайскай Функцыі перапіскі

Падрабязнасці мовы

Больш моў

Частыя пытанні