Вольная кантонскі дыялект кітайскай транскрыпцыя

Ператварэньне кантонскі дыялект кітайскай аўдыё і відэа ў тэкст з дапамогай AI. Хутка, дакладна і бясплатна.

Як гэта працуе

  1. Перайсці да Транскриптор Free.ai
  2. Загрузіць ваш кантонскі дыялект кітайскай аўдыё- або відэафайл
  3. Наш машынны інтэлект аўтаматычна выяўляе кантонскі дыялект кітайскай і перапісвае яго
  4. Сцягнуць ваш транскрыпт як тэкст або SRT субтытры

кантонскі дыялект кітайскай Функцыі перапіскі

  • Праграма на базе faster-whisper (пад ліцэнзіяй MIT)
  • Аўтаматычнае вызначэнне мовы кантонскі дыялект кітайскай
  • Падтрымка MP3, WAV, MP4, M4A, FLAC і іншых
  • Экспарт субтытраў і часопісаў (SRT)
  • Без абмежавання памеру файла для платных планаў
  • Прыватныя і бяспечныя -- файлы выдаляюцца пасля апрацоўкі

Падрабязнасці мовы

Мовакантонскі дыялект кітайскай
Код ISOyue
Модэль ШІхутчэй-шэптам
КоштВольна

Частыя пытанні

кантонскі дыялект кітайскай - гэта менш рэсурсная мова для Whisper - large-v3-turbo мае больш за 25% памылак у словах, часам значна больш. Транскрипт карысны для пошуку і выяўлення, але не павінен разглядацца як гатовы да публікацыі. Калі для кантонскі дыялект кітайскай стане даступным рухавік большай дакладнасці, мы аўтаматычна яго ўбудуем. (Tier D, over 25% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Так — кантонскі дыялект кітайскай транскрыпцыя спачатку бярэ з вашага штодзённага вольнага фонду. Аудыа каштуе каля 50 жетонаў за хвіліну, таму анімаваны штодзённы фонд ахоплівае некалькі гадзінаў гуку ў дзень. Уваходныя рахункі атрымліваюць большы фонд плюс 10, 000 рэгістрацыйных жетонаў. Пасля гэтага, $1 купляе 750, 000 жетонаў (~250 гадзінаў гуку).

кантонскі дыялект кітайскай транскрыпты будуць вярнутыя ў стандартным UTF- 8 з звычайным правапісам мовы.

MP3, WAV, M4A, FLAC, OGG, OPUS і WEBM прымаюцца без прамежкавых фарматаў. Для відэа (MP4, MOV, MKV) мы выцягваем аўдыё- трэк з боку сервера перад адпраўкай яго ў Whisper - вам не трэба нічога пераўтвараць. Тым жа канвеерам незалежна ад зыходнай мовы, уключаючы кантонскі дыялект кітайскай.

Анімаваныя загрузкі могуць мець памер да 500 Мб на файл. Уваходныя рахункі могуць мець памер да 2 Гб. Працягласць не абмежавана - доўгія файлы аўтаматычна разбіраюцца на часткі (30-секундныя вокны з перакрываннем) і злучаюцца ў адзіны транскрыпт з працяглымі часовымі штампамі. Некалькігадзінныя запісы кантонскі дыялект кітайскай (подкаст, поўная лекцыя, сустрэча) працуюць добра.

Так — па змаўчанні дыярызацыя гаворкі ўключана для кожнай кантонскі дыялект кітайскай транскрыпцыі. Вывад падзяляецца на сегменты: Говорящий 1 / Говорящий 2 / Говорящий 3 з часовымі знакамі, таму інтэрв' ю, абмеркаванні і шматбаковыя сустрэчы будуць змешчаны ў сегментах. Дыярызацыя працуе па адмысловай мадэлі і працуе аднолькава для ўсіх моў, якія мы падтрымліваем.

Так — устаўце URL у / transcribe/ youtube / для YouTube або / transcribe/ podcast / для падкаст- стужак (Apple, Spotify, RSS). Мы загружаем аўдыё, запускаем яго праз Whisper з language=yue, і вяртаем транскрыпцыю з часовымі штампамі і этыкеткамі спевака. Тыповы змест кантонскі дыялект кітайскай: лекцыі, інтэрв'ю, галасавыя запісы і YouTube-кантэнт у кантонскі дыялект кітайскай працуюць — устаўце URL у /transcribe/youtube/ або загрузіце файлы прама.

Whisper каштуе каля 50 жетонаў за хвіліну гуку, таму гадзінная запіска каштуе каля 3000 жетонаў. $1 купляе 750 000 жетонаў, што складае каля 250 гадзін гуку за даляр. Большасць карыстальнікаў ніколі нічога не трацяць — бясплатны штодзённы фонд уключае кароткія кліпы, галасавыя запіскі і адну падкаст-праграму.

Так — даступныя як часопісы ўзроўню сегмента (каля 10-30 секунд), так і ўзроўню слова. Узровень слова - гэта па змаўчанні для экспарту субтытраў VTT/SRT, таму субтытры сінхранізуюць па радках. На API ўсталюйце timestamps="word" у тэкст запыту. кантонскі дыялект кітайскай транскрыпты будуць вярнутыя ў стандартным UTF- 8 з звычайным правапісам мовы.

Так. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=yue — або абмяжоўвайце параметр мовы, каб Whisper мог аўтаматычна вызначыць мову. Верне JSON з транскрыптам, сегментамі, часовымі штампамі і этыкеткамі гукарэжысёра. Поўная спасылка і выразкі SDK у /api/.

Так — пасля завяршэння транскрыпцыі націсніце Пераклад або ўстаўце тэкст у /translate/. кантонскі дыялект кітайскай працуе з усімі іншымі мовамі, якія мы падтрымліваем (200+). Для пратаколаў сустрэч транскрыпцыя праходзіць праз /summarize/; для дубліравання адпраўце яе ў /voice/tts/, каб атрымаць гук на мэтавай мове.

Праграма Whisper не дае такой дакладнасці, як мова з высокім узроўнем рэсурсаў. У гэтым выпадку праблема заключаецца ў колькасці гуку, якое кантонскі дыялект кітайскай чуў падчас трэніроўкі, а не ў шуме. Праграма Whisper дае лепшую дакладнасць, чым мова з нізкім узроўнем рэсурсаў.Калі аўдыё не працуе, напішыце на contact@free.ai з файлам — мы вярнем вам грошы і паглядзім, ці іншы рухавік працуе з вашым аўдыё лепш.

Любіце Free.ai? Раскажыце сваім сябрам!

Ацэнка гэтай старонкі