Вольная японская транскрыпцыя

Ператварэньне японская аўдыё і відэа ў тэкст з дапамогай AI. Хутка, дакладна і бясплатна.

Як гэта працуе

  1. Перайсці да Транскриптор Free.ai
  2. Загрузіць ваш японская аўдыё- або відэафайл
  3. Наш машынны інтэлект аўтаматычна выяўляе японская і перапісвае яго
  4. Сцягнуць ваш транскрыпт як тэкст або SRT субтытры

японская Функцыі перапіскі

  • Праграма на базе faster-whisper (пад ліцэнзіяй MIT)
  • Аўтаматычнае вызначэнне мовы японская
  • Падтрымка MP3, WAV, MP4, M4A, FLAC і іншых
  • Экспарт субтытраў і часопісаў (SRT)
  • Без абмежавання памеру файла для платных планаў
  • Прыватныя і бяспечныя -- файлы выдаляюцца пасля апрацоўкі

Падрабязнасці мовы

Моваяпонская
Код ISOja
Модэль ШІхутчэй-шэптам
КоштВольна

Частыя пытанні

Whisper large-v3-turbo знаходзіцца ў найвышэйшым узроўні дакладнасці на японская — менш за 7% памылак словаў на стандартных тэставанні. На практыцы гэта азначае, што чыстае студыйнае гучанне вяртаецца амаль ідэальна, і гучанне размоваў можна выкарыстоўваць з мінімальным чысткай. (Tier A, under 7% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Так — японская транскрыпцыя спачатку бярэ з вашага штодзённага вольнага фонду. Аудыа каштуе каля 50 жетонаў за хвіліну, таму анімаваны штодзённы фонд ахоплівае некалькі гадзінаў гуку ў дзень. Уваходныя рахункі атрымліваюць большы фонд плюс 10, 000 рэгістрацыйных жетонаў. Пасля гэтага, $1 купляе 750, 000 жетонаў (~250 гадзінаў гуку).

японская транскрыпты вяртаюцца ў нацыянальным сцэнарыі (UTF-8). японская тэкст не мае прабелаў паміж словамі; часопісныя часопісы дадаюць натуральныя перапынкі пры павароце гаворцы.

MP3, WAV, M4A, FLAC, OGG, OPUS і WEBM прымаюцца без прамежкавых фарматаў. Для відэа (MP4, MOV, MKV) мы выцягваем аўдыё- трэк з боку сервера перад адпраўкай яго ў Whisper - вам не трэба нічога пераўтвараць. Тым жа канвеерам незалежна ад зыходнай мовы, уключаючы японская.

Анімаваныя загрузкі могуць мець памер да 500 Мб на файл. Уваходныя рахункі могуць мець памер да 2 Гб. Працягласць не абмежавана - доўгія файлы аўтаматычна разбіраюцца на часткі (30-секундныя вокны з перакрываннем) і злучаюцца ў адзіны транскрыпт з працяглымі часовымі штампамі. Некалькігадзінныя запісы японская (подкаст, поўная лекцыя, сустрэча) працуюць добра.

Так — па змаўчанні дыярызацыя гаворкі ўключана для кожнай японская транскрыпцыі. Вывад падзяляецца на сегменты: Говорящий 1 / Говорящий 2 / Говорящий 3 з часовымі знакамі, таму інтэрв' ю, абмеркаванні і шматбаковыя сустрэчы будуць змешчаны ў сегментах. Дыярызацыя працуе па адмысловай мадэлі і працуе аднолькава для ўсіх моў, якія мы падтрымліваем.

Так — устаўце URL у / transcribe/ youtube / для YouTube або / transcribe/ podcast / для падкаст- стужак (Apple, Spotify, RSS). Мы загружаем аўдыё, запускаем яго праз Whisper з language=ja, і вяртаем транскрыпцыю з часовымі штампамі і этыкеткамі спевака. Тыповы змест японская: падкасты, лекцыі, інтэрв'ю і доўгі YouTube-кантэнт у японская - гэта найбольш распаўсюджаныя віды працы, якія мы бачым.

Whisper каштуе каля 50 жетонаў за хвіліну гуку, таму гадзінная запіска каштуе каля 3000 жетонаў. $1 купляе 750 000 жетонаў, што складае каля 250 гадзін гуку за даляр. Большасць карыстальнікаў ніколі нічога не трацяць — бясплатны штодзённы фонд уключае кароткія кліпы, галасавыя запіскі і адну падкаст-праграму.

Так — даступныя як часопісы ўзроўню сегмента (каля 10-30 секунд), так і ўзроўню слова. Узровень слова - гэта па змаўчанні для экспарту субтытраў VTT/SRT, таму субтытры сінхранізуюць па радках. На API ўсталюйце timestamps="word" у тэкст запыту. японская транскрыпты вяртаюцца ў нацыянальным сцэнарыі (UTF-8). японская тэкст не мае прабелаў паміж словамі; часопісныя часопісы дадаюць натуральныя перапынкі пры павароце гаворцы.

Так. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=ja — або абмяжоўвайце параметр мовы, каб Whisper мог аўтаматычна вызначыць мову. Верне JSON з транскрыптам, сегментамі, часовымі штампамі і этыкеткамі гукарэжысёра. Поўная спасылка і выразкі SDK у /api/.

Так — пасля завяршэння транскрыпцыі націсніце Пераклад або ўстаўце тэкст у /translate/. японская працуе з усімі іншымі мовамі, якія мы падтрымліваем (200+). Для пратаколаў сустрэч транскрыпцыя праходзіць праз /summarize/; для дубліравання адпраўце яе ў /voice/tts/, каб атрымаць гук на мэтавай мове.

Праграма Whisper была падрыхтавана на аснове 680 тысяч гадзін гукавых запісаў, таму транскрыпцыя японская эфектыўная ў фонавым шуме, на музычных канапах і пры запісе на тэлефоне. Сільная абрэзка або некалькі перакрываючыхся дынамікаў усё роўна пагоршаць дакладнасць.Калі аўдыё не працуе, напішыце на contact@free.ai з файлам — мы вярнем вам грошы і паглядзім, ці іншы рухавік працуе з вашым аўдыё лепш.

Любіце Free.ai? Раскажыце сваім сябрам!

Ацэнка гэтай старонкі