Вольная панджабі транскрыпцыя
Ператварэньне панджабі аўдыё і відэа ў тэкст з дапамогай AI. Хутка, дакладна і бясплатна.
Як гэта працуе
- Перайсці да Транскриптор Free.ai
- Загрузіць ваш панджабі аўдыё- або відэафайл
- Наш машынны інтэлект аўтаматычна выяўляе панджабі і перапісвае яго
- Сцягнуць ваш транскрыпт як тэкст або SRT субтытры
панджабі Функцыі перапіскі
- ✓Праграма на базе faster-whisper (пад ліцэнзіяй MIT)
- ✓Аўтаматычнае вызначэнне мовы панджабі
- ✓Падтрымка MP3, WAV, MP4, M4A, FLAC і іншых
- ✓Экспарт субтытраў і часопісаў (SRT)
- ✓Без абмежавання памеру файла для платных планаў
- ✓Прыватныя і бяспечныя -- файлы выдаляюцца пасля апрацоўкі
Падрабязнасці мовы
| Мова | панджабі |
| Код ISO | pa |
| Модэль ШІ | хутчэй-шэптам |
| Кошт | Вольна |
Больш моў
Паказаць усе мовыЧастыя пытанні
панджабі - гэта менш рэсурсная мова для Whisper - large-v3-turbo мае больш за 25% памылак у словах, часам значна больш. Транскрипт карысны для пошуку і выяўлення, але не павінен разглядацца як гатовы да публікацыі. Калі для панджабі стане даступным рухавік большай дакладнасці, мы аўтаматычна яго ўбудуем. (Tier D, over 25% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)
Так — панджабі транскрыпцыя спачатку бярэ з вашага штодзённага вольнага фонду. Аудыа каштуе каля 50 жетонаў за хвіліну, таму анімаваны штодзённы фонд ахоплівае некалькі гадзінаў гуку ў дзень. Уваходныя рахункі атрымліваюць большы фонд плюс 10, 000 рэгістрацыйных жетонаў. Пасля гэтага, $1 купляе 750, 000 жетонаў (~250 гадзінаў гуку).
панджабі транскрыпты будуць вярнутыя ў стандартным UTF- 8 з звычайным правапісам мовы.
MP3, WAV, M4A, FLAC, OGG, OPUS і WEBM прымаюцца без прамежкавых фарматаў. Для відэа (MP4, MOV, MKV) мы выцягваем аўдыё- трэк з боку сервера перад адпраўкай яго ў Whisper - вам не трэба нічога пераўтвараць. Тым жа канвеерам незалежна ад зыходнай мовы, уключаючы панджабі.
Анімаваныя загрузкі могуць мець памер да 500 Мб на файл. Уваходныя рахункі могуць мець памер да 2 Гб. Працягласць не абмежавана - доўгія файлы аўтаматычна разбіраюцца на часткі (30-секундныя вокны з перакрываннем) і злучаюцца ў адзіны транскрыпт з працяглымі часовымі штампамі. Некалькігадзінныя запісы панджабі (подкаст, поўная лекцыя, сустрэча) працуюць добра.
Так — па змаўчанні дыярызацыя гаворкі ўключана для кожнай панджабі транскрыпцыі. Вывад падзяляецца на сегменты: Говорящий 1 / Говорящий 2 / Говорящий 3 з часовымі знакамі, таму інтэрв' ю, абмеркаванні і шматбаковыя сустрэчы будуць змешчаны ў сегментах. Дыярызацыя працуе па адмысловай мадэлі і працуе аднолькава для ўсіх моў, якія мы падтрымліваем.
Так — устаўце URL у / transcribe/ youtube / для YouTube або / transcribe/ podcast / для падкаст- стужак (Apple, Spotify, RSS). Мы загружаем аўдыё, запускаем яго праз Whisper з language=pa, і вяртаем транскрыпцыю з часовымі штампамі і этыкеткамі спевака. Тыповы змест панджабі: лекцыі, інтэрв'ю, галасавыя запісы і YouTube-кантэнт у панджабі працуюць — устаўце URL у /transcribe/youtube/ або загрузіце файлы прама.
Whisper каштуе каля 50 жетонаў за хвіліну гуку, таму гадзінная запіска каштуе каля 3000 жетонаў. $1 купляе 750 000 жетонаў, што складае каля 250 гадзін гуку за даляр. Большасць карыстальнікаў ніколі нічога не трацяць — бясплатны штодзённы фонд уключае кароткія кліпы, галасавыя запіскі і адну падкаст-праграму.
Так — даступныя як часопісы ўзроўню сегмента (каля 10-30 секунд), так і ўзроўню слова. Узровень слова - гэта па змаўчанні для экспарту субтытраў VTT/SRT, таму субтытры сінхранізуюць па радках. На API ўсталюйце timestamps="word" у тэкст запыту. панджабі транскрыпты будуць вярнутыя ў стандартным UTF- 8 з звычайным правапісам мовы.
Так. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=pa — або абмяжоўвайце параметр мовы, каб Whisper мог аўтаматычна вызначыць мову. Верне JSON з транскрыптам, сегментамі, часовымі штампамі і этыкеткамі гукарэжысёра. Поўная спасылка і выразкі SDK у /api/.
Так — пасля завяршэння транскрыпцыі націсніце Пераклад або ўстаўце тэкст у /translate/. панджабі працуе з усімі іншымі мовамі, якія мы падтрымліваем (200+). Для пратаколаў сустрэч транскрыпцыя праходзіць праз /summarize/; для дубліравання адпраўце яе ў /voice/tts/, каб атрымаць гук на мэтавай мове.
Праграма Whisper не дае такой дакладнасці, як мова з высокім узроўнем рэсурсаў. У гэтым выпадку праблема заключаецца ў колькасці гуку, якое панджабі чуў падчас трэніроўкі, а не ў шуме. Праграма Whisper дае лепшую дакладнасць, чым мова з нізкім узроўнем рэсурсаў.Калі аўдыё не працуе, напішыце на contact@free.ai з файлам — мы вярнем вам грошы і паглядзім, ці іншы рухавік працуе з вашым аўдыё лепш.