សរសេរជាន់លើដោយឥតគិតថ្លៃ កូរ៉េ
ចម្លង កូរ៉េ អូឌីយ៉ូនិងវីដេអូទៅអត្ថបទជាមួយ AI ។ រហ័ស ត្រឹមត្រូវ និងឥតគិតថ្លៃ ។
របៀបដែលវាធ្វើការ
- ទៅកាន់ Free.ai Transcriber
- ផ្ទុកឯកសារអូឌីយ៉ូ ឬវីដេអូ កូរ៉េ ឡើង
- AI របស់យើងរកឃើញ កូរ៉េ ដោយស្វ័យប្រវត្តិ ហើយបម្លែងវា
- ទាញយកអត្ថបទបកប្រែរបស់អ្នកជាអត្ថបទ ឬចំណងជើងរង SRT
កូរ៉េ លក្ខណៈពិសេសបម្លែងជាសំឡេង
- ✓ថាមពលដោយ faster- whisper (បានអនុញ្ញាតដោយ MIT)
- ✓ការរកឃើញភាសា កូរ៉េ ដោយស្វ័យប្រវត្តិ
- ✓គាំទ្រ MP3, WAV, MP4, M4A, FLAC និងច្រើនទៀត
- ✓បោះពុម្ពពេលវេលា និងនាំចេញចំណងជើងរង (SRT)
- ✓គ្មានដែនកំណត់ទំហំឯកសារលើផែនការដែលបានបង់
- ✓ឯកជន និងមានសុវត្ថិភាព -- ឯកសារត្រូវបានលុបបន្ទាប់ពីដំណើរការ
សេចក្ដីលម្អិតភាសា
| ភាសា | កូរ៉េ |
| កូដ ISO | ko |
| ម៉ូដែល AI | សម្លេងស្រែកលឿនជាងមុន |
| តម្លៃ | ឥតគិតថ្លៃ |
ភាសាបន្ថែម
មើលភាសាទាំងអស់សំណួរដែលសួរញឹកញាប់
Whisper ធំ-v3-turbo ដីនៅក្នុងជួរភាពត្រឹមត្រូវកំពូលរបស់ខ្លួននៅលើ កូរ៉េ - ក្រោម 7% អត្រាកំហុសពាក្យនៅលើស្តង់ដារ benchmarks. ក្នុងការប្រតិបត្តិដែលមានន័យថាសំឡេងស្ទូឌីយោស្អាតមកវិញជិតល្អឥតខ្ចោះនិងសំឡេងការសន្ទនាគឺអាចប្រើបានជាមួយការសម្អាតអប្បបរមា.(កម្រិត A, under 7% word error rate លើសំណុំប្រៀបធៀប - យើងបោះពុម្ពផ្សាយកម្រិត WER ស្មោះត្រង់ជាងការអះអាងទីផ្សារ។)
បាទ — កូរ៉េ transcription draws from your daily free token pool first. សំឡេងចំណាយប្រហែល 50 សញ្ញាក្នុងមួយនាទី, ដូច្នេះការហូរប្រចាំថ្ងៃអនាមិកគ្របដណ្តប់ម៉ោងមួយចំនួននៃសំឡេងក្នុងមួយថ្ងៃ. គណនីដែលបានចុះឈ្មោះចូលទទួលបានការហូរធំជាងនេះបន្ថែមទៀត 10,000 សញ្ញាចុះឈ្មោះ. កន្លងទៅនេះ, $1 ទិញ 750,000 សញ្ញា (~ 250 ម៉ោងនៃសំឡេង).
អត្ថបទ កូរ៉េ ត្រូវបានត្រឡប់ជាស្គ្រីបដើម (UTF- 8) ។ អត្ថបទ កូរ៉េ មិនមានចន្លោះរវាងពាក្យដើមទេ សម្គាល់ពេលវេលា diarization បន្ថែមការសម្រាកធម្មជាតិនៅពេលអ្នកនិយាយប្ដូរ ។
MP3, WAV, M4A, FLAC, OGG, OPUS, និង WEBM ត្រូវបានទទួលយកដោយផ្ទាល់។ សម្រាប់វីដេអូ (MP4, MOV, MKV) យើងបានស្រង់ចេញបទអូឌីយ៉ូខាងម៉ាស៊ីនបម្រើមុនពេលផ្ញើវាទៅ Whisper — អ្នកមិនចាំបាច់បម្លែងអ្វីទាំងអស់ដោយខ្លួនឯងទេ។ បំពង់ដូចគ្នាមិនថាភាសាប្រភពរួមទាំង កូរ៉េ ។
គណនីដែលបានចុះឈ្មោះចូលទៅដល់2GB ។ រយៈពេលគឺមិនជាដែនកំណត់ដ៏លំបាកទេ - ឯកសារវែងត្រូវបានចាក់ដោយស្វ័យប្រវត្តិ (បង្អួច 30 វិនាទីជាមួយការគ្របដណ្តប់) និងបានដេរត្រឡប់មកវិញទៅក្នុងអត្ថបទតែមួយជាមួយ timestamps បន្ត។ ការថតចម្លង កូរ៉េ ជាច្រើនម៉ោង (ផតខាស់, វគ្គបង្រៀនពេញលេញ, កិច្ចប្រជុំ) ធ្វើការល្អ។
បាទ - កម្មវិធីសរសេរកំណត់ហេតុរបស់អ្នកនិយាយគឺបើកជាលំនាំដើមសម្រាប់ការសរសេរជាសំឡេង កូរ៉េ ទាំងអស់ ។ លទ្ធផលត្រូវបានបែងចែកជាផ្នែកជាអ្នកនិយាយ 1 / អ្នកនិយាយ2/ អ្នកនិយាយ3ជាមួយនឹងត្រាពេលវេលា ដូច្នេះការសន្ទនា ការពិភាក្សាក្រុម និងកិច្ចប្រជុំភាគីច្រើនមកវិញមានស្លាក ។ កម្មវិធីសរសេរកំណត់ហេតុរត់លើម៉ូដែលដាច់ដោយឡែកមួយ ហើយធ្វើការដូចគ្នានៅលើភាសាទាំងអស់ដែលយើងគាំទ្រ ។
បាទ — បិទភ្ជាប់ URL ទៅក្នុង / transcribe/youtube/ សម្រាប់ YouTube ឬ / transcribe/podcast/ សម្រាប់ Podcast Feeds (ក្រុមហ៊ុន Apple, Spotify, RSS). យើងទាញយកអូឌីយ៉ូ, រត់វាតាមរយៈ Whisper ជាមួយ language=ko, និងត្រឡប់ទៅ transcript ជាមួយ timestamps និងស្លាកអ្នកនិយាយ. មាតិកា កូរ៉េ ធម្មតា: ផតខាស់, វគ្គបណ្តុះបណ្តាល, បទសម្ភាសន៍, និងមាតិកា YouTube ទម្រង់វែងនៅក្នុង កូរ៉េ គឺជាការផ្ទុកការងារទូទៅបំផុតដែលយើងឃើញ.
សំឡេងស្រែកចំណាយពេលប្រហែល 50 សញ្ញាក្នុងមួយនាទីនៃសំឡេង, ដូច្នេះការថតមួយម៉ោងគឺ ~3,000 សញ្ញា. $1 ទិញ 750,000 សញ្ញា, ដែលធ្វើការចេញទៅប្រហែល 250 ម៉ោងនៃសំឡេងក្នុងមួយដុល្លារ. អ្នកប្រើភាគច្រើនមិនដែលចំណាយអ្វីទាំងអស់ - ទឹកហូរប្រចាំថ្ងៃដោយឥតគិតថ្លៃគ្របដណ្តប់លើវីដេអូខ្លី, ចំណាំសំឡេង, និងមួយ-off ផតខាស់.
បាទ - ទាំងផ្នែកកម្រិត (រៀងរាល់ ~ 10-30 វិនាទី) និង សម្គាល់ ពេលវេលា កម្រិត ពាក្យ មាន ។ កម្រិត ពាក្យ គឺជា លំនាំ ដើម សម្រាប់ នាំ ចេញ ចំណង ជើង រង VTT / SRT ដូច្នេះ ចំណង ជើង សមកាលកម្ម បន្ទាត់ ដោយ បន្ទាត់ ។ នៅលើ API កំណត់ សម្គាល់ ពេលវេលា =" ពាក្យ " ក្នុង រាងកាយ សំណើ ។ អត្ថបទ កូរ៉េ ត្រូវបានត្រឡប់ជាស្គ្រីបដើម (UTF- 8) ។ អត្ថបទ កូរ៉េ មិនមានចន្លោះរវាងពាក្យដើមទេ សម្គាល់ពេលវេលា diarization បន្ថែមការសម្រាកធម្មជាតិនៅពេលអ្នកនិយាយប្ដូរ ។
បាទ / ចាស. អូឌីយ៉ូ POST (ផ្នែកច្រើន / ទិន្នន័យសំណុំបែបបទ, ឈ្មោះវាល "ឯកសារ") ទៅ / v1 / transcribe / ជាមួយ language=ko — ឬលុបប៉ារ៉ាម៉ែត្រភាសាដើម្បីឱ្យ Whisper រកមើលដោយស្វ័យប្រវត្តិ. ត្រឡប់ JSON ជាមួយ transcript, ផ្នែក, សម្គាល់ពេលវេលានិងស្លាកអ្នកនិយាយ. សេចក្ដីយោងពេញលេញនិង snippets SDK នៅ / api /.
បាទ - បញ្ចប់ការបកប្រែម្តង, ចុច បកប្រែ ឬ បិទភ្ជាប់អត្ថបទទៅក្នុង / បកប្រែ /. កូរ៉េ គូជាមួយភាសាផ្សេងទៀតទាំងអស់ដែលយើងគាំទ្រ (200+). សម្រាប់កិច្ចប្រជុំនាទីបំពង់ការបកប្រែតាមរយៈ / summarize /; សម្រាប់ dubbing ផ្ញើវាទៅ / voice / tts / ដើម្បីបង្ហាញអូឌីយ៉ូនៅក្នុងភាសាគោលដៅ.
Whisper ត្រូវបានបង្ហាត់លើ 680K ម៉ោងនៃសំឡេងដែលមានសំឡេងរំខានក្នុងពិភពលោកពិត ដូច្នេះការបកប្រែ កូរ៉េ គឺរឹងមាំចំពោះសំឡេងរំខានផ្ទៃខាងក្រោយ គ្រែតន្ត្រី និងការថតគុណភាពទូរស័ព្ទ ។ ការកាត់ធ្ងន់ធ្ងរ ឬអ្នកនិយាយច្រើនដែលគ្របដណ្ដប់នឹងនៅតែធ្វើឲ្យខូចភាពត្រឹមត្រូវ ។ប្រសិនបើការបកប្រែមិនអាចប្រើបានវិញ សូមផ្ញើអ៊ីមែលទៅ contact@free.ai ជាមួយនឹងឯកសារនោះ — យើងនឹងសងប្រាក់វិញនូវតួអក្សរដែលបានយកមកប្រើប្រាស់ហើយពិនិត្យមើលថាតើម៉ាស៊ីនផ្សេងទៀតអាចគ្រប់គ្រងអូឌីយ៉ូរបស់អ្នកបានល្អជាងមុនឬអត់។