សរសេរជាន់លើដោយឥតគិតថ្លៃ ម៉ាសេដូនី
ចម្លង ម៉ាសេដូនី អូឌីយ៉ូនិងវីដេអូទៅអត្ថបទជាមួយ AI ។ រហ័ស ត្រឹមត្រូវ និងឥតគិតថ្លៃ ។
របៀបដែលវាធ្វើការ
- ទៅកាន់ Free.ai Transcriber
- ផ្ទុកឯកសារអូឌីយ៉ូ ឬវីដេអូ ម៉ាសេដូនី ឡើង
- AI របស់យើងរកឃើញ ម៉ាសេដូនី ដោយស្វ័យប្រវត្តិ ហើយបម្លែងវា
- ទាញយកអត្ថបទបកប្រែរបស់អ្នកជាអត្ថបទ ឬចំណងជើងរង SRT
ម៉ាសេដូនី លក្ខណៈពិសេសបម្លែងជាសំឡេង
- ✓ថាមពលដោយ faster- whisper (បានអនុញ្ញាតដោយ MIT)
- ✓ការរកឃើញភាសា ម៉ាសេដូនី ដោយស្វ័យប្រវត្តិ
- ✓គាំទ្រ MP3, WAV, MP4, M4A, FLAC និងច្រើនទៀត
- ✓បោះពុម្ពពេលវេលា និងនាំចេញចំណងជើងរង (SRT)
- ✓គ្មានដែនកំណត់ទំហំឯកសារលើផែនការដែលបានបង់
- ✓ឯកជន និងមានសុវត្ថិភាព -- ឯកសារត្រូវបានលុបបន្ទាប់ពីដំណើរការ
សេចក្ដីលម្អិតភាសា
| ភាសា | ម៉ាសេដូនី |
| កូដ ISO | mk |
| ម៉ូដែល AI | សម្លេងស្រែកលឿនជាងមុន |
| តម្លៃ | ឥតគិតថ្លៃ |
ភាសាបន្ថែម
មើលភាសាទាំងអស់សំណួរដែលសួរញឹកញាប់
ម៉ាសេដូនី គឺជាភាសាធនធានមធ្យមសម្រាប់ Whisper - ធំ-v3-turbo ដីនៅក្នុង 15-25% ក្រុមអត្រាកំហុសពាក្យ. ខ្លឹមសារនៃ transcript គឺអាចទុកចិត្តបាន; រំពឹងថានឹងមានកំហុសឈ្មោះអង្គភាព, កូដប្តូរ glitches ពេលខ្លះនិង misfires ខ្លី-utterance. ផែនការឆ្លងកាត់មនុស្សសម្រាប់បោះពុម្ពផ្សាយគុណភាពលទ្ធផល.(កម្រិត C, 15-25% word error rate លើសំណុំប្រៀបធៀប - យើងបោះពុម្ពផ្សាយកម្រិត WER ស្មោះត្រង់ជាងការអះអាងទីផ្សារ។)
បាទ — ម៉ាសេដូនី transcription draws from your daily free token pool first. សំឡេងចំណាយប្រហែល 50 សញ្ញាក្នុងមួយនាទី, ដូច្នេះការហូរប្រចាំថ្ងៃអនាមិកគ្របដណ្តប់ម៉ោងមួយចំនួននៃសំឡេងក្នុងមួយថ្ងៃ. គណនីដែលបានចុះឈ្មោះចូលទទួលបានការហូរធំជាងនេះបន្ថែមទៀត 10,000 សញ្ញាចុះឈ្មោះ. កន្លងទៅនេះ, $1 ទិញ 750,000 សញ្ញា (~ 250 ម៉ោងនៃសំឡេង).
ម៉ាសេដូនី transcripts ត្រូវបានត្រឡប់ជា UTF-8 ស្តង់ដារជាមួយអក្ខរាវិរុទ្ធធម្មតារបស់ភាសា & # 160; ។
MP3, WAV, M4A, FLAC, OGG, OPUS, និង WEBM ត្រូវបានទទួលយកដោយផ្ទាល់។ សម្រាប់វីដេអូ (MP4, MOV, MKV) យើងបានស្រង់ចេញបទអូឌីយ៉ូខាងម៉ាស៊ីនបម្រើមុនពេលផ្ញើវាទៅ Whisper — អ្នកមិនចាំបាច់បម្លែងអ្វីទាំងអស់ដោយខ្លួនឯងទេ។ បំពង់ដូចគ្នាមិនថាភាសាប្រភពរួមទាំង ម៉ាសេដូនី ។
គណនីដែលបានចុះឈ្មោះចូលទៅដល់2GB ។ រយៈពេលគឺមិនជាដែនកំណត់ដ៏លំបាកទេ - ឯកសារវែងត្រូវបានចាក់ដោយស្វ័យប្រវត្តិ (បង្អួច 30 វិនាទីជាមួយការគ្របដណ្តប់) និងបានដេរត្រឡប់មកវិញទៅក្នុងអត្ថបទតែមួយជាមួយ timestamps បន្ត។ ការថតចម្លង ម៉ាសេដូនី ជាច្រើនម៉ោង (ផតខាស់, វគ្គបង្រៀនពេញលេញ, កិច្ចប្រជុំ) ធ្វើការល្អ។
បាទ - កម្មវិធីសរសេរកំណត់ហេតុរបស់អ្នកនិយាយគឺបើកជាលំនាំដើមសម្រាប់ការសរសេរជាសំឡេង ម៉ាសេដូនី ទាំងអស់ ។ លទ្ធផលត្រូវបានបែងចែកជាផ្នែកជាអ្នកនិយាយ 1 / អ្នកនិយាយ2/ អ្នកនិយាយ3ជាមួយនឹងត្រាពេលវេលា ដូច្នេះការសន្ទនា ការពិភាក្សាក្រុម និងកិច្ចប្រជុំភាគីច្រើនមកវិញមានស្លាក ។ កម្មវិធីសរសេរកំណត់ហេតុរត់លើម៉ូដែលដាច់ដោយឡែកមួយ ហើយធ្វើការដូចគ្នានៅលើភាសាទាំងអស់ដែលយើងគាំទ្រ ។
បាទ — បិទភ្ជាប់ URL ទៅក្នុង / transcribe/youtube/ សម្រាប់ YouTube ឬ / transcribe/podcast/ សម្រាប់ Podcast Feeds (ក្រុមហ៊ុន Apple, Spotify, RSS). យើងទាញយកអូឌីយ៉ូ, រត់វាតាមរយៈ Whisper ជាមួយ language=mk, និងត្រឡប់ទៅ transcript ជាមួយ timestamps និងស្លាកអ្នកនិយាយ. មាតិកា ម៉ាសេដូនី ធម្មតា: បទបង្ហាញ, ការសម្ភាសន៍, សំបុត្រសំឡេង, និងមាតិកា YouTube ក្នុង ម៉ាសេដូនី ទាំងអស់ការងារ — បិទភ្ជាប់ URL ទៅក្នុង /transcribe/youtube/ ឬផ្ទុកឡើងឯកសារដោយផ្ទាល់.
សំឡេងស្រែកចំណាយពេលប្រហែល 50 សញ្ញាក្នុងមួយនាទីនៃសំឡេង, ដូច្នេះការថតមួយម៉ោងគឺ ~3,000 សញ្ញា. $1 ទិញ 750,000 សញ្ញា, ដែលធ្វើការចេញទៅប្រហែល 250 ម៉ោងនៃសំឡេងក្នុងមួយដុល្លារ. អ្នកប្រើភាគច្រើនមិនដែលចំណាយអ្វីទាំងអស់ - ទឹកហូរប្រចាំថ្ងៃដោយឥតគិតថ្លៃគ្របដណ្តប់លើវីដេអូខ្លី, ចំណាំសំឡេង, និងមួយ-off ផតខាស់.
បាទ - ទាំងផ្នែកកម្រិត (រៀងរាល់ ~ 10-30 វិនាទី) និង សម្គាល់ ពេលវេលា កម្រិត ពាក្យ មាន ។ កម្រិត ពាក្យ គឺជា លំនាំ ដើម សម្រាប់ នាំ ចេញ ចំណង ជើង រង VTT / SRT ដូច្នេះ ចំណង ជើង សមកាលកម្ម បន្ទាត់ ដោយ បន្ទាត់ ។ នៅលើ API កំណត់ សម្គាល់ ពេលវេលា =" ពាក្យ " ក្នុង រាងកាយ សំណើ ។ ម៉ាសេដូនី transcripts ត្រូវបានត្រឡប់ជា UTF-8 ស្តង់ដារជាមួយអក្ខរាវិរុទ្ធធម្មតារបស់ភាសា & # 160; ។
បាទ / ចាស. អូឌីយ៉ូ POST (ផ្នែកច្រើន / ទិន្នន័យសំណុំបែបបទ, ឈ្មោះវាល "ឯកសារ") ទៅ / v1 / transcribe / ជាមួយ language=mk — ឬលុបប៉ារ៉ាម៉ែត្រភាសាដើម្បីឱ្យ Whisper រកមើលដោយស្វ័យប្រវត្តិ. ត្រឡប់ JSON ជាមួយ transcript, ផ្នែក, សម្គាល់ពេលវេលានិងស្លាកអ្នកនិយាយ. សេចក្ដីយោងពេញលេញនិង snippets SDK នៅ / api /.
បាទ - បញ្ចប់ការបកប្រែម្តង, ចុច បកប្រែ ឬ បិទភ្ជាប់អត្ថបទទៅក្នុង / បកប្រែ /. ម៉ាសេដូនី គូជាមួយភាសាផ្សេងទៀតទាំងអស់ដែលយើងគាំទ្រ (200+). សម្រាប់កិច្ចប្រជុំនាទីបំពង់ការបកប្រែតាមរយៈ / summarize /; សម្រាប់ dubbing ផ្ញើវាទៅ / voice / tts / ដើម្បីបង្ហាញអូឌីយ៉ូនៅក្នុងភាសាគោលដៅ.
ភាពរឹងមាំនៃសំឡេងរំខានរបស់ Whisper នៅតែអនុវត្តលើ ម៉ាសេដូនី ប៉ុន្តែនៅកម្រិតភាពត្រឹមត្រូវនេះសំឡេងរំខានបន្ថែមណាមួយរួមបញ្ចូលអត្រាកំហុសមូលដ្ឋាន & # 160; ។ អូឌីយ៉ូកាសស្អាតផ្តល់លទ្ធផលល្អប្រសើរជាងការថតទូរស័ព្ទ ឬកុំព្យូទ័រយួរដៃ & # 160; ។ប្រសិនបើការបកប្រែមិនអាចប្រើបានវិញ សូមផ្ញើអ៊ីមែលទៅ contact@free.ai ជាមួយនឹងឯកសារនោះ — យើងនឹងសងប្រាក់វិញនូវតួអក្សរដែលបានយកមកប្រើប្រាស់ហើយពិនិត្យមើលថាតើម៉ាស៊ីនផ្សេងទៀតអាចគ្រប់គ្រងអូឌីយ៉ូរបស់អ្នកបានល្អជាងមុនឬអត់។