សរសេរជាន់លើដោយឥតគិតថ្លៃ សំស្ក្រឹត
ចម្លង សំស្ក្រឹត អូឌីយ៉ូនិងវីដេអូទៅអត្ថបទជាមួយ AI ។ រហ័ស ត្រឹមត្រូវ និងឥតគិតថ្លៃ ។
របៀបដែលវាធ្វើការ
- ទៅកាន់ Free.ai Transcriber
- ផ្ទុកឯកសារអូឌីយ៉ូ ឬវីដេអូ សំស្ក្រឹត ឡើង
- AI របស់យើងរកឃើញ សំស្ក្រឹត ដោយស្វ័យប្រវត្តិ ហើយបម្លែងវា
- ទាញយកអត្ថបទបកប្រែរបស់អ្នកជាអត្ថបទ ឬចំណងជើងរង SRT
សំស្ក្រឹត លក្ខណៈពិសេសបម្លែងជាសំឡេង
- ✓ថាមពលដោយ faster- whisper (បានអនុញ្ញាតដោយ MIT)
- ✓ការរកឃើញភាសា សំស្ក្រឹត ដោយស្វ័យប្រវត្តិ
- ✓គាំទ្រ MP3, WAV, MP4, M4A, FLAC និងច្រើនទៀត
- ✓បោះពុម្ពពេលវេលា និងនាំចេញចំណងជើងរង (SRT)
- ✓គ្មានដែនកំណត់ទំហំឯកសារលើផែនការដែលបានបង់
- ✓ឯកជន និងមានសុវត្ថិភាព -- ឯកសារត្រូវបានលុបបន្ទាប់ពីដំណើរការ
សេចក្ដីលម្អិតភាសា
| ភាសា | សំស្ក្រឹត |
| កូដ ISO | sa |
| ម៉ូដែល AI | សម្លេងស្រែកលឿនជាងមុន |
| តម្លៃ | ឥតគិតថ្លៃ |
ភាសាបន្ថែម
មើលភាសាទាំងអស់សំណួរដែលសួរញឹកញាប់
សំស្ក្រឹត គឺជាភាសាដែលមានធនធានតិចសម្រាប់ Whisper - ធំ-v3-turbo អង្គុយនៅខាងលើ 25% អត្រាកំហុសពាក្យ, ពេលខ្លះល្អនៅខាងលើ. អត្ថបទនេះមានប្រយោជន៍សម្រាប់ស្វែងរកនិង gist ប៉ុន្តែមិនគួរត្រូវបានចាត់ទុកថាជាបោះពុម្ពផ្សាយ-រួចរាល់. ប្រសិនបើម៉ាស៊ីនដែលមានភាពត្រឹមត្រូវខ្ពស់ក្លាយជាអាចរកបានសម្រាប់ សំស្ក្រឹត យើងខ្សែវាដោយស្វ័យប្រវត្តិ.(កម្រិត D, over 25% word error rate លើសំណុំប្រៀបធៀប - យើងបោះពុម្ពផ្សាយកម្រិត WER ស្មោះត្រង់ជាងការអះអាងទីផ្សារ។)
បាទ — សំស្ក្រឹត transcription draws from your daily free token pool first. សំឡេងចំណាយប្រហែល 50 សញ្ញាក្នុងមួយនាទី, ដូច្នេះការហូរប្រចាំថ្ងៃអនាមិកគ្របដណ្តប់ម៉ោងមួយចំនួននៃសំឡេងក្នុងមួយថ្ងៃ. គណនីដែលបានចុះឈ្មោះចូលទទួលបានការហូរធំជាងនេះបន្ថែមទៀត 10,000 សញ្ញាចុះឈ្មោះ. កន្លងទៅនេះ, $1 ទិញ 750,000 សញ្ញា (~ 250 ម៉ោងនៃសំឡេង).
សំស្ក្រឹត transcripts ត្រូវបានត្រឡប់ជា UTF-8 ស្តង់ដារជាមួយអក្ខរាវិរុទ្ធធម្មតារបស់ភាសា & # 160; ។
MP3, WAV, M4A, FLAC, OGG, OPUS, និង WEBM ត្រូវបានទទួលយកដោយផ្ទាល់។ សម្រាប់វីដេអូ (MP4, MOV, MKV) យើងបានស្រង់ចេញបទអូឌីយ៉ូខាងម៉ាស៊ីនបម្រើមុនពេលផ្ញើវាទៅ Whisper — អ្នកមិនចាំបាច់បម្លែងអ្វីទាំងអស់ដោយខ្លួនឯងទេ។ បំពង់ដូចគ្នាមិនថាភាសាប្រភពរួមទាំង សំស្ក្រឹត ។
គណនីដែលបានចុះឈ្មោះចូលទៅដល់2GB ។ រយៈពេលគឺមិនជាដែនកំណត់ដ៏លំបាកទេ - ឯកសារវែងត្រូវបានចាក់ដោយស្វ័យប្រវត្តិ (បង្អួច 30 វិនាទីជាមួយការគ្របដណ្តប់) និងបានដេរត្រឡប់មកវិញទៅក្នុងអត្ថបទតែមួយជាមួយ timestamps បន្ត។ ការថតចម្លង សំស្ក្រឹត ជាច្រើនម៉ោង (ផតខាស់, វគ្គបង្រៀនពេញលេញ, កិច្ចប្រជុំ) ធ្វើការល្អ។
បាទ - កម្មវិធីសរសេរកំណត់ហេតុរបស់អ្នកនិយាយគឺបើកជាលំនាំដើមសម្រាប់ការសរសេរជាសំឡេង សំស្ក្រឹត ទាំងអស់ ។ លទ្ធផលត្រូវបានបែងចែកជាផ្នែកជាអ្នកនិយាយ 1 / អ្នកនិយាយ2/ អ្នកនិយាយ3ជាមួយនឹងត្រាពេលវេលា ដូច្នេះការសន្ទនា ការពិភាក្សាក្រុម និងកិច្ចប្រជុំភាគីច្រើនមកវិញមានស្លាក ។ កម្មវិធីសរសេរកំណត់ហេតុរត់លើម៉ូដែលដាច់ដោយឡែកមួយ ហើយធ្វើការដូចគ្នានៅលើភាសាទាំងអស់ដែលយើងគាំទ្រ ។
បាទ — បិទភ្ជាប់ URL ទៅក្នុង / transcribe/youtube/ សម្រាប់ YouTube ឬ / transcribe/podcast/ សម្រាប់ Podcast Feeds (ក្រុមហ៊ុន Apple, Spotify, RSS). យើងទាញយកអូឌីយ៉ូ, រត់វាតាមរយៈ Whisper ជាមួយ language=sa, និងត្រឡប់ទៅ transcript ជាមួយ timestamps និងស្លាកអ្នកនិយាយ. មាតិកា សំស្ក្រឹត ធម្មតា: បទបង្ហាញ, ការសម្ភាសន៍, សំបុត្រសំឡេង, និងមាតិកា YouTube ក្នុង សំស្ក្រឹត ទាំងអស់ការងារ — បិទភ្ជាប់ URL ទៅក្នុង /transcribe/youtube/ ឬផ្ទុកឡើងឯកសារដោយផ្ទាល់.
សំឡេងស្រែកចំណាយពេលប្រហែល 50 សញ្ញាក្នុងមួយនាទីនៃសំឡេង, ដូច្នេះការថតមួយម៉ោងគឺ ~3,000 សញ្ញា. $1 ទិញ 750,000 សញ្ញា, ដែលធ្វើការចេញទៅប្រហែល 250 ម៉ោងនៃសំឡេងក្នុងមួយដុល្លារ. អ្នកប្រើភាគច្រើនមិនដែលចំណាយអ្វីទាំងអស់ - ទឹកហូរប្រចាំថ្ងៃដោយឥតគិតថ្លៃគ្របដណ្តប់លើវីដេអូខ្លី, ចំណាំសំឡេង, និងមួយ-off ផតខាស់.
បាទ - ទាំងផ្នែកកម្រិត (រៀងរាល់ ~ 10-30 វិនាទី) និង សម្គាល់ ពេលវេលា កម្រិត ពាក្យ មាន ។ កម្រិត ពាក្យ គឺជា លំនាំ ដើម សម្រាប់ នាំ ចេញ ចំណង ជើង រង VTT / SRT ដូច្នេះ ចំណង ជើង សមកាលកម្ម បន្ទាត់ ដោយ បន្ទាត់ ។ នៅលើ API កំណត់ សម្គាល់ ពេលវេលា =" ពាក្យ " ក្នុង រាងកាយ សំណើ ។ សំស្ក្រឹត transcripts ត្រូវបានត្រឡប់ជា UTF-8 ស្តង់ដារជាមួយអក្ខរាវិរុទ្ធធម្មតារបស់ភាសា & # 160; ។
បាទ / ចាស. អូឌីយ៉ូ POST (ផ្នែកច្រើន / ទិន្នន័យសំណុំបែបបទ, ឈ្មោះវាល "ឯកសារ") ទៅ / v1 / transcribe / ជាមួយ language=sa — ឬលុបប៉ារ៉ាម៉ែត្រភាសាដើម្បីឱ្យ Whisper រកមើលដោយស្វ័យប្រវត្តិ. ត្រឡប់ JSON ជាមួយ transcript, ផ្នែក, សម្គាល់ពេលវេលានិងស្លាកអ្នកនិយាយ. សេចក្ដីយោងពេញលេញនិង snippets SDK នៅ / api /.
បាទ - បញ្ចប់ការបកប្រែម្តង, ចុច បកប្រែ ឬ បិទភ្ជាប់អត្ថបទទៅក្នុង / បកប្រែ /. សំស្ក្រឹត គូជាមួយភាសាផ្សេងទៀតទាំងអស់ដែលយើងគាំទ្រ (200+). សម្រាប់កិច្ចប្រជុំនាទីបំពង់ការបកប្រែតាមរយៈ / summarize /; សម្រាប់ dubbing ផ្ញើវាទៅ / voice / tts / ដើម្បីបង្ហាញអូឌីយ៉ូនៅក្នុងភាសាគោលដៅ.
ការបង្ហាត់សម្លេងរំខានរបស់ Whisper ជួយតិចនៅកម្រិតនេះ — ច្រកគឺចំនួនអូឌីយ៉ូ សំស្ក្រឹត Whisper ឃើញក្នុងពេលបង្ហាត់មិនមែនសំឡេងរំខានទេ ។ អូឌីយ៉ូស្ទូឌីយោស្អាតនៅតែវាយសំឡេងរំខាន ប៉ុន្តែមិនអាចទៅដល់ភាពត្រឹមត្រូវដែលអ្នកនឹងទទួលបានលើភាសាធនធានខ្ពស់ឡើយ ។ប្រសិនបើការបកប្រែមិនអាចប្រើបានវិញ សូមផ្ញើអ៊ីមែលទៅ contact@free.ai ជាមួយនឹងឯកសារនោះ — យើងនឹងសងប្រាក់វិញនូវតួអក្សរដែលបានយកមកប្រើប្រាស់ហើយពិនិត្យមើលថាតើម៉ាស៊ីនផ្សេងទៀតអាចគ្រប់គ្រងអូឌីយ៉ូរបស់អ្នកបានល្អជាងមុនឬអត់។