សរសេរជាន់លើដោយឥតគិតថ្លៃ អង់គ្លេស
ចម្លង អង់គ្លេស អូឌីយ៉ូនិងវីដេអូទៅអត្ថបទជាមួយ AI ។ រហ័ស ត្រឹមត្រូវ និងឥតគិតថ្លៃ ។
របៀបដែលវាធ្វើការ
- ទៅកាន់ Free.ai Transcriber
- ផ្ទុកឯកសារអូឌីយ៉ូ ឬវីដេអូ អង់គ្លេស ឡើង
- AI របស់យើងរកឃើញ អង់គ្លេស ដោយស្វ័យប្រវត្តិ ហើយបម្លែងវា
- ទាញយកអត្ថបទបកប្រែរបស់អ្នកជាអត្ថបទ ឬចំណងជើងរង SRT
អង់គ្លេស លក្ខណៈពិសេសបម្លែងជាសំឡេង
- ✓ថាមពលដោយ faster- whisper (បានអនុញ្ញាតដោយ MIT)
- ✓ការរកឃើញភាសា អង់គ្លេស ដោយស្វ័យប្រវត្តិ
- ✓គាំទ្រ MP3, WAV, MP4, M4A, FLAC និងច្រើនទៀត
- ✓បោះពុម្ពពេលវេលា និងនាំចេញចំណងជើងរង (SRT)
- ✓គ្មានដែនកំណត់ទំហំឯកសារលើផែនការដែលបានបង់
- ✓ឯកជន និងមានសុវត្ថិភាព -- ឯកសារត្រូវបានលុបបន្ទាប់ពីដំណើរការ
សេចក្ដីលម្អិតភាសា
| ភាសា | អង់គ្លេស |
| កូដ ISO | en |
| ម៉ូដែល AI | សម្លេងស្រែកលឿនជាងមុន |
| តម្លៃ | ឥតគិតថ្លៃ |
ភាសាបន្ថែម
មើលភាសាទាំងអស់សំណួរដែលសួរញឹកញាប់
Whisper ធំ-v3-turbo ដីនៅក្នុងជួរភាពត្រឹមត្រូវកំពូលរបស់ខ្លួននៅលើ អង់គ្លេស - ក្រោម 7% អត្រាកំហុសពាក្យនៅលើស្តង់ដារ benchmarks. ក្នុងការប្រតិបត្តិដែលមានន័យថាសំឡេងស្ទូឌីយោស្អាតមកវិញជិតល្អឥតខ្ចោះនិងសំឡេងការសន្ទនាគឺអាចប្រើបានជាមួយការសម្អាតអប្បបរមា.(កម្រិត A, under 7% word error rate លើសំណុំប្រៀបធៀប - យើងបោះពុម្ពផ្សាយកម្រិត WER ស្មោះត្រង់ជាងការអះអាងទីផ្សារ។)
បាទ — អង់គ្លេស transcription draws from your daily free token pool first. សំឡេងចំណាយប្រហែល 50 សញ្ញាក្នុងមួយនាទី, ដូច្នេះការហូរប្រចាំថ្ងៃអនាមិកគ្របដណ្តប់ម៉ោងមួយចំនួននៃសំឡេងក្នុងមួយថ្ងៃ. គណនីដែលបានចុះឈ្មោះចូលទទួលបានការហូរធំជាងនេះបន្ថែមទៀត 10,000 សញ្ញាចុះឈ្មោះ. កន្លងទៅនេះ, $1 ទិញ 750,000 សញ្ញា (~ 250 ម៉ោងនៃសំឡេង).
ភាសាអង់គ្លេស transcription គ្របដណ្តប់សហរដ្ឋអាមេរិក, ចក្រភពអង់គ្លេស, អូស្ត្រាលី, ឥណ្ឌា, និង accents ធំផ្សេងទៀតនៅក្នុងម៉ូដែលមួយ. Whisper ត្រូវបានបណ្តុះបណ្តាលនៅលើពួកគេទាំងអស់និង transcript ចេញមកនៅក្នុងការ spelling ភាសាអង់គ្លេសស្តង់ដារមិនថា accent របស់អ្នកនិយាយ.
MP3, WAV, M4A, FLAC, OGG, OPUS, និង WEBM ត្រូវបានទទួលយកដោយផ្ទាល់។ សម្រាប់វីដេអូ (MP4, MOV, MKV) យើងបានស្រង់ចេញបទអូឌីយ៉ូខាងម៉ាស៊ីនបម្រើមុនពេលផ្ញើវាទៅ Whisper — អ្នកមិនចាំបាច់បម្លែងអ្វីទាំងអស់ដោយខ្លួនឯងទេ។ បំពង់ដូចគ្នាមិនថាភាសាប្រភពរួមទាំង អង់គ្លេស ។
គណនីដែលបានចុះឈ្មោះចូលទៅដល់2GB ។ រយៈពេលគឺមិនជាដែនកំណត់ដ៏លំបាកទេ - ឯកសារវែងត្រូវបានចាក់ដោយស្វ័យប្រវត្តិ (បង្អួច 30 វិនាទីជាមួយការគ្របដណ្តប់) និងបានដេរត្រឡប់មកវិញទៅក្នុងអត្ថបទតែមួយជាមួយ timestamps បន្ត។ ការថតចម្លង អង់គ្លេស ជាច្រើនម៉ោង (ផតខាស់, វគ្គបង្រៀនពេញលេញ, កិច្ចប្រជុំ) ធ្វើការល្អ។
បាទ - កម្មវិធីសរសេរកំណត់ហេតុរបស់អ្នកនិយាយគឺបើកជាលំនាំដើមសម្រាប់ការសរសេរជាសំឡេង អង់គ្លេស ទាំងអស់ ។ លទ្ធផលត្រូវបានបែងចែកជាផ្នែកជាអ្នកនិយាយ 1 / អ្នកនិយាយ2/ អ្នកនិយាយ3ជាមួយនឹងត្រាពេលវេលា ដូច្នេះការសន្ទនា ការពិភាក្សាក្រុម និងកិច្ចប្រជុំភាគីច្រើនមកវិញមានស្លាក ។ កម្មវិធីសរសេរកំណត់ហេតុរត់លើម៉ូដែលដាច់ដោយឡែកមួយ ហើយធ្វើការដូចគ្នានៅលើភាសាទាំងអស់ដែលយើងគាំទ្រ ។
បាទ — បិទភ្ជាប់ URL ទៅក្នុង / transcribe/youtube/ សម្រាប់ YouTube ឬ / transcribe/podcast/ សម្រាប់ Podcast Feeds (ក្រុមហ៊ុន Apple, Spotify, RSS). យើងទាញយកអូឌីយ៉ូ, រត់វាតាមរយៈ Whisper ជាមួយ language=en, និងត្រឡប់ទៅ transcript ជាមួយ timestamps និងស្លាកអ្នកនិយាយ. មាតិកា អង់គ្លេស ធម្មតា: បទបង្ហាញ, ការសម្ភាសន៍, សំបុត្រសំឡេង, និងមាតិកា YouTube ក្នុង អង់គ្លេស ទាំងអស់ការងារ — បិទភ្ជាប់ URL ទៅក្នុង /transcribe/youtube/ ឬផ្ទុកឡើងឯកសារដោយផ្ទាល់.
សំឡេងស្រែកចំណាយពេលប្រហែល 50 សញ្ញាក្នុងមួយនាទីនៃសំឡេង, ដូច្នេះការថតមួយម៉ោងគឺ ~3,000 សញ្ញា. $1 ទិញ 750,000 សញ្ញា, ដែលធ្វើការចេញទៅប្រហែល 250 ម៉ោងនៃសំឡេងក្នុងមួយដុល្លារ. អ្នកប្រើភាគច្រើនមិនដែលចំណាយអ្វីទាំងអស់ - ទឹកហូរប្រចាំថ្ងៃដោយឥតគិតថ្លៃគ្របដណ្តប់លើវីដេអូខ្លី, ចំណាំសំឡេង, និងមួយ-off ផតខាស់.
បាទ - ទាំងផ្នែកកម្រិត (រៀងរាល់ ~ 10-30 វិនាទី) និង សម្គាល់ ពេលវេលា កម្រិត ពាក្យ មាន ។ កម្រិត ពាក្យ គឺជា លំនាំ ដើម សម្រាប់ នាំ ចេញ ចំណង ជើង រង VTT / SRT ដូច្នេះ ចំណង ជើង សមកាលកម្ម បន្ទាត់ ដោយ បន្ទាត់ ។ នៅលើ API កំណត់ សម្គាល់ ពេលវេលា =" ពាក្យ " ក្នុង រាងកាយ សំណើ ។ អង់គ្លេស transcripts ត្រូវបានត្រឡប់ជា UTF-8 ស្តង់ដារជាមួយអក្ខរាវិរុទ្ធធម្មតារបស់ភាសា & # 160; ។
បាទ / ចាស. អូឌីយ៉ូ POST (ផ្នែកច្រើន / ទិន្នន័យសំណុំបែបបទ, ឈ្មោះវាល "ឯកសារ") ទៅ / v1 / transcribe / ជាមួយ language=en — ឬលុបប៉ារ៉ាម៉ែត្រភាសាដើម្បីឱ្យ Whisper រកមើលដោយស្វ័យប្រវត្តិ. ត្រឡប់ JSON ជាមួយ transcript, ផ្នែក, សម្គាល់ពេលវេលានិងស្លាកអ្នកនិយាយ. សេចក្ដីយោងពេញលេញនិង snippets SDK នៅ / api /.
បាទ - បញ្ចប់ការបកប្រែម្តង, ចុច បកប្រែ ឬ បិទភ្ជាប់អត្ថបទទៅក្នុង / បកប្រែ /. អង់គ្លេស គូជាមួយភាសាផ្សេងទៀតទាំងអស់ដែលយើងគាំទ្រ (200+). សម្រាប់កិច្ចប្រជុំនាទីបំពង់ការបកប្រែតាមរយៈ / summarize /; សម្រាប់ dubbing ផ្ញើវាទៅ / voice / tts / ដើម្បីបង្ហាញអូឌីយ៉ូនៅក្នុងភាសាគោលដៅ.
Whisper ត្រូវបានបង្ហាត់លើ 680K ម៉ោងនៃសំឡេងដែលមានសំឡេងរំខានក្នុងពិភពលោកពិត ដូច្នេះការបកប្រែ អង់គ្លេស គឺរឹងមាំចំពោះសំឡេងរំខានផ្ទៃខាងក្រោយ គ្រែតន្ត្រី និងការថតគុណភាពទូរស័ព្ទ ។ ការកាត់ធ្ងន់ធ្ងរ ឬអ្នកនិយាយច្រើនដែលគ្របដណ្ដប់នឹងនៅតែធ្វើឲ្យខូចភាពត្រឹមត្រូវ ។ប្រសិនបើការបកប្រែមិនអាចប្រើបានវិញ សូមផ្ញើអ៊ីមែលទៅ contact@free.ai ជាមួយនឹងឯកសារនោះ — យើងនឹងសងប្រាក់វិញនូវតួអក្សរដែលបានយកមកប្រើប្រាស់ហើយពិនិត្យមើលថាតើម៉ាស៊ីនផ្សេងទៀតអាចគ្រប់គ្រងអូឌីយ៉ូរបស់អ្នកបានល្អជាងមុនឬអត់។