GOT-OCR v2
Free.ai
·
ocr
·
~500 រូបិយប័ណ្ណក្នុងមួយ page
GOT-OCR v2 គឺជា a ម៉ូដែល OCR ។ ផ្លូវតាមរយៈម៉ូដែលខាងក្រៅ - ~ 500 រូបិយប័ណ្ណ ទំព័រនីមួយៗ (50% តម្លៃលើតម្លៃឡើង).
សំណួរដែលសួរញឹកញាប់
GOT-OCR v2 ដកស្រង់អត្ថបទពីរូបភាពនិង PDFs ។ ផ្ទុកឡើងទំព័រដែលបានស្កេនមួយ រូបថតអេក្រង់ ឬរូបថតនៃឯកសារមួយ ហើយ GOT-OCR v2 ត្រឡប់អត្ថបទ - ការរក្សាទុកការឈប់បន្ទាត់និង (លើម៉ាស៊ីនដែលអាចធ្វើបាន) តារាង រូបមន្ត និងរចនាសម្ព័ន្ធ ។
GOT-OCR v2 គ្រប់គ្រងស្គ្រីបរាប់សិប — ឡាតាំង ស៊ីរីលីក CJK អារ៉ាប់ Devanagari និងច្រើនទៀត ។ ចំណុចប្រទាក់ / ocr / មានបញ្ជីភាសាពេញលេញក្នុងមួយម៉ាស៊ីន ។
បាទ/ ចាស សម្រាប់ការសរសេរដោយដៃរចនាប័ទ្មបោះពុម្ពស្អាត ខ្លី និងខ្លីគឺពិបាកជាង ។ TrOCR និងម៉ាស៊ីនដែលមានមូលដ្ឋានលើបម្លែងទំនើបគឺប្រសើរជាង Tesseract ចាស់លើការសរសេរដោយដៃ ។
ម៉ាស៊ីនដឹងប្លង់ (GOT-OCR, សញ្ញាសម្គាល់, Florence-2) ត្រឡប់ Markdown / តារាង HTML និង LaTeX សម្រាប់ រូបមន្ត ។ ម៉ាស៊ីនអត្ថបទធម្មតា ត្រឡប់អត្ថបទដោយគ្មានរចនាសម្ព័ន្ធ — ពិនិត្យមើលរបៀបលទ្ធផលរបស់ម៉ូដែលនេះ ។
GOT-OCR v2 គឺជាម៉ាស៊ីន OCR ប្រាក់រង្វាន់។ អំពី ~500–1,500 សញ្ញាក្នុងមួយទំព័រ។ $1 = 750,000 សញ្ញា។
PNG, JPG, WebP, HEIC, BMP, បន្ថែមពីលើទំព័រ PDF មួយនិងច្រើនទំព័ររហូតដល់ 50 MB ។ ទំព័រដែលបង្វិលឬបង្វិលត្រូវបានកែដោយស្វ័យប្រវត្តិមុនពេលស្រង់ចេញ។
ភាពត្រឹមត្រូវតួអក្សរជាធម្មតាគឺ> 98% លើទំព័របោះពុម្ពស្អាត ធ្លាក់ចុះលើរូបថតកម្រិតពន្លឺទាប ការស្កេនដែលមានភាពខុសគ្នាខ្លាំង ឬពុម្ពអក្សរមិនធម្មតា ។ ប្រៀបធៀបម៉ាស៊ីនលើ / ocr / compare / នៅពេលដែលភាពត្រឹមត្រូវសំខាន់ ។
បាទ — / batch / ទទួលយកថតរូបភាព / PDFs. ការស្រង់ចេញនីមួយៗចុះចតនៅក្នុង / account /? tab = ប្រវត្តិ. សម្រាប់ថត-មែកធាងរក្សាទុកប្រើ API.
បាទ — POST ឯកសាររបស់អ្នកទៅ /v1/ocr/ ជាមួយ model="GOT-OCR v2" ។ ត្រឡប់ JSON ជាមួយអត្ថបទ + (នៅពេលគាំទ្រ) ប្លង់ + ប្រអប់កំណត់កម្រិតពាក្យ ។ /api/ មានសេចក្ដីយោងពេញលេញ ។
ម៉ូដែលដែលបានរៀបចំដោយខ្លួនឯងរក្សាឯកសាររបស់អ្នកនៅលើ GPUs របស់យើង ប្រាក់រង្វាន់ឆ្លងកាត់ជាមួយនឹង DPA ។ ឯកសារត្រូវបានលុបបន្ទាប់ពីបង្អួចចែករំលែក ។ យើងមិនបណ្តុះបណ្តាលលើការបញ្ចូលរបស់អ្នកទេ ។
Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.
1-5 វិនាទីក្នុងមួយទំព័រជាទូទៅ។ ម៉ាស៊ីនដែលដឹងអំពីប្លង់ (តារាងគណិតវិទ្យា) ចំណាយពេលយូរ។ ទំព័រ PDF ច្រើនទំព័រធ្វើមាត្រដ្ឋានយ៉ាងជិតស្និទ្ធ។