Unlimited-OCR 3B

Free.ai (self-hosted) · ocr · ~300 រូបិយប័ណ្ណ​ក្នុង​មួយ page

ទម្លាក់​ឯកសារ​នៅ​ទីនេះ ឬ​ចុច​ដើម្បី​រុករក

~300 រូបិយប័ណ្ណ​ក្នុង​មួយ page

Unlimited-OCR 3B គឺជា a ម៉ូដែល OCR ដែលបានសាងសង់ដោយ Baidu ។ ខ្លាំងបំផុតនៅ Image / scan to structured Markdown, complex layouts, tables, multi-page documents. ។ ខ្លួនឯងបានរៀបចំនៅលើ Free.ai GPUs - រត់ដោយឥតគិតថ្លៃប្រឆាំងនឹងទឹកកាក់ប្រចាំថ្ងៃរបស់អ្នក (300 រូបិយប័ណ្ណ ទំព័រ​នីមួយៗ) ។ ចេញផ្សាយក្រោម MIT — ការប្រើពាណិជ្ជកម្មត្រូវបានអនុញ្ញាតនៅលើ Free.ai ។

ប្រើ​តាម​រយៈ API

OpenAI- ឆបគ្នា REST API ។ បង្កើតសោ និងហៅម៉ូដែលនេះក្នុងមួយវិនាទី ។

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"unlimited-ocr","prompt":"your prompt here"}'
ឯកសារ API យក​សោ API

ម៉ូដែល​ស្រដៀងគ្នា

សំណួរ​ដែល​សួរ​ញឹកញាប់

Unlimited-OCR 3B ដកស្រង់អត្ថបទពីរូបភាពនិង PDFs ។ ផ្ទុកឡើងទំព័រដែលបានស្កេនមួយ រូបថតអេក្រង់ ឬរូបថតនៃឯកសារមួយ ហើយ Unlimited-OCR 3B ត្រឡប់អត្ថបទ - ការរក្សាទុកការឈប់បន្ទាត់និង (លើម៉ាស៊ីនដែលអាចធ្វើបាន) តារាង រូបមន្ត និងរចនាសម្ព័ន្ធ ។

Unlimited-OCR 3B គ្រប់គ្រង​ស្គ្រីប​រាប់​សិប​ — ឡាតាំង ស៊ីរីលីក CJK អារ៉ាប់ Devanagari និង​ច្រើន​ទៀត ។ ចំណុច​ប្រទាក់ / ocr / មាន​បញ្ជី​ភាសា​ពេញលេញ​ក្នុង​មួយ​ម៉ាស៊ីន ។

បាទ/ ចាស សម្រាប់​ការ​សរសេរ​ដោយ​ដៃ​រចនាប័ទ្ម​បោះពុម្ព​ស្អាត ខ្លី និង​ខ្លី​គឺ​ពិបាក​ជាង ។ TrOCR និង​ម៉ាស៊ីន​ដែល​មាន​មូលដ្ឋាន​លើ​បម្លែង​ទំនើប​គឺ​ប្រសើរ​ជាង​ Tesseract ចាស់​លើ​ការ​សរសេរ​ដោយ​ដៃ ។

ម៉ាស៊ីន​ដឹង​ប្លង់ (GOT-OCR, សញ្ញា​សម្គាល់, Florence-2) ត្រឡប់ Markdown / តារាង HTML និង LaTeX សម្រាប់ រូបមន្ត ។ ម៉ាស៊ីន​អត្ថបទ​ធម្មតា ត្រឡប់​អត្ថបទ​ដោយ​គ្មាន​រចនាសម្ព័ន្ធ — ពិនិត្យ​មើល​របៀប​លទ្ធផល​របស់​ម៉ូដែល​នេះ ។

Unlimited-OCR 3B រត់នៅលើ GPUs របស់យើងពីទឹកដោះគោឥតគិតថ្លៃប្រចាំថ្ងៃរបស់អ្នក; $5 → 200,000 រូបិយប័ណ្ណដែលបានបង់ប្រាក់បន្ទាប់ពី. ~300 រូបិយប័ណ្ណក្នុងមួយទំព័រ.

PNG, JPG, WebP, HEIC, BMP, បន្ថែមពីលើទំព័រ PDF មួយនិងច្រើនទំព័ររហូតដល់ 50 MB ។ ទំព័រដែលបង្វិលឬបង្វិលត្រូវបានកែដោយស្វ័យប្រវត្តិមុនពេលស្រង់ចេញ។

ភាព​ត្រឹមត្រូវ​តួអក្សរ​ជា​ធម្មតា​គឺ> 98% លើ​ទំព័រ​បោះពុម្ព​ស្អាត ធ្លាក់​ចុះ​លើ​រូបថត​កម្រិត​ពន្លឺ​ទាប ការ​ស្កេន​ដែល​មាន​ភាព​ខុស​គ្នា​ខ្លាំង ឬ​ពុម្ព​អក្សរ​មិន​ធម្មតា ។ ប្រៀបធៀប​ម៉ាស៊ីន​លើ / ocr / compare / នៅពេល​ដែល​ភាព​ត្រឹមត្រូវ​សំខាន់ ។

បាទ — / batch / ទទួលយកថតរូបភាព / PDFs. ការស្រង់ចេញនីមួយៗចុះចតនៅក្នុង / account /? tab = ប្រវត្តិ. សម្រាប់ថត-មែកធាងរក្សាទុកប្រើ API.

បាទ — POST ឯកសាររបស់អ្នកទៅ /v1/ocr/ ជាមួយ model="Unlimited-OCR 3B" ។ ត្រឡប់ JSON ជាមួយអត្ថបទ + (នៅពេលគាំទ្រ) ប្លង់ + ប្រអប់កំណត់កម្រិតពាក្យ ។ /api/ មានសេចក្ដីយោងពេញលេញ ។

ម៉ូដែល​ដែល​បាន​រៀបចំ​ដោយ​ខ្លួន​ឯង​រក្សា​ឯកសារ​របស់​អ្នក​នៅ​លើ GPUs របស់យើង​ ប្រាក់​រង្វាន់​ឆ្លងកាត់​ជាមួយ​នឹង DPA ។ ឯកសារ​ត្រូវបាន​លុប​បន្ទាប់ពី​បង្អួច​ចែករំលែក ។ យើង​មិន​បណ្តុះបណ្តាល​លើ​ការ​បញ្ចូល​របស់អ្នក​ទេ ។

Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.

1-5 វិនាទីក្នុងមួយទំព័រជាទូទៅ។ ម៉ាស៊ីនដែលដឹងអំពីប្លង់ (តារាងគណិតវិទ្យា) ចំណាយពេលយូរ។ ទំព័រ PDF ច្រើនទំព័រធ្វើមាត្រដ្ឋានយ៉ាងជិតស្និទ្ធ។

ស្រឡាញ់ Free.ai? ប្រាប់មិត្តភក្តិរបស់អ្នក!

វាយតម្លៃ​ទំព័រ​នេះ