GOT-OCR v2

Free.ai · ocr · ~500 प्रति टोकन page

यहाँ फाइल छोड्नुहोस् वा ब्राउज गर्न क्लिक गर्नुहोस्

~500 प्रति टोकन page
यो पत्रिकाको प्रकाशक एफएमसी हो। यसका लागि स्तरबृद्धि गर्नुहोस् GOT-OCR v2 →

GOT-OCR v2 a ओसीआर नमूना हो । बाह्य मोडेल मार्फत मार्ग — ~ 500 टोकन प्रति पृष्ठ (50% माथि अपस्ट्रिम लागत मा मार्कअप).

API मार्फत प्रयोग गर्नुहोस्

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
मिसिलीकरण API कुञ्जी प्राप्त गर्नुहोस्

प्राय सोधिने प्रश्नहरू

GOT-OCR v2 छविहरू र PDFs देखि पाठ निकाल्छ। एक स्क्यान गरिएको पृष्ठ अपलोड, एक स्क्रिनसट, वा कागजातको फोटो र GOT-OCR v2 पाठ फर्काउँछ - लाइन ब्रेक र (सक्षम इन्जिनहरूमा) तालिकाहरू, सूत्रहरू र संरचनाहरूको संरक्षण।

GOT-OCR v2 ले स्क्रिप्टको दर्जनौं ह्यान्डल गर्दछ - ल्याटिन, सिरिलिक, CJK, अरबी, देवनागरी, र धेरै। /ocr/ लैंडिङमा प्रति इन्जिन पूर्ण भाषा सूची छ।

सफा मुद्रित-शैली हातलेखनका लागि हो; कर्सर र छोटो हात कठिन छन् । TrOCR र आधुनिक ट्रान्सफर-आधारित इन्जिनहरू हातलेखनमा परम्परागत टेसेराक्ट्स भन्दा राम्रो देखिन्छन् ।

सजावट-सचेत इन्जिन (GOT-OCR, Marker, Florence-2) ले मार्कडाउन/HTML तालिका र सूत्रका लागि LaTeX फर्काउँछ । सादा-पाठ इन्जिनले संरचना बिना पाठ फर्काउँछ — यो नमूनाको निर्गत मोड जाँच गर्नुहोस् ।

GOT-OCR v2 एक प्रिमियम ओसीआर इन्जिन हो। प्रति पृष्ठ ~500–1,500 टोकनहरूको बारेमा। $1 = 750,000 टोकनहरू।

PNG, JPG, WebP, HEIC, BMP, प्लस एकल र बहु-पृष्ठ PDFs सम्म 50 मेगाबाइट। स्केवेड वा घुमाइएका पृष्ठहरू निकाल्नु अघि स्वचालित रूपमा सुधार गरिन्छ।

क्यारेक्टर सटीकता सामान्यतया सफा मुद्रित पृष्ठहरूमा> 98% हो, कम-रिजोल्युसन फोटोहरूमा ड्रप, गम्भीर रूपमा झुकाव स्क्यानहरू, वा असामान्य फन्टहरू। सटीकता कुराहरूमा /ocr/compare/ मा इन्जिनहरू तुलना गर्नुहोस्।

हो — / batch / छविहरू / PDFs को फोल्डर स्वीकार गर्दछ। प्रत्येक निष्कर्षण / खाता / मा भूमि? ट्याब = इतिहास। फोल्डर-ट्री संरक्षणको लागि API प्रयोग गर्नुहोस्।

हो — /v1/ocr/ मा तपाईँको फाइल POST गर्नुहोस्, जसमा मोडल="GOT-OCR v2" छ । पाठ + (समर्थित हुँदा) सजावट + शब्द-स्तरको बाउन्डिङ बाकसहरूसँग JSON फर्काउँछ । /api/ मा पूर्ण सन्दर्भ छ ।

आत्म-होस्ट मोडेल हाम्रो GPUs मा आफ्नो फाइल राख्न; प्रिमियम एक DPA संग मार्फत पास. कागजातहरू साझेदारी-सञ्झ्याल पछि मेटिएको छ. हामी आफ्नो इनपुटमा प्रशिक्षण छैन.

Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.

1-5 सेकेन्ड प्रति पृष्ठ सामान्यतया। सजावट-सचेत इन्जिनहरू (तालिकाहरू, गणित) लामो समय लिन्छ। बहु-पृष्ठ PDFs लगभग रेखात्मक रूपमा मापन गर्दछ।

प्रेम Free.ai? आफ्नो साथीहरूलाई भन्नुहोस्!

यो पृष्ठ दर