GOT-OCR v2
Free.ai
·
ocr
·
~500 प्रति टोकन page
GOT-OCR v2 a ओसीआर नमूना हो । बाह्य मोडेल मार्फत मार्ग — ~ 500 टोकन प्रति पृष्ठ (50% माथि अपस्ट्रिम लागत मा मार्कअप).
API मार्फत प्रयोग गर्नुहोस्
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
मिसिलीकरण
API कुञ्जी प्राप्त गर्नुहोस्
प्राय सोधिने प्रश्नहरू
GOT-OCR v2 छविहरू र PDFs देखि पाठ निकाल्छ। एक स्क्यान गरिएको पृष्ठ अपलोड, एक स्क्रिनसट, वा कागजातको फोटो र GOT-OCR v2 पाठ फर्काउँछ - लाइन ब्रेक र (सक्षम इन्जिनहरूमा) तालिकाहरू, सूत्रहरू र संरचनाहरूको संरक्षण।
GOT-OCR v2 ले स्क्रिप्टको दर्जनौं ह्यान्डल गर्दछ - ल्याटिन, सिरिलिक, CJK, अरबी, देवनागरी, र धेरै। /ocr/ लैंडिङमा प्रति इन्जिन पूर्ण भाषा सूची छ।
सफा मुद्रित-शैली हातलेखनका लागि हो; कर्सर र छोटो हात कठिन छन् । TrOCR र आधुनिक ट्रान्सफर-आधारित इन्जिनहरू हातलेखनमा परम्परागत टेसेराक्ट्स भन्दा राम्रो देखिन्छन् ।
सजावट-सचेत इन्जिन (GOT-OCR, Marker, Florence-2) ले मार्कडाउन/HTML तालिका र सूत्रका लागि LaTeX फर्काउँछ । सादा-पाठ इन्जिनले संरचना बिना पाठ फर्काउँछ — यो नमूनाको निर्गत मोड जाँच गर्नुहोस् ।
GOT-OCR v2 एक प्रिमियम ओसीआर इन्जिन हो। प्रति पृष्ठ ~500–1,500 टोकनहरूको बारेमा। $1 = 750,000 टोकनहरू।
PNG, JPG, WebP, HEIC, BMP, प्लस एकल र बहु-पृष्ठ PDFs सम्म 50 मेगाबाइट। स्केवेड वा घुमाइएका पृष्ठहरू निकाल्नु अघि स्वचालित रूपमा सुधार गरिन्छ।
क्यारेक्टर सटीकता सामान्यतया सफा मुद्रित पृष्ठहरूमा> 98% हो, कम-रिजोल्युसन फोटोहरूमा ड्रप, गम्भीर रूपमा झुकाव स्क्यानहरू, वा असामान्य फन्टहरू। सटीकता कुराहरूमा /ocr/compare/ मा इन्जिनहरू तुलना गर्नुहोस्।
हो — / batch / छविहरू / PDFs को फोल्डर स्वीकार गर्दछ। प्रत्येक निष्कर्षण / खाता / मा भूमि? ट्याब = इतिहास। फोल्डर-ट्री संरक्षणको लागि API प्रयोग गर्नुहोस्।
हो — /v1/ocr/ मा तपाईँको फाइल POST गर्नुहोस्, जसमा मोडल="GOT-OCR v2" छ । पाठ + (समर्थित हुँदा) सजावट + शब्द-स्तरको बाउन्डिङ बाकसहरूसँग JSON फर्काउँछ । /api/ मा पूर्ण सन्दर्भ छ ।
आत्म-होस्ट मोडेल हाम्रो GPUs मा आफ्नो फाइल राख्न; प्रिमियम एक DPA संग मार्फत पास. कागजातहरू साझेदारी-सञ्झ्याल पछि मेटिएको छ. हामी आफ्नो इनपुटमा प्रशिक्षण छैन.
Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.
1-5 सेकेन्ड प्रति पृष्ठ सामान्यतया। सजावट-सचेत इन्जिनहरू (तालिकाहरू, गणित) लामो समय लिन्छ। बहु-पृष्ठ PDFs लगभग रेखात्मक रूपमा मापन गर्दछ।