GOT-OCR v2
Free.ai
·
ocr
·
~500 ਟੋਕਨਾਂ ਪ੍ਰਤੀ page
GOT-OCR v2 an OCR ਮਾਡਲ ਹੈ । ਬਾਹਰੀ ਮਾਡਲਾਂ ਰਾਹੀਂ ਰੂਟ ਕੀਤਾ — ~500 ਟੋਕਨ ਪ੍ਰਤੀ ਪੇਜ਼ (ਅੱਪਸਟਰੀਮ ਲਾਗਤ ਤੋਂ 50% ਮਾਰਕਅਪ)
API ਰਾਹੀਂ ਵਰਤੋਂ
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
API ਡੌਕੂਮੈਂਟੇਸ਼ਨ
API ਕੁੰਜੀ ਲਵੋ
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
GOT-OCR v2 ਚਿੱਤਰਾਂ ਅਤੇ PDFs ਤੋਂ ਪਾਠ ਕੱਢਦਾ ਹੈ। ਸਕੈਨ ਪੇਜ਼, ਸਕਰੀਨ-ਸ਼ਾਟ ਜਾਂ ਡੌਕੂਮੈਂਟ ਦੀ ਫੋਟੋ ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ GOT-OCR v2 ਪਾਠ ਮੁੜ- ਪ੍ਰਾਪਤ ਕਰੇਗਾ - ਲਾਈਨ ਬਰੇਕ ਅਤੇ (ਯੋਗ ਇੰਜਣਾਂ ਉੱਤੇ) ਟੇਬਲ, ਫਾਰਮੂਲੇ ਅਤੇ ਢਾਂਚਾ ਸੰਭਾਲ ਕੇ।
GOT-OCR v2 ਕਈ ਸਕ੍ਰਿਪਟਾਂ ਨੂੰ ਹੈਂਡਲ ਕਰਦਾ ਹੈ - ਲੈਟਿਨ, ਕਰਿਲਿਕ, CJK, ਅਰਬੀ, ਦੇਵਨਾਗਰੀ ਅਤੇ ਹੋਰ । /ocr/ ਲੈਂਡਿੰਗ ਵਿੱਚ ਇੰਜਣ ਪ੍ਰਤੀ ਪੂਰੀ ਭਾਸ਼ਾ ਲਿਸਟ ਹੈ ।
ਸਾਫ਼ ਛਪਾਈ-ਸਟਾਈਲ ਹੱਥਲਿਖਤ ਲਈ ਹਾਂ; ਕਰਸੀਵ ਅਤੇ ਸ਼ੋਰਟਹੈਂਡ ਵਧੇਰੇ ਮੁਸ਼ਕਲ ਹਨ। TrOCR ਅਤੇ ਆਧੁਨਿਕ ਟਰਾਨਸਫਾਰਮਰ-ਅਧਾਰਿਤ ਇੰਜਣ ਹੱਥਲਿਖਤ ਲਈ ਪੁਰਾਣੇ ਟੈਸਸਰੈਕਟ ਨਾਲੋਂ ਕਾਫੀ ਵਧੀਆ ਹਨ।
ਲੇਆਉਟ-ਸੁਚੇਤ ਇੰਜਣ (GOT-OCR, Marker, Florence-2) Markdown/HTML ਟੇਬਲ ਅਤੇ ਫਾਰਮੂਲੇ ਲਈ LaTeX ਵਾਪਸ ਕਰਦੇ ਹਨ। ਸਾਦਾ-ਪਾਠ ਇੰਜਣ ਬਿਨਾਂ ਢਾਂਚੇ ਦੇ ਪਾਠ ਵਾਪਸ ਕਰਦੇ ਹਨ - ਇਸ ਮਾਡਲ ਦਾ ਆਉਟਪੁੱਟ ਮੋਡ ਚੈੱਕ ਕਰੋ।
GOT-OCR v2 ਇੱਕ ਪ੍ਰੀਮੀਅਮ OCR ਇੰਜਣ ਹੈ । ਪ੍ਰਤੀ ਸਫ਼ਾ ~500-1,500 ਟੋਕਨ ਹਨ । $1 = 750,000 ਟੋਕਨ ਹਨ ।
PNG, JPG, WebP, HEIC, BMP, ਅਤੇ ਇੱਕ ਅਤੇ ਕਈ ਪੇਜ਼ PDFs 50 MB ਤੱਕ। ਝੁਕੇ ਜਾਂ ਘੁੰਮਦੇ ਪੇਜ਼ ਐਕਸਟਰੈਕਟ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਆਟੋ-ਸੁਧਾਰੇ ਜਾਂਦੇ ਹਨ।
ਅੱਖਰ ਦੀ ਸਹੀਤਾ ਆਮ ਤੌਰ ਉੱਤੇ ਸਾਫ਼ ਛਪਾਈ ਪੇਜ਼ਾਂ ਉੱਤੇ >98% ਹੁੰਦੀ ਹੈ, ਘੱਟ-ਰੈਜ਼ੋਲੂਸ਼ਨ ਫੋਟੋਆਂ, ਗੰਭੀਰ ਰੂਪ ਨਾਲ ਝੁਕੇ ਸਕੈਨ ਜਾਂ ਅਸਾਧਾਰਨ ਫੋਂਟਾਂ ਉੱਤੇ ਡਿੱਗਦੀ ਹੈ। ਜਦੋਂ ਸਹੀਤਾ ਮਹੱਤਵਪੂਰਨ ਹੋਵੇ ਤਾਂ /ocr/compare/ ਉੱਤੇ ਇੰਜਣਾਂ ਦੀ ਤੁਲਨਾ ਕਰੋ।
ਹਾਂ — /batch/ ਚਿੱਤਰਾਂ/PDFs ਦਾ ਫੋਲਡਰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ। ਹਰੇਕ ਐਕਸਟਰੈਕਸ਼ਨ /account/?tab=history ਵਿੱਚ ਆ ਜਾਂਦਾ ਹੈ। ਫੋਲਡਰ-ਲੜੀ ਸੰਭਾਲਣ ਲਈ API ਵਰਤੋਂ।
ਹਾਂ — ਆਪਣੀ ਫਾਇਲ ਨੂੰ /v1/ocr/ ਨਾਲ POST ਕਰੋ ਜਿਸ ਦਾ ਮਾਡਲ ਹੈ "GOT-OCR v2" । ਪਾਠ + (ਜਦੋਂ ਸਹਾਇਕ ਹੋਵੇ) ਲੇਆਉਟ + ਸ਼ਬਦ- ਪੱਧਰ ਦੇ ਸੀਮਿਤ ਬਕਸੇ ਨਾਲ JSON ਵਾਪਸ ਕਰੋ । /api/ ਵਿੱਚ ਪੂਰਾ ਹਵਾਲਾ ਹੈ ।
ਆਪਣਾ- ਹੋਸਟ ਮਾਡਲ ਤੁਹਾਡੀ ਫਾਇਲ ਨੂੰ ਸਾਡੇ GPU ਉੱਤੇ ਰੱਖਦਾ ਹੈ; ਪ੍ਰੀਮੀਅਮ ਇੱਕ DPA ਨਾਲ ਪਾਸ ਹੁੰਦਾ ਹੈ। ਸਾਂਝ- ਵਿੰਡੋ ਤੋਂ ਬਾਅਦ ਡੌਕੂਮੈਂਟ ਹਟਾਏ ਜਾਂਦੇ ਹਨ। ਅਸੀਂ ਤੁਹਾਡੀਆਂ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ।
ਹਾਂ — Free.ai ਐਕਸਟਰੈਕਟ ਕੀਤੇ ਪਾਠ ਦਾ ਵਪਾਰਕ ਵਰਤੋਂ ਦਿੰਦਾ ਹੈ । ਤੁਹਾਨੂੰ ਸਰੋਤ ਡੌਕੂਮੈਂਟ ਲਈ ਅਧਿਕਾਰ ਚਾਹੀਦੇ ਹਨ ।
ਪ੍ਰਤੀ ਸਫ਼ਾ ਆਮ ਤੌਰ ਉੱਤੇ 1-5 ਸਕਿੰਟ। ਲੇਆਉਟ-ਸੁਚੇਤ ਇੰਜਣ (ਟੇਬਲ, ਗਣਿਤ) ਲਈ ਵਧੇਰੇ ਸਮਾਂ ਲੱਗਦਾ ਹੈ। ਬਹੁ-ਪੰਨਾ PDFs ਲਗਭਗ ਰੇਖਿਕ ਸਕੇਲ ਕਰਦੇ ਹਨ।