Unlimited-OCR 3B

Free.ai (self-hosted) · ocr · ~300 ਟੋਕਨਾਂ ਪ੍ਰਤੀ page

ਫਾਇਲ ਇੱਥੇ ਸੁੱਟੋ ਜਾਂ ਝਲਕਣ ਲਈ ਕਲਿੱਕ ਕਰੋ

~300 ਟੋਕਨਾਂ ਪ੍ਰਤੀ page

Unlimited-OCR 3B an OCR ਮਾਡਲ ਹੈ, ਜੋ ਕਿ Baidu ਨੇ ਬਣਾਇਆ ਹੈ । Image / scan to structured Markdown, complex layouts, tables, multi-page documents. ਉੱਤੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ। Free.ai GPUs ਉੱਤੇ ਸਵੈ-ਹੋਸਟ ਕੀਤਾ — ਤੁਹਾਡੀ ਰੋਜ਼ਾਨਾ ਟੋਕਨ ਪੁਲ (300 ਟੋਕਨ ਪ੍ਰਤੀ ਪੇਜ਼) ਦੇ ਖਿਲਾਫ ਮੁਫ਼ਤ ਚੱਲਦਾ ਹੈ। MIT ਅਧੀਨ ਜਾਰੀ — Free.ai ਉੱਤੇ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਮਨਜ਼ੂਰ ਹੈ।

API ਰਾਹੀਂ ਵਰਤੋਂ

OpenAI- ਅਨੁਕੂਲ REST API। ਇੱਕ ਕੁੰਜੀ ਬਣਾਓ ਅਤੇ ਇਸ ਮਾਡਲ ਨੂੰ ਸਕਿੰਟਾਂ ਵਿੱਚ ਕਾਲ ਕਰੋ।

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"unlimited-ocr","prompt":"your prompt here"}'
API ਡੌਕੂਮੈਂਟੇਸ਼ਨ API ਕੁੰਜੀ ਲਵੋ

ਇਸੇ ਤਰ੍ਹਾਂ ਦੇ ਮਾਡਲ

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

Unlimited-OCR 3B ਚਿੱਤਰਾਂ ਅਤੇ PDFs ਤੋਂ ਪਾਠ ਕੱਢਦਾ ਹੈ। ਸਕੈਨ ਪੇਜ਼, ਸਕਰੀਨ-ਸ਼ਾਟ ਜਾਂ ਡੌਕੂਮੈਂਟ ਦੀ ਫੋਟੋ ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ Unlimited-OCR 3B ਪਾਠ ਮੁੜ- ਪ੍ਰਾਪਤ ਕਰੇਗਾ - ਲਾਈਨ ਬਰੇਕ ਅਤੇ (ਯੋਗ ਇੰਜਣਾਂ ਉੱਤੇ) ਟੇਬਲ, ਫਾਰਮੂਲੇ ਅਤੇ ਢਾਂਚਾ ਸੰਭਾਲ ਕੇ।

Unlimited-OCR 3B ਕਈ ਸਕ੍ਰਿਪਟਾਂ ਨੂੰ ਹੈਂਡਲ ਕਰਦਾ ਹੈ - ਲੈਟਿਨ, ਕਰਿਲਿਕ, CJK, ਅਰਬੀ, ਦੇਵਨਾਗਰੀ ਅਤੇ ਹੋਰ । /ocr/ ਲੈਂਡਿੰਗ ਵਿੱਚ ਇੰਜਣ ਪ੍ਰਤੀ ਪੂਰੀ ਭਾਸ਼ਾ ਲਿਸਟ ਹੈ ।

ਸਾਫ਼ ਛਪਾਈ-ਸਟਾਈਲ ਹੱਥਲਿਖਤ ਲਈ ਹਾਂ; ਕਰਸੀਵ ਅਤੇ ਸ਼ੋਰਟਹੈਂਡ ਵਧੇਰੇ ਮੁਸ਼ਕਲ ਹਨ। TrOCR ਅਤੇ ਆਧੁਨਿਕ ਟਰਾਨਸਫਾਰਮਰ-ਅਧਾਰਿਤ ਇੰਜਣ ਹੱਥਲਿਖਤ ਲਈ ਪੁਰਾਣੇ ਟੈਸਸਰੈਕਟ ਨਾਲੋਂ ਕਾਫੀ ਵਧੀਆ ਹਨ।

ਲੇਆਉਟ-ਸੁਚੇਤ ਇੰਜਣ (GOT-OCR, Marker, Florence-2) Markdown/HTML ਟੇਬਲ ਅਤੇ ਫਾਰਮੂਲੇ ਲਈ LaTeX ਵਾਪਸ ਕਰਦੇ ਹਨ। ਸਾਦਾ-ਪਾਠ ਇੰਜਣ ਬਿਨਾਂ ਢਾਂਚੇ ਦੇ ਪਾਠ ਵਾਪਸ ਕਰਦੇ ਹਨ - ਇਸ ਮਾਡਲ ਦਾ ਆਉਟਪੁੱਟ ਮੋਡ ਚੈੱਕ ਕਰੋ।

Unlimited-OCR 3B ਤੁਹਾਡੀ ਰੋਜ਼ਾਨਾ ਮੁਫ਼ਤ ਪੁਲ ਤੋਂ ਸਾਡੇ GPUs ਉੱਤੇ ਚੱਲਦਾ ਹੈ; $5 → 200,000 ਭੁਗਤਾਨ ਟੋਕਨਾਂ ਬਾਅਦ. ~300 ਟੋਕਨਾਂ ਪ੍ਰਤੀ ਪੇਜ਼।

PNG, JPG, WebP, HEIC, BMP, ਅਤੇ ਇੱਕ ਅਤੇ ਕਈ ਪੇਜ਼ PDFs 50 MB ਤੱਕ। ਝੁਕੇ ਜਾਂ ਘੁੰਮਦੇ ਪੇਜ਼ ਐਕਸਟਰੈਕਟ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਆਟੋ-ਸੁਧਾਰੇ ਜਾਂਦੇ ਹਨ।

ਅੱਖਰ ਦੀ ਸਹੀਤਾ ਆਮ ਤੌਰ ਉੱਤੇ ਸਾਫ਼ ਛਪਾਈ ਪੇਜ਼ਾਂ ਉੱਤੇ >98% ਹੁੰਦੀ ਹੈ, ਘੱਟ-ਰੈਜ਼ੋਲੂਸ਼ਨ ਫੋਟੋਆਂ, ਗੰਭੀਰ ਰੂਪ ਨਾਲ ਝੁਕੇ ਸਕੈਨ ਜਾਂ ਅਸਾਧਾਰਨ ਫੋਂਟਾਂ ਉੱਤੇ ਡਿੱਗਦੀ ਹੈ। ਜਦੋਂ ਸਹੀਤਾ ਮਹੱਤਵਪੂਰਨ ਹੋਵੇ ਤਾਂ /ocr/compare/ ਉੱਤੇ ਇੰਜਣਾਂ ਦੀ ਤੁਲਨਾ ਕਰੋ।

ਹਾਂ — /batch/ ਚਿੱਤਰਾਂ/PDFs ਦਾ ਫੋਲਡਰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ। ਹਰੇਕ ਐਕਸਟਰੈਕਸ਼ਨ /account/?tab=history ਵਿੱਚ ਆ ਜਾਂਦਾ ਹੈ। ਫੋਲਡਰ-ਲੜੀ ਸੰਭਾਲਣ ਲਈ API ਵਰਤੋਂ।

ਹਾਂ — ਆਪਣੀ ਫਾਇਲ ਨੂੰ /v1/ocr/ ਨਾਲ POST ਕਰੋ ਜਿਸ ਦਾ ਮਾਡਲ ਹੈ "Unlimited-OCR 3B" । ਪਾਠ + (ਜਦੋਂ ਸਹਾਇਕ ਹੋਵੇ) ਲੇਆਉਟ + ਸ਼ਬਦ- ਪੱਧਰ ਦੇ ਸੀਮਿਤ ਬਕਸੇ ਨਾਲ JSON ਵਾਪਸ ਕਰੋ । /api/ ਵਿੱਚ ਪੂਰਾ ਹਵਾਲਾ ਹੈ ।

ਆਪਣਾ- ਹੋਸਟ ਮਾਡਲ ਤੁਹਾਡੀ ਫਾਇਲ ਨੂੰ ਸਾਡੇ GPU ਉੱਤੇ ਰੱਖਦਾ ਹੈ; ਪ੍ਰੀਮੀਅਮ ਇੱਕ DPA ਨਾਲ ਪਾਸ ਹੁੰਦਾ ਹੈ। ਸਾਂਝ- ਵਿੰਡੋ ਤੋਂ ਬਾਅਦ ਡੌਕੂਮੈਂਟ ਹਟਾਏ ਜਾਂਦੇ ਹਨ। ਅਸੀਂ ਤੁਹਾਡੀਆਂ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ।

ਹਾਂ — Free.ai ਐਕਸਟਰੈਕਟ ਕੀਤੇ ਪਾਠ ਦਾ ਵਪਾਰਕ ਵਰਤੋਂ ਦਿੰਦਾ ਹੈ । ਤੁਹਾਨੂੰ ਸਰੋਤ ਡੌਕੂਮੈਂਟ ਲਈ ਅਧਿਕਾਰ ਚਾਹੀਦੇ ਹਨ ।

ਪ੍ਰਤੀ ਸਫ਼ਾ ਆਮ ਤੌਰ ਉੱਤੇ 1-5 ਸਕਿੰਟ। ਲੇਆਉਟ-ਸੁਚੇਤ ਇੰਜਣ (ਟੇਬਲ, ਗਣਿਤ) ਲਈ ਵਧੇਰੇ ਸਮਾਂ ਲੱਗਦਾ ਹੈ। ਬਹੁ-ਪੰਨਾ PDFs ਲਗਭਗ ਰੇਖਿਕ ਸਕੇਲ ਕਰਦੇ ਹਨ।

Free.ai ਪਸੰਦ ਹੈ? ਆਪਣੇ ਦੋਸਤਾਂ ਨੂੰ ਦੱਸੋ!

ਇਹ ਪੇਜ਼ ਰੇਟਿੰਗ