Unlimited-OCR 3B

Free.ai (self-hosted) · ocr · ~300 tokens për page

Lëviz një file këtu ose kliko për të shfletuar

~300 tokens për page

Unlimited-OCR 3B është a Modeli OCR i ndërtuar nga Baidu. Më i forti në Image / scan to structured Markdown, complex layouts, tables, multi-page documents.. Vetë-pritur në Free.ai GPUs — funksionon pa pagesë kundër pool-it të token-it të përditshëm (300 tokens për faqe). Licensuar nën MIT — përdorimi komercial i lejuar në Free.ai.

Përdorimi nëpërmjet API

API REST e përshtatshme me OpenAI. Gjenerati një kyç dhe thirreni këtë model në sekonda.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"unlimited-ocr","prompt":"your prompt here"}'
Dokumentimi i API Merr kyçin e API

Pyetje të shpeshta

Unlimited-OCR 3B nxjerr tekst nga figurat dhe PDF-të. Ngarko një faqe të skanuar, një screenshot ose një fotografi të një dokumenti dhe Unlimited-OCR 3B kthen tekstin — duke ruajtur ndërprerjet e rreshtave dhe (në motorët e aftë) tabelat, formulat dhe strukturën.

Unlimited-OCR 3B trajton dhjetra shkrime — latine, cirilike, CJK, arabe, Devanagari, dhe më shumë. /ocr/ ka listën e plotë të gjuhëve për motor.

Po për shkrimin e dorës të stilit të pastër të shtypur; kursiv dhe shorthand janë më të vështira. TrOCR dhe motorët modernë të bazuar në transformator janë dukshëm më të mirë se Tesseract e trashëguar në shkrimin e dorës.

Motorët e njohur për formatet (GOT-OCR, Marker, Florence-2) kthejnë tabela Markdown/HTML dhe LaTeX për formulat. Motorët e thjeshtë të tekstit kthejnë tekst pa strukturë — kontrollo modalitetin e daljes të këtij modeli.

Unlimited-OCR 3B punon në GPU-të tona nga pool-i juaj i përditshëm i lirë; $5 → 200,000 token-ë të paguar pas. ~300 token-ë për faqe.

PNG, JPG, WebP, HEIC, BMP, plus PDF me një faqe dhe me shumë faqe deri në 50 MB. Faqet e rrotulluara ose të shtrembëruara korrigjohen automatikisht para nxjerrjes.

Saktësia e gërmave është zakonisht >98% në faqet e pastra të shtypura, duke rënë në fotografitë me rezolucion të ulët, skanimet e shtrembëruar ose gërmat e pazakonta. Krahaso motorët në /ocr/compare/ kur saktësia është e rëndësishme.

Po — /batch/ pranon një kartelë me figura/PDF. Çdo nxjerrje përfundon në /account/?tab=history. Për ruajtjen e degës së kartelave përdor API.

Po — POST file në /v1/ocr/ me model="Unlimited-OCR 3B". Kthen JSON me tekst + (kur të suportohet) strukturë + kuti kufizimi në nivel fjalësh. /api/ ka referencën e plotë.

Modelet e vetë-hostuar mbajnë file tuaj në GPU-të tona; premium kalojnë nëpërmjet me një DPA. Dokumentet eleminohen pas dritares së ndarjes. Ne nuk trajnojmë në input-in tuaj.

Po — Free.ai lejon përdorimin komercial të tekstit të nxjerrë. Duhet të keni të drejtat mbi dokumentin burimor.

1-5 sekonda për faqe. Motorët e njohur për formatet (tabella, matematika) marrin më shumë kohë. PDF-të me shumë faqe shkallezohen pothuajse linearisht.

Të pëlqen Free.ai?

Vlerësoni këtë faqe