PaddleOCR

Free.ai (self-hosted) · ocr · ~300 tokens per page

Mete yon dosye isit la oswa klike pou gade

~300 tokens per page

PaddleOCR se a Modèl OCR ki te bati pa PaddlePaddle. Li se pi gwo vil la nan Multi-language OCR, document layout extraction, receipts.. Self-hosted sou Free.ai GPUs — kouri gratis kont chak jou ou a token pool (300 tokens pou chak paj). Li libere anba lisans Apache 2.0 — itilize komèsyal pèmèt sou Free.ai.

Itilize via API

API REST ki konpatib ak OpenAI. Pwodui yon kle epi rele modèl sa a nan kèk segond.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr","prompt":"your prompt here"}'
Dokimantasyon API Obtenn kle API

Kesyon ki poze souvan

PaddleOCR ekstraye tèks soti nan imaj ak PDF. Upload yon paj skan, yon ekran, oswa yon foto nan yon dokiman ak PaddleOCR retounen tèks la — anpeche ranje ak (sou motè ki kapab) tab, fòmil, ak estrikti.

PaddleOCR ka sèvi ak dè dizèn de lang — Latin, Sirilik, CJK, Arab, Devanagari, ak plis ankò. /ocr/ gen lis lang ki disponib pou chak motè.

Wi pou ekri an lèt detache style-imprime pwòp; italyen ak shorthand yo pi difisil. TrOCR ak motè modèn ki baze sou transformateur yo se byen pi bon pase Tesseract legacy sou ekri an lèt detache.

Motè ki konnen ki jan paj la ap parèt (GOT-OCR, Marker, Florence-2) retounen tab Markdown/HTML ak LaTeX pou fòmil. Motè tèks senp yo retounen tèks san estriktirasyon — tcheke mòd retounen sa a.

PaddleOCR kouri sou GPUs nou yo soti nan pisin gratis ou chak jou; $ 5 → 200,000 jeton peye apre. ~ 300 jeton pou chak paj.

PNG, JPG, WebP, HEIC, BMP, plis PDFs yon sèl ak plizyè paj jiska 50 MB. Paj ki parèt parèt oswa ki parèt parèt yo kòrèkteman kòrèkteman anvan yo ekstraksyon.

Presizyon karaktè se jeneralman >98% sou paj ki ekri byen, ki tonbe sou foto ki gen yon rezolisyon ki ba, sou skan ki gen yon gwo deformation, oswa sou font ki pa nòmal.

Wi — /batch/ aksepte yon dosye imaj/PDF. Chak ekstraksyon fini nan /kont/?tab=istwa. Pou konsèvasyon arbr-dosye, itilize API a.

Wi — POST dosye ou nan /v1/ocr/ ak model="PaddleOCR". Retounen JSON ak tèks + (si li sipòte) aranjman + bokit limit nivo mo. /api/ gen referans konplè.

Self-hosted modèl kenbe dosye ou sou GPUs nou yo; premium pase pa yon DPA. Dokiman yo se efase apre fenèt pataje. Nou pa antrene sou enputs ou.

Wi — Free.ai bay dwa pou itilize tèks ekstraksyon an pou rezon komèsyal. Ou bezwen dwa pou dokiman an sous.

1-5 segonn pou chak paj anjeneral. Motè ki gen rapò ak plan (tab, matematik) pran plis tan. PDF ki gen plis pase yon paj ap grandi an gwosè linètman.

Love Free.ai? Di zanmi ou yo!

Ranje paj sa a