PaddleOCR

Free.ai (self-hosted) · ocr · ~300 token per page

Lasciare un file qui o fare clic per navigare

~300 token per page

PaddleOCR è a Modello OCR built by PaddlePaddle. Il piu' forte degli Multi-language OCR, document layout extraction, receipts.. Self-hosted on Free.ai GPU Il token è libero contro il tuo token pool giornaliero (300 tokens per pagina). Rilasciata sotto licenza Apache 2.0 per uso commerciale consentito su Free.ai.

Utilizzare tramite API

API OpenAI-compatibile REST. Generare una chiave e chiamare questo modello in pochi secondi.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr","prompt":"your prompt here"}'
Documentazione API Ottieni la chiave API

Domande frequenti

PaddleOCR estrae testo da immagini e PDF. Carica una pagina scannerizzata, uno screenshot, o una foto di un documento e PaddleOCR restituisce il testo che preserva le interruzioni di riga e (su motori capaci) tabelle, formule e struttura.

PaddleOCR gestisce dozzine di script Latino, Cirillico, CJK, Arabo, Devanagari, e altro ancora. L'atterraggio /ocr/ ha l'elenco completo delle lingue per motore.

Sì per la calligrafia in stile stampato pulito; corsivo e shorthand sono più difficili. TrOCR e i moderni motori a base di trasformatori sono notevolmente meglio di Tesseract legacy sulla calligrafia.

Motori layout-aware (GOT-OCR, Marker, Florence-2) restituisce le tabelle Markdown/HTML e LaTeX per le formule. I motori a testo semplice restituisce il testo senza struttura Controllare la modalità di uscita di questo modello.

PaddleOCR viene eseguito sulle nostre GPU dalla vostra piscina gratuita quotidiana; $5 → 200.000 gettoni pagati dopo. ~300 gettoni per pagina.

PNG, JPG, WebP, HEIC, BMP, più PDF a una pagina e più pagine fino a 50 MB. Le pagine sculacciate o ruotate sono corrette automaticamente prima dell'estrazione.

L'accuratezza dei caratteri è tipicamente >98% su pagine stampate pulite, che cadono su foto a basso valore, scansioni severamente inesigibili o caratteri insoliti. Confronta i motori su /ocr/compare/ quando l'accuratezza conta.

Sì /batch/ accetta una cartella di immagini/PDF. Ogni estrazione si trova in /account/?tab=history. Per la conservazione di cartelle-albero utilizzare l'API.

Sì POST il tuo file in /v1/ocr/ con model="PaddleOCR." Restituisce JSON con testo + (quando supportato) layout + word-level bounding boxes. /api/ ha il riferimento completo.

I modelli auto-ospitati mantengono il vostro file sulle nostre GPU; il premio passa attraverso con un DPA. I documenti vengono cancellati dopo la share-window. Noi non ci alleniamo sui vostri input.

Sì. Free.ai concede l'uso commerciale del testo estratto. È necessario il diritto al documento di origine.

Solitamente per ogni pagina ci vogliono più tempo. I PDF multi-pagina scalano approssimativamente in modo lineare.

Love this tool? Share it!

Valuta questa pagina