PaddleOCR

Free.ai (self-hosted) · ocr · ~300 token per page

PaddleOCR è a Modello OCR built by PaddlePaddle. Il piu' forte degli Multi-language OCR, document layout extraction, receipts.. Self-hosted on Free.ai GPU Il token è libero contro il tuo token pool giornaliero (300 tokens per pagina). Rilasciata sotto licenza Apache 2.0 per uso commerciale consentito su Free.ai.

Utilizzare tramite API

API OpenAI-compatibile REST. Generare una chiave e chiamare questo modello in pochi secondi.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr","prompt":"your prompt here"}'

Documentazione API Ottieni la chiave API

Modelli simili

GOT-OCR v2

Sfoglia tutti i modelli →

Domande frequenti

PaddleOCR estrae testo da immagini e PDF. Carica una pagina scannerizzata, uno screenshot, o una foto di un documento e PaddleOCR restituisce il testo che preserva le interruzioni di riga e (su motori capaci) tabelle, formule e struttura.

PaddleOCR gestisce dozzine di script Latino, Cirillico, CJK, Arabo, Devanagari, e altro ancora. L'atterraggio /ocr/ ha l'elenco completo delle lingue per motore.

Sì per la calligrafia in stile stampato pulito; corsivo e shorthand sono più difficili. TrOCR e i moderni motori a base di trasformatori sono notevolmente meglio di Tesseract legacy sulla calligrafia.

Motori layout-aware (GOT-OCR, Marker, Florence-2) restituisce le tabelle Markdown/HTML e LaTeX per le formule. I motori a testo semplice restituisce il testo senza struttura Controllare la modalità di uscita di questo modello.

PaddleOCR viene eseguito sulle nostre GPU dalla vostra piscina gratuita quotidiana; $5 → 200.000 gettoni pagati dopo. ~300 gettoni per pagina.

PNG, JPG, WebP, HEIC, BMP, più PDF a una pagina e più pagine fino a 50 MB. Le pagine sculacciate o ruotate sono corrette automaticamente prima dell'estrazione.

L'accuratezza dei caratteri è tipicamente >98% su pagine stampate pulite, che cadono su foto a basso valore, scansioni severamente inesigibili o caratteri insoliti. Confronta i motori su /ocr/compare/ quando l'accuratezza conta.

Sì /batch/ accetta una cartella di immagini/PDF. Ogni estrazione si trova in /account/?tab=history. Per la conservazione di cartelle-albero utilizzare l'API.

Sì POST il tuo file in /v1/ocr/ con model="PaddleOCR." Restituisce JSON con testo + (quando supportato) layout + word-level bounding boxes. /api/ ha il riferimento completo.

I modelli auto-ospitati mantengono il vostro file sulle nostre GPU; il premio passa attraverso con un DPA. I documenti vengono cancellati dopo la share-window. Noi non ci alleniamo sui vostri input.

Sì. Free.ai concede l'uso commerciale del testo estratto. È necessario il diritto al documento di origine.

Solitamente per ogni pagina ci vogliono più tempo. I PDF multi-pagina scalano approssimativamente in modo lineare.

PaddleOCR

Utilizzare tramite API

Modelli simili

Domande frequenti

Che cosa fa PaddleOCR?

Quali lingue supportano PaddleOCR?

Puoi leggere la calligrafia?

PaddleOCR conserva la struttura della tabella o le formule matematiche?

Quanto costa PaddleOCR per pagina?

Quali formati di input accetta PaddleOCR?

Quanto è preciso il nome?

Posso batchare OCR con PaddleOCR?

C'è un'API per PaddleOCR?

E la privacy quando I OCR documenti sensibili con PaddleOCR?

L'uscita PaddleOCR è sicura per uso commerciale?

Quanto tempo ci vuole?

Ottieni 10.000 Token gratuiti

Aspetta. Ottieni 10K Token gratis!

Ne vuoi ancora?