PaddleOCR

Free.ai (self-hosted) · ocr · ~300 tokens per page

PaddleOCR es a Modelo OCR construido por PaddlePaddle. Más fuerte en Multi-language OCR, document layout extraction, receipts.. Auto-alojado en Free.ai GPUs — funciona gratis contra su piscina diaria de tokens (300 tokens por página). Liberado bajo Apache 2.0 — uso comercial permitido el Free.ai.

Uso a través de API

API REST compatible con OpenAI. Genera una clave y llama a este modelo en segundos.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr","prompt":"your prompt here"}'

Documentación API Obtener clave de API

Modelos similares

GOT-OCR v2

Examinar todos los modelos →

Preguntas frecuentes

PaddleOCR extrae texto de imágenes y PDFs. Sube una página escaneada, una captura de pantalla o una foto de un documento y PaddleOCR devuelve el texto — preservando saltos de línea y (en motores capaces) tablas, fórmulas y estructura.

PaddleOCR maneja docenas de scripts — latín, cirílico, CJK, árabe, devanagari, y más. El /ocr/ desembarco tiene la lista completa del idioma por motor.

Sí para la escritura impresa limpia; cursiva y taquigrafía son más difíciles. TrOCR y los motores modernos basados en transformadores son notablemente mejores que Tesseract legado en la escritura.

Motores de diseño (GOT-OCR, Marker, Florence-2) devuelven las tablas Markdown/HTML y LaTeX para las fórmulas. Motores de texto plano devuelven el texto sin estructura — compruebe el modo de salida de este modelo.

PaddleOCR se ejecuta en nuestras GPUs desde su piscina gratuita diaria; $5 → 200.000 tokens pagados después. ~300 tokens por página.

PNG, JPG, WebP, HEIC, BMP, más PDFs de una sola página y varias páginas de hasta 50 MB. Las páginas rotadas o atornilladas se corrigen automáticamente antes de la extracción.

La precisión de caracteres suele ser > 98% en páginas limpias impresas, cayendo en fotos de baja resolución, escaneos muy sesgados o fuentes inusuales. Compare los motores en /ocr/compare/ cuando la precisión importa.

Sí — /batch/ acepta una carpeta de imágenes/PDFs. Cada extracción aterriza en /account/?tab=history. Para la preservación de árbol de carpetas use la API.

Sí — POST su archivo a /v1/ocr/ con model="PaddleOCR". Devuelve JSON con texto + (cuando se admite) diseño + word-level delimiting boxes. /api/ tiene la referencia completa.

Los modelos auto hospedados mantienen su archivo en nuestras GPUs; pase premium con un DPA. Los documentos se eliminan después de la ventana compartida. No entrenamos en sus entradas.

Sí — Free.ai concede el uso comercial del texto extraído. Usted necesita derechos sobre el documento fuente.

Los motores de diseño (tablas, matemáticas) tardan más tiempo. Los PDFs de varias páginas se escalan aproximadamente linealmente.

PaddleOCR

Uso a través de API

Modelos similares

Preguntas frecuentes

¿Qué hace PaddleOCR?

¿Qué idiomas soportan PaddleOCR?

¿Puede PaddleOCR leer la escritura?

¿Conserva PaddleOCR la estructura de la tabla o las fórmulas matemáticas?

¿Cuánto cuesta PaddleOCR por página?

¿Qué formatos de entrada acepta PaddleOCR?

¿Qué tan preciso es PaddleOCR?

¿Puedo lotear OCR con PaddleOCR?

¿Hay una API para PaddleOCR?

¿Qué pasa con la privacidad cuando los documentos sensibles al OCR con PaddleOCR?

¿La salida PaddleOCR es segura para uso comercial?

¿Cuánto tiempo toma PaddleOCR?

Obtener 10.000 tokens gratis

Espere... ¡Obtenga 10 mil tokens gratis!

¿Quieres más?