PaddleOCR

Free.ai (self-hosted) · ocr · ~300 tokens per page

Suelta un archivo aquí o haz clic para navegar

~300 tokens per page

PaddleOCR es a Modelo OCR construido por PaddlePaddle. Más fuerte en Multi-language OCR, document layout extraction, receipts.. Auto-alojado en Free.ai GPUs — funciona gratis contra su piscina diaria de tokens (300 tokens por página). Liberado bajo Apache 2.0 — uso comercial permitido el Free.ai.

Uso a través de API

API REST compatible con OpenAI. Genera una clave y llama a este modelo en segundos.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr","prompt":"your prompt here"}'
Documentación API Obtener clave de API

Preguntas frecuentes

PaddleOCR extrae texto de imágenes y PDFs. Sube una página escaneada, una captura de pantalla o una foto de un documento y PaddleOCR devuelve el texto — preservando saltos de línea y (en motores capaces) tablas, fórmulas y estructura.

PaddleOCR maneja docenas de scripts — latín, cirílico, CJK, árabe, devanagari, y más. El /ocr/ desembarco tiene la lista completa del idioma por motor.

Sí para la escritura impresa limpia; cursiva y taquigrafía son más difíciles. TrOCR y los motores modernos basados en transformadores son notablemente mejores que Tesseract legado en la escritura.

Motores de diseño (GOT-OCR, Marker, Florence-2) devuelven las tablas Markdown/HTML y LaTeX para las fórmulas. Motores de texto plano devuelven el texto sin estructura — compruebe el modo de salida de este modelo.

PaddleOCR se ejecuta en nuestras GPUs desde su piscina gratuita diaria; $5 → 200.000 tokens pagados después. ~300 tokens por página.

PNG, JPG, WebP, HEIC, BMP, más PDFs de una sola página y varias páginas de hasta 50 MB. Las páginas rotadas o atornilladas se corrigen automáticamente antes de la extracción.

La precisión de caracteres suele ser > 98% en páginas limpias impresas, cayendo en fotos de baja resolución, escaneos muy sesgados o fuentes inusuales. Compare los motores en /ocr/compare/ cuando la precisión importa.

Sí — /batch/ acepta una carpeta de imágenes/PDFs. Cada extracción aterriza en /account/?tab=history. Para la preservación de árbol de carpetas use la API.

Sí — POST su archivo a /v1/ocr/ con model="PaddleOCR". Devuelve JSON con texto + (cuando se admite) diseño + word-level delimiting boxes. /api/ tiene la referencia completa.

Los modelos auto hospedados mantienen su archivo en nuestras GPUs; pase premium con un DPA. Los documentos se eliminan después de la ventana compartida. No entrenamos en sus entradas.

Sí — Free.ai concede el uso comercial del texto extraído. Usted necesita derechos sobre el documento fuente.

Los motores de diseño (tablas, matemáticas) tardan más tiempo. Los PDFs de varias páginas se escalan aproximadamente linealmente.

Love this tool? Share it!

Calificar esta página