PDF a Markdown

Uso comercial OK 380+ modelos Sin marca de agua No es necesario inscribirse
Modelo:
+ GPT-5, Claude, Gemini
Suelta un PDF — IA lo convierte en marcado limpio con sabor a GitHub con encabezados, párrafos, listas, tablas y bloques de código preservados. Desarrollado por IBM Granite-Docling-258M (Apache 2.0). Más rápido + más inteligente que la extracción de texto plano.

Suelta un PDF aquí o haz clic para cargar

PDF hasta 50 MB. ~200 tokens por página.

Extraer el diseño-consciente Markdown... ~5-10 seg/page
Opciones avanzadas
Resultado
Los tokens se están agotando. Obtener más tokens
¿Quieres mejores resultados? Modelos premium (GPT-5, Claude, Gemini) ofrecen una mayor calidad. Ver los planes

❤️ Love this tool? Share it!

Regístrate para obtener un enlace de referencia y ganar 25.000 tokens por amigo.

¿Quieres más? Regístrate gratis por 30K tokens/día + 10K bonus
Regístrate gratis

Procesando su solicitud...

Convierta cualquier PDF en marcado limpio con sabor a GitHub con encabezados, tablas, listas y bloques de código conservados. Desarrollado por IBM Granite-Docling. Libre, ilimitado, sin registro.

Cómo usar PDF a Markdown

1
Introduzca su entrada

Escriba texto, cargue un archivo o describa lo que desee. No necesita cuenta.

2
Haga clic en generar

Nuestra IA procesa su solicitud en segundos utilizando los mejores modelos de código abierto.

3
Descargar & compartir

Descarga, copia o comparte tu resultado. Gratis para uso personal y comercial.

Utilice esta herramienta a través de API

Automatice esta herramienta a partir de su propio código. Endpoint REST compatible con OpenAI, Auth Token de Portador, no requiere SDK adicional. Los costos de token coinciden con la interfaz web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF a Markdown tool on: ..."}]}'

PDF a Markdown — FAQ

Sumérgete en cualquier PDF y la IA lo convierte en Markdown limpio con sabor a GitHub — encabezados que permanecen encabezados, tablas que permanecen tablas, listas que permanecen listas, bloques de código que permanecen bloques de código. Va mucho más allá de la extracción de texto plano; la jerarquía estructural del documento se conserva para que puedas soltar la salida directamente en un sitio de documentos, una tubería de LLM RAG o un índice de búsqueda.

IBM Granite-Docling-258M (Apache 2.0). Modelo pequeño de visión a secuencia afinado para la conversión de documentos con conocimiento de diseño — supera pdftotext + mucho más rápido + más inteligente que ejecutar un modelo genérico de lenguaje de visión en cada página.

pdftotext es un volcado plano — párrafos y tablas colapsan en un muro de palabras. Adobe Export to Word preserva el diseño, pero produce.docx + costos ~ $15/mo. Docling preserva la estructura SEMANTIC (niveles de encabezado, listas como listas, tablas como tablas Markdown) y produce un formato LLMs y herramientas de dev pueden consumir ambos de forma nativa.

LlamaParse y no estructurado ambos tienen niveles libres, pero tapan páginas/mes y requieren una clave API. Docling-258M se ejecuta localmente en nuestra GPU + es completamente auto-anfitriona Apache 2.0, sin medición por página, sin registro de clave. La calidad es competitiva con LlamaParse en documentos estándar.

Sí — las tablas vuelven como tablas de tubos Markdown adecuadas. Las mesas multicolumnas / anidadas complejas se aplanan más agresivamente (una limitación de Markdown fundamental, no la falta del modelo). Para una perfecta fidelidad de la tabla, también soportamos `format=html` a través de la API que conserva rowspan/colspan.

Granite-Docling hace el propio paso OCR — trabaja en PDFs born-digital Y escaneados por igual. Escaneado en DPI inferior (<150) pierde algo de precisión de texto; volver a escanear en 200+ DPI para obtener los mejores resultados.

La mayoría de las ecuaciones de LaTeX vienen a través de la línea `$...$` Markdown matemáticas. Para trabajos de investigación con matemáticas pesadas, también ofrecemos PDF a Markdown académico-papel-extracto (Nougat) que está específicamente sintonizado para ecuaciones y citas.

Alrededor de 5-10 segundos por página en nuestro H200. Un informe de 30 páginas es ~3-5 minutos. Modelo pequeño significa que los lotes de pequeños PDF son esencialmente gratis en la piscina diaria.

200 tokens por página, con un piso de 500 tokens. Un contrato de 5 páginas = 1.000 tokens. Un informe de 30 páginas = 6.000 tokens. La piscina gratuita de 5K diario cubre el uso más típico.

PDF — born-digital + escaneado ambos soportados. Carga de máximo 50 MB. Otros formatos de documentos (DOCX, EPUB, HTML, etc.) están en la hoja de ruta; por ahora carga y convierte con PDF a Markdown pdf-conversión primero.

Procesado inmediatamente, la salida de Markdown se mantiene (24h anónimo / 7d pagado share-link expirar), el PDF fuente se elimina inmediatamente después de la extracción. Nunca se utiliza para el entrenamiento. /privacy/ para la política completa.

Sí — POST a multipart `file` a /v1/document/pdf-to-markdown/. Devuelve {markdown_url, páginas, vista previa, tokens, share_url}. Auth del portador (sk-free-...) da 10K tokens libres/mes. /api/ tiene el ejemplo curl.

Regístrate gratis por 30.000 tokens

Crear cuenta gratuita

No se requiere tarjeta de crédito

¿Cómo calificaría a esta herramienta?

Love this tool? Share it!