PDF a Markdown Extractor PDF PDF al texto Documento de investigación al texto Extractor PDF arXiv Más →

Extractor de papel académico

Uso comercial OK 380+ modelos Sin marca de agua No es necesario inscribirse

Suelta una preimpresión, un periódico o un capítulo de tesis de arXiv — IA lo convierte en texto limpio con sabor a LaTeX. Las ecuaciones matemáticas permanecen como ecuaciones, los diseños multicolumnas se desenrollan, las citas se conservan. Powered by Meta Nougat-base.

Sacar texto + ecuaciones de arXiv documentos, revistas y tesis. Las ecuaciones matemáticas se convierten a LaTeX, diseños multicolumna son sin heridas, citas se conservan. Powered by Meta Nougat. Free, no registration.

Cómo usar Extractor de papel académico

Introduzca su entrada

Escriba texto, cargue un archivo o describa lo que desee. No necesita cuenta.

Haga clic en generar

Nuestra IA procesa su solicitud en segundos utilizando los mejores modelos de código abierto.

Descargar & compartir

Descarga, copia o comparte tu resultado. Gratis para uso personal y comercial.

Utilice esta herramienta a través de API

Automatice esta herramienta a partir de su propio código. Endpoint REST compatible con OpenAI, Auth Token de Portador, no requiere SDK adicional. Los costos de token coinciden con la interfaz web.

Documentación API Obtener clave de API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Extractor de papel académico tool on: ..."}]}'

Herramientas de IA gratuitas relacionadas

PDF a Markdown

Extractor PDF

PDF al texto

Documento de investigación al texto

Extractor PDF arXiv

Extractor de papel académico — FAQ

Drop in any academic / research paper PDF — arXiv preprint, conference paper, journal article, these chapter — and the IA converts it into clean LaTeX-formatted text. Las ecuaciones matemáticas vienen a través de LaTeX apropiado, diseños multi-columna se desenrollan en orden de lectura, y citas + listas de referencia se conservan. Construido específicamente para el tipo de documentos científicos densos pdftotext mangles.

Meta's Nougat-base — un modelo de codificador-decodificador de visión entrenado en millones de páginas arXiv. Trata cada página PDF como una imagen y salidas estructuradas Markdown + LaTeX, por lo que las ecuaciones vienen correctamente incluso cuando se representan como glifos de raster en el PDF de origen.

Extractor de papel académico Docling (PDF to Markdown) utiliza IBM Granite-Docling — rápido, con conocimiento de diseño, optimizado para documentos de negocios generales como contratos, informes, manuales. Nougat es más lento pero FAR mejor en los documentos académicos porque fue entrenado específicamente en matemáticas + diseños científicos de múltiples columnas. Utilice Docling para documentos de negocios, Nougat para la investigación.

Sí — esa es la característica asesina. La matemática en línea vuelve como `$...$`, ecuaciones mostradas como `$...$$`. Puede leer tanto ecuaciones renderizadas LaTeX de presentaciones arXiv Y ecuaciones de raster escaneadas de documentos antiguos. Calidad es grado de publicación para la gran mayoría de los documentos.

Sí — Nougat desenrolla automáticamente los diseños de dos columnas / tres columnas en orden de lectura adecuado. No más texto saltando a media frase entre columnas. Las notas se extraen en bloques de notas al pie al final de cada sección.

Los marcadores de citación `[12]` / `(Smith 2020)` permanecen en línea. Las listas de referencia al final vienen preservadas con el formato intacto, para que pueda entubar la salida en Zotero / Mendeley / un analizador de citas personalizado.

Aproximadamente 8-15 segundos por página en nuestro H200. Un típico documento de conferencia de 10 páginas se ejecuta en ~2 minutos. Los documentos de encuesta largos (50+ páginas) toman 8-12 minutos — enviar y caminar lejos.

300 tokens por página (piso 600). Un documento de conferencia de 10 páginas = 3.000 tokens. Un capítulo de tesis de 30 páginas = 9.000 tokens. La piscina gratuita diaria cubre la mayoría de la lectura casual de la investigación.

Pipe it into ChatGPT/_Claude para la sumarización de papel, construir un RAG personal sobre un corpus de documentos, buscar semánticamente su propia biblioteca, copiar ecuaciones directamente en proyectos LaTeX, o simplemente leer el papel como texto plano en su teléfono.

Sí — Nougat hace su propio paso OCR. Las presentaciones arXiv de origen digital son las mejores (renderización de ecuaciones limpias); los documentos antiguos escaneados también funcionan, pero la fidelidad matemática cae un poco. Para obtener los mejores resultados matemáticos en los escaneos, vuelva a escanear en 300+ DPI antes de subir.

Procesado inmediatamente, la salida de texto de LaTeX se mantiene (24h anónima / 7d pago share-link expirar), el PDF fuente se elimina inmediatamente después de la extracción. Nunca se utiliza para el entrenamiento. /privacy/ para la política completa.

Sí — POST a multipart `file` a /v1/document/academic-pdf/. Devuelve {text_url, páginas, vista previa, tokens, share_url}. Auth del portador (sk-free-...) da 10K tokens libres/mes. /api/ tiene el ejemplo curl.

Regístrate gratis por 30.000 tokens

Crear cuenta gratuita

No se requiere tarjeta de crédito

¿Cómo calificaría a esta herramienta?

Extractor de papel académico

Resultado

Cómo usar Extractor de papel académico

Introduzca su entrada

Haga clic en generar

Descargar & compartir

Utilice esta herramienta a través de API

Herramientas de IA gratuitas relacionadas

Extractor de papel académico — FAQ

¿Qué es Extractor de papel académico?

¿Qué modelo lo impulsa?

¿Cómo es esto diferente de Extractor de papel académico PDF regular a Markdown?

¿Se encarga de ecuaciones matemáticas?

¿Diseños multicolumna?

¿Qué hay de las citas y referencias?

¿Qué tan rápido es?

¿Cuánto cuesta?

¿Qué puedo hacer con la salida?

¿Se admiten los papeles escaneados?

¿Se almacenan los PDFs cargados?

¿Hay una API?

Obtener 10.000 tokens gratis

Espere... ¡Obtenga 10 mil tokens gratis!

¿Quieres más?