Extractor de papel académico

Uso comercial OK 380+ modelos Sin marca de agua No es necesario inscribirse
Modelo:
+ GPT-5, Claude, Gemini
Suelta una preimpresión, un periódico o un capítulo de tesis de arXiv — IA lo convierte en texto limpio con sabor a LaTeX. Las ecuaciones matemáticas permanecen como ecuaciones, los diseños multicolumnas se desenrollan, las citas se conservan. Powered by Meta Nougat-base.

Deje un PDF de investigación aquí o haga clic para cargar

PDF hasta 50 MB. ~300 tokens por página (math-aware).

Leyendo ecuaciones + desenrollando columnas... ~10 seg/page
Opciones avanzadas
Resultado
Los tokens se están agotando. Obtener más tokens
¿Quieres mejores resultados? Modelos premium (GPT-5, Claude, Gemini) ofrecen una mayor calidad. Ver los planes

❤️ Love this tool? Share it!

Regístrate para obtener un enlace de referencia y ganar 25.000 tokens por amigo.

¿Quieres más? Regístrate gratis por 30K tokens/día + 10K bonus
Regístrate gratis

Procesando su solicitud...

Sacar texto + ecuaciones de arXiv documentos, revistas y tesis. Las ecuaciones matemáticas se convierten a LaTeX, diseños multicolumna son sin heridas, citas se conservan. Powered by Meta Nougat. Free, no registration.

Cómo usar Extractor de papel académico

1
Introduzca su entrada

Escriba texto, cargue un archivo o describa lo que desee. No necesita cuenta.

2
Haga clic en generar

Nuestra IA procesa su solicitud en segundos utilizando los mejores modelos de código abierto.

3
Descargar & compartir

Descarga, copia o comparte tu resultado. Gratis para uso personal y comercial.

Utilice esta herramienta a través de API

Automatice esta herramienta a partir de su propio código. Endpoint REST compatible con OpenAI, Auth Token de Portador, no requiere SDK adicional. Los costos de token coinciden con la interfaz web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Extractor de papel académico tool on: ..."}]}'

Extractor de papel académico — FAQ

Drop in any academic / research paper PDF — arXiv preprint, conference paper, journal article, these chapter — and the IA converts it into clean LaTeX-formatted text. Las ecuaciones matemáticas vienen a través de LaTeX apropiado, diseños multi-columna se desenrollan en orden de lectura, y citas + listas de referencia se conservan. Construido específicamente para el tipo de documentos científicos densos pdftotext mangles.

Meta's Nougat-base — un modelo de codificador-decodificador de visión entrenado en millones de páginas arXiv. Trata cada página PDF como una imagen y salidas estructuradas Markdown + LaTeX, por lo que las ecuaciones vienen correctamente incluso cuando se representan como glifos de raster en el PDF de origen.

Extractor de papel académico Docling (PDF to Markdown) utiliza IBM Granite-Docling — rápido, con conocimiento de diseño, optimizado para documentos de negocios generales como contratos, informes, manuales. Nougat es más lento pero FAR mejor en los documentos académicos porque fue entrenado específicamente en matemáticas + diseños científicos de múltiples columnas. Utilice Docling para documentos de negocios, Nougat para la investigación.

Sí — esa es la característica asesina. La matemática en línea vuelve como `$...$`, ecuaciones mostradas como `$...$$`. Puede leer tanto ecuaciones renderizadas LaTeX de presentaciones arXiv Y ecuaciones de raster escaneadas de documentos antiguos. Calidad es grado de publicación para la gran mayoría de los documentos.

Sí — Nougat desenrolla automáticamente los diseños de dos columnas / tres columnas en orden de lectura adecuado. No más texto saltando a media frase entre columnas. Las notas se extraen en bloques de notas al pie al final de cada sección.

Los marcadores de citación `[12]` / `(Smith 2020)` permanecen en línea. Las listas de referencia al final vienen preservadas con el formato intacto, para que pueda entubar la salida en Zotero / Mendeley / un analizador de citas personalizado.

Aproximadamente 8-15 segundos por página en nuestro H200. Un típico documento de conferencia de 10 páginas se ejecuta en ~2 minutos. Los documentos de encuesta largos (50+ páginas) toman 8-12 minutos — enviar y caminar lejos.

300 tokens por página (piso 600). Un documento de conferencia de 10 páginas = 3.000 tokens. Un capítulo de tesis de 30 páginas = 9.000 tokens. La piscina gratuita diaria cubre la mayoría de la lectura casual de la investigación.

Pipe it into ChatGPT/_Claude para la sumarización de papel, construir un RAG personal sobre un corpus de documentos, buscar semánticamente su propia biblioteca, copiar ecuaciones directamente en proyectos LaTeX, o simplemente leer el papel como texto plano en su teléfono.

Sí — Nougat hace su propio paso OCR. Las presentaciones arXiv de origen digital son las mejores (renderización de ecuaciones limpias); los documentos antiguos escaneados también funcionan, pero la fidelidad matemática cae un poco. Para obtener los mejores resultados matemáticos en los escaneos, vuelva a escanear en 300+ DPI antes de subir.

Procesado inmediatamente, la salida de texto de LaTeX se mantiene (24h anónima / 7d pago share-link expirar), el PDF fuente se elimina inmediatamente después de la extracción. Nunca se utiliza para el entrenamiento. /privacy/ para la política completa.

Sí — POST a multipart `file` a /v1/document/academic-pdf/. Devuelve {text_url, páginas, vista previa, tokens, share_url}. Auth del portador (sk-free-...) da 10K tokens libres/mes. /api/ tiene el ejemplo curl.

Regístrate gratis por 30.000 tokens

Crear cuenta gratuita

No se requiere tarjeta de crédito

¿Cómo calificaría a esta herramienta?

Love this tool? Share it!