Extractor de papel acadêmico

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever
Modelo:
+ GPT-5, Claude, Gemini
Deixe uma pré-impressão de arXiv, papel de revista ou capítulo de tese — IA converte-o em texto limpo com sabor LaTeX. Equações matemáticas permanecem como equações, layouts multi-columnas ficam desgastados, citações preservadas. Powered by Meta Nougat-base.

Deixe um papel de pesquisa PDF aqui ou clique para upload

PDF até 50 MB. ~300 fichas por página (math-aware).

Equações de leitura + colunas desenroladas... ~10 seg/page
Opções avançadas
Resultado
Os tokens estão a ficar baixos. Obter mais tokens
Queres melhores resultados? Modelos premium (GPT-5 Ver Planos

❤️ Love this tool? Share it!

Inscreva-se para obter um link de referência e ganhar 25 mil fichas por amigo.

Queres mais? Inscreva-se gratuitamente para 30K tokens/dia + 10K bônus
Inscreva-se gratuitamente

Processando o seu pedido...

Tire texto + equações fora de artigos de arXiv, periódicos e teses. Equações matemáticas são convertidos para LaTeX, layouts multi-columnas são desgastados, citações são preservadas. Powered by Meta Nougat. Gratuito, sem inscrição.

Como Utilizar Extractor de papel acadêmico

1
Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

2
Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

3
Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Extractor de papel acadêmico tool on: ..."}]}'

Extractor de papel acadêmico — FAQ

Lançar em qualquer papel acadêmico / pesquisa PDF — pré-impressão arXiv, papel de conferência, artigo de revista, capítulo de tese — e a IA converte-o em texto com formato LaTeX limpo. As equações matemáticas vêm através de layouts LaTeX apropriados, multi-columnas são desenroladas em ordem de leitura, e citações + listas de referência são preservadas. Construídas especificamente para o tipo de documentos científicos densos pdftotext mangles.

Meta's Nougat-base — um modelo vision-encoder-decoder treinado em milhões de páginas do arXiv. Trata cada página PDF como uma imagem e saídas estruturadas Markdown + LaTeX, por isso as equações vêm através corretamente mesmo quando são renderizadas como glifos raster no PDF fonte.

Extractor de papel acadêmico Docling (PDF to Markdown) usa IBM Granite-Docling — rápido, layout-aware, otimizado para documentos gerais de negócios como contratos, relatórios, manuais. Nougat é mais lento, mas FAR melhor em artigos acadêmicos porque foi especificamente treinado em layouts científicos multi-columnas. Use Docling para documentos de negócios, Nougat para pesquisa.

Sim — essa é a característica do assassino. Matemática inline retorna como `$...$`, equações exibidas como `$...$`. Pode ler ambas as equações LaTeX-rendered de submissões arXiv e equações raster escaneadas de artigos mais antigos. Qualidade é a classificação de publicação para a grande maioria de artigos.

Sim — Nougat desenrola layouts de duas colunas / três colunas em ordem de leitura adequada automaticamente. Não mais texto salto de média sentença entre colunas. Notas de rodapé são extraídos em blocos de rodapé no final de cada seção.

Marcadores de citação `[12]` / `(Smith 2020)` permanecer inline. Listas de referência no final vêm através de preservado com formatação intacta, para que você possa canalizar a saída para Zotero / Mendeley / um analisador de citação personalizado.

Cerca de 8-15 segundos por página em nosso H200. Um papel típico de 10 páginas de conferência é executado em ~2 minutos. Documentos de levantamento longos (50+ páginas) tomar 8-12 minutos — submeter e caminhar.

300 tokens por página (plano 600). Um papel de conferência de 10 páginas = 3.000 tokens. Um capítulo de tese de 30 páginas = 9.000 tokens. A piscina gratuita cobre a maioria casual pesquisa-reading.

Pipe-lo em ChatGPT/Claude para a summarização de papel, construir um RAG pessoal sobre um corpus de papéis, pesquisa semântica sua própria biblioteca, copiar equações diretamente em projetos LaTeX, ou apenas ler o papel como texto simples no seu telefone.

Sim — Nougat faz o seu próprio passo de OCR. As submissões de arXiv de Born-digital são as melhores (renderização de equações limpas); documentos mais antigos também funcionam, mas a fidelidade de matemática cai um pouco. Para os melhores resultados de matemática em exames, reescane em 300+ DPI antes de upload.

Processado imediatamente, a saída de texto LaTeX é mantida (24h anônimo / 7d payed share-link caducidade), a fonte PDF é excluída logo após extração. Nunca usada para treinamento. /privacy/ para a política completa.

Sim — POST a multipart `file` to /v1/document/academic-pdf /. Devolve {text_url, páginas, visualização, fichas, share_url}. Bear auth (sk-free-...) dá 10K free tokens/mes. /api/ tem o exemplo do curl.

Inscreva-se gratuitamente para 30.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Love this tool? Share it!