PDF para Markdown

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever
Modelo:
+ GPT-5, Claude, Gemini
Deixe um PDF — IA converte-o em Markdown saboreado GitHub com cabeçalhos, parágrafos, listas, tabelas e blocos de código todos preservados. Powered by IBM Granite-Docling-258M (Apache 2.0). Mais rápido + mais inteligente do que extração de texto simples.

Deixe aqui um PDF ou clique para fazer upload

PDF até 50 MB. ~200 fichas por página.

Extraindo Markdown... ~5-10 seg/page
Opções avançadas
Resultado
Os tokens estão a ficar baixos. Obter mais tokens
Queres melhores resultados? Modelos premium (GPT-5 Ver Planos

❤️ Love this tool? Share it!

Inscreva-se para obter um link de referência e ganhar 25 mil fichas por amigo.

Queres mais? Inscreva-se gratuitamente para 30K tokens/dia + 10K bônus
Inscreva-se gratuitamente

Processando o seu pedido...

Converter qualquer PDF em Markdown limpo GitHub-sabored com cabeçalhos, tabelas, listas e blocos de código preservados. Powered by IBM Granite-Docling. Livre, ilimitado, sem inscrição.

Como Utilizar PDF para Markdown

1
Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

2
Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

3
Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF para Markdown tool on: ..."}]}'

PDF para Markdown — FAQ

Deixe em qualquer PDF e a IA converte-o em Markdown limpos GitHub-saboreado — cabeçalhos para permanecer em cabeçalhos, tabelas de permanência, listas de permanência, blocos de códigos ficam blocos de código. Vai muito além da extração de texto simples; a hierarquia estrutural do documento é preservada para que você possa soltar a saída diretamente para um site de documentos, um gasoduto LLM RAG, ou um índice de pesquisa.

IBM Granite-Docling-258M (Apache 2.0). Pequeno modelo de visão-a-sequencia afinado para a conversão de documentos de layout-aware — bate pdftotext + muito mais rápido + mais inteligente do que executar um modelo genérico de linguagem visual em cada página.

o pdftotext é um lixeiro plano — parágrafos e tabelas colapsa em uma parede de palavras. Adobe Export to Word preserva layout mas produz.docx + custos ~$15/mo. A doutrina preserva a estrutura SEMANTIC (níveis de cabeça, listas como listas, tabelas como tabelas Markdown) e produz um formato LLMs e ferramentas dev podem consumir tanto nativamente.

LlamaParse e não estruturados ambos têm níveis livres, mas capas páginas/mes e requerem uma chave API. O Docling-258M funciona localmente na nossa GPU + é totalmente auto-hosted Apache 2.0, sem medição por página, sem inscrição de chaves. Qualidade é competitiva com LlamaParse em documentos padrão.

Sim — tabelas voltam como tabelas de tubos Markdown apropriadas. Mesas complexas multi-coluna / ninhadas são aplanadas de forma mais agressiva (uma limitação fundamental Markdown, não a culpa do modelo). Para a fidelidade perfeita da tabela, também suportamos `format=html` através da API que preserva fileiraspan/colspan.

Granite-Docling faz o próprio passo do OCR — trabalha em PDFs digitalizados e digitalizados tanto. Escaneado em DPI inferior (<150) perde alguma precisão de texto; reescane em 200+ DPI para obter os melhores resultados.

A maioria das equações LaTeX-rendered passam como inline `$...$` Matemática Markdown. Para artigos de pesquisa com matemática pesada, também oferecemos PDF para Markdown acadêmica-papel-extrato (Nougat) que é especificamente sintonizada para equações e citações.

Cerca de 5-10 segundos por página em nosso H200. Um relatório de 30 páginas é ~3-5 minutos. Pequeno modelo significa lotes de pequenos PDFs são essencialmente livres na piscina diária.

200 fichas por página, com um piso de 500 toneladas. Um contrato de 5 páginas = 1.000 fichas. Um relatório de 30 páginas = 6.000 fichas. A piscina diária de 5K cobre o uso mais típico.

PDF — nascido-digital + digital ambos suportados. Máximo 50 MB upload. Outros formatos de documento (DOCX, EPUB, HTML, etc.) estão no roadmap; para agora upload-and-convert com PDF para Markdown pdf-conversion primeiro.

Processado imediatamente, a saída de Markdown é mantida (24h anônimo / 7d payed share-link caducidade), a fonte PDF é excluída logo após extração. Nunca usada para treinamento. /privacy/ para a política completa.

Sim — POST a multipart `file` to /v1/document/pdf-to-markdown /. Devolve {markdown_url, páginas, antevisão, fichas, share_url}. Bear auth (free-sk-...) dá 10K free tokens/mes. /api/ tem o exemplo do curl.

Inscreva-se gratuitamente para 30.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Love this tool? Share it!