Extractor de PDF PDF a texto Extractor de documentos académicos Documento de investigación a texto Extractor de PDF de arXiv Máis →

PDF a Markdown

Q: Como xestiona as matemáticas/ ecuacións?

A maioría das ecuacións deseñadas en LaTeX veñen como « $... $ » matemáticas Markdown en liña. Para artigos de investigación con matemáticas pesadas, tamén ofrecemos a ferramenta academic- paper- extract (Nougat) que está sintonizada especificamente para ecuacións e citas.

Q: Que tan rápido vai?

Cerca de 5- 10 segundos por páxina no noso H200. Un informe de 30 páxinas leva ~3- 5 minutos. O modelo minúsculo significa que os lotes de PDFs pequenos son esencialmente libres no banco diario.

Q: Canto custa?

200 tokens por páxina, cun límite de 500 tokens. Un contrato de 5 páxinas = 1. 000 tokens. Un informe de 30 páxinas = 6. 000 tokens. O grupo de 5K diarios libres cobre o uso máis típico.

Q: Que formatos de entrada?

PDF: admiten ambos os formatos, nacido dixital e escaneado. Máximo de 50 MB de envío. Outros formatos de documento (DOCX, EPUB, HTML, etc.) están no mapa; por agora envíe e converta primeiro coa ferramenta de conversión de pdf.

Uso comercial aceptado Máis de 380 modelos Sen marca de auga Non é preciso rexistrarse

Deixar un PDF — A IA convérteo en Markdown limpo con sabor a GitHub, con cabeceiras, parágrafos, listas, táboas e bloques de código preservados. Xestionado por IBM Granite- Docling- 258M (Apache 2. 0). Máis rápido e intelixente que a extracción de texto simple.

Converta calquera PDF en Markdown limpo con sabor a GitHub, con cabeceiras, táboas, listas e bloques de código preservados. Xestionado por IBM Granite-Docling. Gratuito, ilimitado, sen rexistro.

Como usar PDF a Markdown

Introduza a súa entrada

Escriba texto, envíe un ficheiro ou describa o que queira. Non se precisa conta.

Prema para xerar

A nosa IA procesa a túa solicitude en segundos empregando os mellores modelos de código aberto.

Obter e compartir

Obteña, copie ou comparta o seu resultado. Gratuito para uso persoal e comercial.

Empregar esta ferramenta mediante API

Automatice esta ferramenta a partir do seu propio código. Punto final REST compatíbel con OpenAI, autenticación por token de portador, non se require SDK adicional. Os custos dos tokens son iguais aos da interface web.

Documentación da API Obter a chave da API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF a Markdown tool on: ..."}]}'

Ferramentas libres de IA relacionadas

Extractor de PDF

PDF a texto

Extractor de documentos académicos

Documento de investigación a texto

Extractor de PDF de arXiv

PDF a Markdown — FAQ

Solte calquera PDF e a IA convérteo en Markdown puro con sabor a GitHub: os títulos permanecen títulos, as táboas permanecen táboas, as listas permanecen listas, os bloques de código permanecen bloques de código. Vai moito máis alá da extracción de texto simple; presérvase a xerarquía estrutural do documento para que poida soltar a saída directamente nun sitio de documentación, un canal LLM RAG ou un índice de procuras.

IBM Granite- Docling- 258M (Apache 2. 0). Modelo de visión a secuencia diminuto afinado para a conversión de documentos con coñecemento de disposición — supera a pdftotext + é moito máis rápido + intelixente que executar un modelo de linguaxe de visión xenérico en cada páxina.

pdftotext é un volcado plano: os parágrafos e táboas colócanse nunha parede de palabras. Adobe Export to Word preserva a disposición pero produce. docx + custa ~$15/ mes. Docling preserva a estrutura SEMÁNTICA (niveis de títulos, listas como listas, táboas como táboas Markdown) e produce un formato que as ferramentas de LLM e de desenvolvemento poden consumir nativamente.

Llama Parse e unstructured teñen niveis gratuítos pero limitan o número de páxinas/ mes e requiren unha chave API. Docling- 258M executase localmente na nosa GPU + é un Apache 2. 0 totalmente auto- aloxado, sen contabilidade por páxina, sen rexistro de chave. A calidade é competitiva con Llama Parse en documentos estándar.

Si, as táboas devólvense como táboas de canalización Markdown propias. As táboas complexas de varias columnas/ anidadas son achatadas de xeito máis agresivo (unha limitación fundamental de Markdown, non a culpa do modelo). Para unha fidelidade perfecta da táboa, tamén admitimos « format=html » a través da API que preserva rowspan/ colspan.

Granite- Docling fai o paso OCR por si mesmo — funciona tanto en PDF dixitais como dixitalizados. Digitalizados a PPP baixos (< 150) perden algo da precisión do texto; dixitalice de novo a 200+ PPP para obter os mellores resultados.

A maioría das ecuacións deseñadas en LaTeX veñen como « $... $ » matemáticas Markdown en liña. Para artigos de investigación con matemáticas pesadas, tamén ofrecemos a ferramenta academic- paper- extract (Nougat) que está sintonizada especificamente para ecuacións e citas.

Cerca de 5- 10 segundos por páxina no noso H200. Un informe de 30 páxinas leva ~3- 5 minutos. O modelo minúsculo significa que os lotes de PDFs pequenos son esencialmente libres no banco diario.

200 tokens por páxina, cun límite de 500 tokens. Un contrato de 5 páxinas = 1. 000 tokens. Un informe de 30 páxinas = 6. 000 tokens. O grupo de 5K diarios libres cobre o uso máis típico.

PDF: admiten ambos os formatos, nacido dixital e escaneado. Máximo de 50 MB de envío. Outros formatos de documento (DOCX, EPUB, HTML, etc.) están no mapa; por agora envíe e converta primeiro coa ferramenta de conversión de pdf.

Procesado inmediatamente, a saída de Markdown consérvase (24h anónimo / 7d caducidade da ligazón compartida pagada), o PDF de orixe é borrado inmediatamente despois da extracción. Nunca se usa para adestramento. / privacy / para a política completa.

Si — POST un « ficheiro » multiparte a / v1/ documento/ pdf- to- markdown /. Devolve {markdown_ url, páxinas, vista previa, tokens, share_ url}. A autenticación de portador (sk- free-…) dá 10K tokens libres/ mes. / api / ten o exemplo curl.

Inscríbete gratis para obter 30.000 tokens

Crear unha conta libre

Non se require tarxeta de crédito

Como valora esta ferramenta?

PDF a Markdown

Resultado

Como usar PDF a Markdown

Introduza a súa entrada

Prema para xerar

Obter e compartir

Empregar esta ferramenta mediante API

Ferramentas libres de IA relacionadas

PDF a Markdown — FAQ

Que é IA PDF a Markdown?

Que modelo o alimenta?

En que difire da exportación de pdftotext / Adobe?

Como se compara con LlamaParse / unstructured.io?

Manexa mesas?

E que hai dos PDF dixitalizados (imaxes)?

Como xestiona as matemáticas/ ecuacións?

Que tan rápido vai?

Canto custa?

Que formatos de entrada?

Gardar os PDF enviados?

Hai unha API?

Obteña 10. 000 fichas gratuítas

Agarde — Obteña 10K tokens gratuítos!

Queres máis?