PDF à balisage

Utilisation commerciale OK 380+ modèles Pas de filigrane Pas besoin d'inscription
Modèle:
+ GPT-5, Claude, Gemini
Déposer un PDF — L'IA le convertit en GitHub propre avec des rubriques, des paragraphes, des listes, des tableaux et des blocs de code conservés. Propulsé par IBM Granite-Docling-258M (Apache 2.0). Plus rapide + plus intelligent que l'extraction de texte simple.

Déposer un PDF ici ou cliquer pour télécharger

PDF jusqu'à 50 Mo. ~200 jetons par page.

Extraire le marquage de mise en page... ~5-10 sec/page
Options avancées
Résultat
Les jetons sont bas. Obtenez plus de jetons
Vous voulez de meilleurs résultats? Modèles premium (GPT-5, Claude, Gemini) offrent une qualité supérieure. Afficher les plans

❤️ Love this tool? Share it!

Inscrivez-vous pour obtenir un lien de référence et gagner 25 000 jetons par ami.

Tu en veux plus? Inscrivez-vous gratuitement pour 30K jetons/jour + 10K bonus
Inscription gratuite

Traitement de votre demande...

Convertissez n'importe quel PDF en Markdown propre avec des en-têtes, des tables, des listes et des blocs de code conservés. Propulsé par IBM Granite-Doling. Gratuit, illimité, sans inscription.

Comment utiliser PDF à balisage

1
Saisissez votre entrée

Tapez du texte, téléchargez un fichier ou décrivez ce que vous voulez. Aucun compte n'est nécessaire.

2
Cliquez sur générer

Notre IA traite votre demande en quelques secondes à l'aide des meilleurs modèles open-source.

3
Télécharger et partager

Téléchargez, copiez ou partagez votre résultat. Gratuit pour un usage personnel et commercial.

Utilisez cet outil via l'API

Automatisez cet outil à partir de votre propre code. Endpoint REST compatible OpenAI, Auth-token auth, pas de SDK supplémentaire requis.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF à balisage tool on: ..."}]}'

PDF à balisage — FAQ

Déposer dans n'importe quel PDF et l'IA le convertit en propre GitHub-flavored Markdown — les titres restent en vedette, les tables restent en table, les listes de séjour, les blocs de code restent des blocs de code. Aller bien au-delà de l'extraction de texte simple; la hiérarchie structurelle du document est préservée afin que vous puissiez déposer la sortie directement dans un site docs, un pipeline LLM RAG, ou un index de recherche.

IBM Granite-Docling-258M (Apache 2.0). Petit modèle vision-à-séquence affiné pour la mise en page-conversion de documentware — beats pdftotext + beaucoup plus rapide + plus intelligent que l'exécution d'un modèle générique vision-langue sur chaque page.

Adobe Export to Word conserve la mise en page mais produit.docx + coûts ~15/mo. Docling préserve la structure SEMANTIC (niveaux de tête, listes comme listes, tableaux comme tables Markdown) et produit un format LLMs et des outils de dev peuvent tous deux consommer nativement.

LlamaParse et non structuré ont tous deux des niveaux libres mais des pages de plafond/mois et nécessitent une clé API. Docling-258M fonctionne localement sur notre GPU + est entièrement auto-organisé Apache 2.0, pas de mesure par page, pas d'inscription de clé. La qualité est compétitive avec LlamaParse sur les documents standard.

Oui — les tables reviennent comme des tables de pipe Markdown appropriées. Les tables multi-colonnes / imbriquées complexes sont aplaties plus agressivement (une limitation fondamentale Markdown, pas la faute du modèle). Pour une fidélité parfaite de la table, nous prenons également en charge `format=html` via l'API qui préserve rowspan/colspan.

Granite-Doling fait le pas lui-même de l'OCR — fonctionne sur les PDF nacré-numérique ET scanné aussi bien. Scanné à DPI inférieur (<150) perd une certaine précision de texte; rescan à 200+ DPI pour les meilleurs résultats.

La plupart des équations rendues par LaTeX viennent à travers comme en ligne `$...$` Markdown maths. Pour les documents de recherche avec maths lourds, nous offrons également PDF à balisage académique-papier-extrait (Nougat) qui est spécialement accordé pour les équations et les citations.

Environ 5-10 secondes par page sur notre H200. Un rapport de 30 pages est ~3-5 minutes. Petit modèle signifie des lots de petits PDF sont essentiellement gratuits dans la piscine quotidienne.

200 jetons par page, avec un plancher de 500 jetons. Un contrat de 5 pages = 1.000 jetons. Un rapport de 30 pages = 6.000 jetons. La piscine 5K quotidienne gratuite couvre l'utilisation la plus typique.

D'autres formats de documents (DOCX, EPUB, HTML, etc.) sont sur la feuille de route; pour le moment, télécharger-et-convertir avec PDF à balisage de conversion pdf d'abord.

Traitement immédiat, la sortie Markdown est conservée (24h anonyme / 7d payé Share-link expiration), le PDF source est supprimé juste après extraction. Jamais utilisé pour la formation. /privacy/ pour la politique complète.

Oui — POST a multipart `file` to /v1/document/pdf-to-markdown/. Retourne {markdown_url, pages, prévisualisation, jetons, share_url}. Le porteur auth (sk-free-...) donne 10K jetons gratuits/mois. /api/ a l'exemple de boucle.

Inscrivez-vous gratuitement pour 30 000 jetons

Créer un compte gratuit

Aucune carte de crédit requise

Comment évalueriez-vous cet outil?

Love this tool? Share it!