Extracteur PDF PDF à texte Extracteur de papier académique Document de recherche à texte arXiv PDF Extractor Plus →

PDF à balisage

Q: Comment gère-t-il les maths / équations?

La plupart des équations rendues par LaTeX viennent à travers comme en ligne `$...$` Markdown maths. Pour les documents de recherche avec maths lourds, nous offrons également PDF à balisage académique-papier-extrait (Nougat) qui est spécialement accordé pour les équations et les citations.

Q: C'est à quelle vitesse?

Environ 5-10 secondes par page sur notre H200. Un rapport de 30 pages est ~3-5 minutes. Petit modèle signifie des lots de petits PDF sont essentiellement gratuits dans la piscine quotidienne.

Q: Combien ça coûte?

200 jetons par page, avec un plancher de 500 jetons. Un contrat de 5 pages = 1.000 jetons. Un rapport de 30 pages = 6.000 jetons. La piscine 5K quotidienne gratuite couvre l'utilisation la plus typique.

Q: Quels formats d'entrée?

D'autres formats de documents (DOCX, EPUB, HTML, etc.) sont sur la feuille de route; pour le moment, télécharger-et-convertir avec PDF à balisage de conversion pdf d'abord.

Utilisation commerciale OK 380+ modèles Pas de filigrane Pas besoin d'inscription

Déposer un PDF — L'IA le convertit en GitHub propre avec des rubriques, des paragraphes, des listes, des tableaux et des blocs de code conservés. Propulsé par IBM Granite-Docling-258M (Apache 2.0). Plus rapide + plus intelligent que l'extraction de texte simple.

Convertissez n'importe quel PDF en Markdown propre avec des en-têtes, des tables, des listes et des blocs de code conservés. Propulsé par IBM Granite-Doling. Gratuit, illimité, sans inscription.

Comment utiliser PDF à balisage

Saisissez votre entrée

Tapez du texte, téléchargez un fichier ou décrivez ce que vous voulez. Aucun compte n'est nécessaire.

Cliquez sur générer

Notre IA traite votre demande en quelques secondes à l'aide des meilleurs modèles open-source.

Télécharger et partager

Téléchargez, copiez ou partagez votre résultat. Gratuit pour un usage personnel et commercial.

Utilisez cet outil via l'API

Automatisez cet outil à partir de votre propre code. Endpoint REST compatible OpenAI, Auth-token auth, pas de SDK supplémentaire requis.

Documentation de l'API Obtenir la clé API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF à balisage tool on: ..."}]}'

Outils d'IA gratuits connexes

Extracteur PDF

PDF à texte

Extracteur de papier académique

Document de recherche à texte

arXiv PDF Extractor

PDF à balisage — FAQ

Déposer dans n'importe quel PDF et l'IA le convertit en propre GitHub-flavored Markdown — les titres restent en vedette, les tables restent en table, les listes de séjour, les blocs de code restent des blocs de code. Aller bien au-delà de l'extraction de texte simple; la hiérarchie structurelle du document est préservée afin que vous puissiez déposer la sortie directement dans un site docs, un pipeline LLM RAG, ou un index de recherche.

IBM Granite-Docling-258M (Apache 2.0). Petit modèle vision-à-séquence affiné pour la mise en page-conversion de documentware — beats pdftotext + beaucoup plus rapide + plus intelligent que l'exécution d'un modèle générique vision-langue sur chaque page.

Adobe Export to Word conserve la mise en page mais produit.docx + coûts ~15/mo. Docling préserve la structure SEMANTIC (niveaux de tête, listes comme listes, tableaux comme tables Markdown) et produit un format LLMs et des outils de dev peuvent tous deux consommer nativement.

LlamaParse et non structuré ont tous deux des niveaux libres mais des pages de plafond/mois et nécessitent une clé API. Docling-258M fonctionne localement sur notre GPU + est entièrement auto-organisé Apache 2.0, pas de mesure par page, pas d'inscription de clé. La qualité est compétitive avec LlamaParse sur les documents standard.

Oui — les tables reviennent comme des tables de pipe Markdown appropriées. Les tables multi-colonnes / imbriquées complexes sont aplaties plus agressivement (une limitation fondamentale Markdown, pas la faute du modèle). Pour une fidélité parfaite de la table, nous prenons également en charge `format=html` via l'API qui préserve rowspan/colspan.

Granite-Doling fait le pas lui-même de l'OCR — fonctionne sur les PDF nacré-numérique ET scanné aussi bien. Scanné à DPI inférieur (<150) perd une certaine précision de texte; rescan à 200+ DPI pour les meilleurs résultats.

La plupart des équations rendues par LaTeX viennent à travers comme en ligne `$...$` Markdown maths. Pour les documents de recherche avec maths lourds, nous offrons également PDF à balisage académique-papier-extrait (Nougat) qui est spécialement accordé pour les équations et les citations.

Environ 5-10 secondes par page sur notre H200. Un rapport de 30 pages est ~3-5 minutes. Petit modèle signifie des lots de petits PDF sont essentiellement gratuits dans la piscine quotidienne.

200 jetons par page, avec un plancher de 500 jetons. Un contrat de 5 pages = 1.000 jetons. Un rapport de 30 pages = 6.000 jetons. La piscine 5K quotidienne gratuite couvre l'utilisation la plus typique.

D'autres formats de documents (DOCX, EPUB, HTML, etc.) sont sur la feuille de route; pour le moment, télécharger-et-convertir avec PDF à balisage de conversion pdf d'abord.

Traitement immédiat, la sortie Markdown est conservée (24h anonyme / 7d payé Share-link expiration), le PDF source est supprimé juste après extraction. Jamais utilisé pour la formation. /privacy/ pour la politique complète.

Oui — POST a multipart `file` to /v1/document/pdf-to-markdown/. Retourne {markdown_url, pages, prévisualisation, jetons, share_url}. Le porteur auth (sk-free-...) donne 10K jetons gratuits/mois. /api/ a l'exemple de boucle.

Inscrivez-vous gratuitement pour 30 000 jetons

Créer un compte gratuit

Aucune carte de crédit requise

Comment évalueriez-vous cet outil?

PDF à balisage

Résultat

Comment utiliser PDF à balisage

Saisissez votre entrée

Cliquez sur générer

Télécharger et partager

Utilisez cet outil via l'API

Outils d'IA gratuits connexes

PDF à balisage — FAQ

Qu'est-ce que IA PDF à marquer?

Quel modèle l'alimente?

En quoi est-ce différent de pdftotext / Adobe export?

Comment se compare-t-il à LlamaParse / unstructured.io?

Est-ce qu'il gère les tables?

Qu'en est-il des PDF numérisés (image)?

Comment gère-t-il les maths / équations?

C'est à quelle vitesse?

Combien ça coûte?

Quels formats d'entrée?

Est-ce que les PDF téléchargés sont stockés?

Y a-t-il une API?

Obtenez 10 000 jetons gratuits

Attendez — Obtenez 10 000 jetons gratuits!

Tu en veux plus?