PDF-Extraktor PDF zu Text Akademischer Papierauszug Forschungspapier zum Text arXiv PDF Extractor Mehr →

PDF zum Markdown

Q: Wie geht es mit Mathematik / Gleichungen um?

Die meisten LaTeX-gerendered Gleichungen kommen durch als inline `$...$` Markdown-Mathematik. Für Forschungsarbeiten mit schwerer Mathematik, bieten wir auch die akademische-Papier-Extrakt-Tool (Nougat), das speziell für Gleichungen und Zitationen abgestimmt ist.

Q: Wie schnell ist es?

Etwa 5-10 Sekunden pro Seite auf unserem H200. Ein 30-seitiges Bericht ist ~3-5 Minuten. Kleines Modell bedeutet, dass Chargen von kleinen PDFs im täglichen Pool im Wesentlichen kostenlos sind.

Q: Wie viel kostet das?

200 Token pro Seite, mit 500 Token Boden. Ein 5-Seiten-Vertrag = 1.000 Token. Ein 30-Seiten-Bericht = 6.000 Token. Der 5K täglich kostenlos Pool deckt die typischste Verwendung.

Q: Welche Eingabeformate?

PDF — born-digital + gescannt beide unterstützt. Max 50 MB Upload. Andere Dokumentformate (DOCX, EPUB, HTML, etc.) sind auf der Roadmap; zum jetzigen Zeitpunkt upload-and-convert mit dem PDF-Konversionswerkzeug zuerst.

Kommerzielle Nutzung OK 380+ Modelle Kein Wasserzeichen Keine Anmeldung erforderlich

Drop a PDF — KI wandelt es in sauberes GitHub-geschminktes Markdown mit Überschriften, Absätzen, Listen, Tabellen und Codeblöcken um. Powered by IBM Granite-Docling-258M (Apache 2.0). Schneller + intelligenter als einfache Textextraktion.

Konvertieren Sie jedes PDF in ein sauberes GitHub-Geschmackmarkdown mit erhaltenen Überschriften, Tabellen, Listen und Codeblöcken. Powered by IBM Granite-Docling. Kostenlos, unbegrenzt, ohne Anmeldung.

Verwendung PDF zum Markdown

Geben Sie Ihre Eingabe ein

Geben Sie Text ein, laden Sie eine Datei hoch oder beschreiben Sie, was Sie wollen.

Klicken Sie auf Generieren

Unsere KI verarbeitet Ihre Anfrage in Sekundenschnelle mit den besten Open-Source-Modellen.

Herunterladen & Teilen

Downloaden, kopieren oder teilen Sie Ihr Ergebnis. Kostenlos für den persönlichen und kommerziellen Gebrauch.

Verwenden Sie dieses Tool über API

Automatisieren Sie dieses Tool aus Ihrem eigenen Code. OpenAI-kompatible REST-Endpunkt, Bearer-Token-Auth, kein zusätzliches SDK erforderlich. Tokenkosten entsprechen der Web-Schnittstelle.

API-Dokumentation API-Schlüssel abrufen

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF zum Markdown tool on: ..."}]}'

PDF zum Markdown — FAQ

Drop in jedem PDF und die KI konvertiert es in sauberen GitHub-geschmackten Markdown — Überschriften bleiben Überschriften, Tabellen bleiben Tabellen, Listen bleiben Listen, Code-Blöcke bleiben Code-Blöcke. Geht weit über einfache Textextraktion; die Strukturhierarchie des Dokuments ist erhalten, so dass Sie die Ausgabe direkt in eine Docs-Website, eine LLM RAG-Pipeline oder einen Suchindex fallen lassen können.

IBM Granite-Docling-258M (Apache 2.0). Kleines vision-to-sequence-Modell fein abgestimmt für Layout-aware-Dokument-Konvertierung — schlägt pdftotext + viel schneller + intelligenter als ein generisches vision-language-Modell auf jeder Seite.

pdftotext ist ein flacher Dump — Absätze und Tabellen kollabieren in eine Wand aus Wörtern. Adobe Export to Word bewahrt Layout, produziert aber.docx + Kosten ~$15/mo. Docling bewahrt die SEMANTIC-Struktur (Spitzenebenen, Listen als Listen, Tabellen als Markdown-Tabellen) und gibt ein Format LLMs und dev-Tools können beide nativ verbrauchen.

LlamaParse und unstrukturiert haben beide freie Ebenen, aber Cap-Seiten/Monat und benötigen einen API-Schlüssel. Docling-258M läuft lokal auf unserer GPU + ist vollständig selbst gehostet Apache 2.0, keine pro Seite Metering, keine Schlüsselanmeldung. Qualität ist konkurrenzfähig mit LlamaParse auf Standard-Dokumenten.

Ja – Tabellen kommen als richtige Markdown-Pipe-Tabellen zurück. Komplexe Multi-Spalten/Verschachtelte Tische werden aggressiver abgeflacht (eine grundlegende Markdown-Begrenzung, nicht die Fehler des Modells). Für perfekte Tabellentreue unterstützen wir auch `format=html` über die API, die rowspan/colspan bewahrt.

Granit-Docling macht den OCR-Schritt selbst – funktioniert auf born-digitalen und gescannten PDFs gleichermaßen. Gescannt bei niedrigerem DPI (<150) verliert etwas an Textgenauigkeit; Rescan bei 200+ DPI für beste Ergebnisse.

Die meisten LaTeX-gerendered Gleichungen kommen durch als inline `$...$` Markdown-Mathematik. Für Forschungsarbeiten mit schwerer Mathematik, bieten wir auch die akademische-Papier-Extrakt-Tool (Nougat), das speziell für Gleichungen und Zitationen abgestimmt ist.

Etwa 5-10 Sekunden pro Seite auf unserem H200. Ein 30-seitiges Bericht ist ~3-5 Minuten. Kleines Modell bedeutet, dass Chargen von kleinen PDFs im täglichen Pool im Wesentlichen kostenlos sind.

200 Token pro Seite, mit 500 Token Boden. Ein 5-Seiten-Vertrag = 1.000 Token. Ein 30-Seiten-Bericht = 6.000 Token. Der 5K täglich kostenlos Pool deckt die typischste Verwendung.

PDF — born-digital + gescannt beide unterstützt. Max 50 MB Upload. Andere Dokumentformate (DOCX, EPUB, HTML, etc.) sind auf der Roadmap; zum jetzigen Zeitpunkt upload-and-convert mit dem PDF-Konversionswerkzeug zuerst.

Die Markdown-Ausgabe wird sofort verarbeitet (24h anonym / 7d bezahlter Share-Link-Auslauf), die Quelle PDF wird direkt nach der Extraktion gelöscht.

Ja — POST a multipart `file` to /v1/document/pdf-to-markdown/. Gibt {markdown_url, Seiten, Vorschau, Token, share_url} zurück. Bearer auth (sk-free-...) gibt 10K kostenlose Token/Monat. /api/ hat das Curl-Beispiel.

Melde dich kostenlos an für 30.000 Token

Kostenloses Konto erstellen

Keine Kreditkarte erforderlich

Wie würden Sie dieses Tool bewerten?

PDF zum Markdown

Ergebnis

Verwendung PDF zum Markdown

Geben Sie Ihre Eingabe ein

Klicken Sie auf Generieren

Herunterladen & Teilen

Verwenden Sie dieses Tool über API

Verwandte kostenlose KI-Tools

PDF zum Markdown — FAQ

Was ist KI PDF zu Markdown?

Welches Modell macht es?

Wie unterscheidet es sich von pdftotext / Adobe Export?

Wie vergleicht sie mit LlamaParse / unstructured.io?

Geht es um Tische?

Was ist mit gescannten (Bild-) PDFs?

Wie geht es mit Mathematik / Gleichungen um?

Wie schnell ist es?

Wie viel kostet das?

Welche Eingabeformate?

Sind hochgeladene PDFs gespeichert?

Gibt es eine API?

Erhalten Sie 10.000 kostenlose Token

Warten Sie — Holen Sie sich 10K kostenlose Token!

Willst du mehr?