PDF zum Markdown

Kommerzielle Nutzung OK 380+ Modelle Kein Wasserzeichen Keine Anmeldung erforderlich
Modell:
+ GPT-5, Claude, Gemini
Drop a PDF — KI wandelt es in sauberes GitHub-geschminktes Markdown mit Überschriften, Absätzen, Listen, Tabellen und Codeblöcken um. Powered by IBM Granite-Docling-258M (Apache 2.0). Schneller + intelligenter als einfache Textextraktion.

Laden Sie hier ein PDF herunter oder klicken Sie zum Hochladen

PDF bis 50 MB. ~200 Zeichen pro Seite.

Extrahieren von layout-aware Markdown... ~5-10 sek/page
Erweiterte Optionen
Ergebnis
Die Tokens sind knapp. Erhalten Sie mehr Token
Willst du bessere Ergebnisse? Premium-Modelle (GPT-5, Claude, Gemini) liefern eine höhere Qualität. Pläne anzeigen

❤️ Love this tool? Share it!

Sign up um einen Verweis zu erhalten und 25.000 Token pro Freund zu verdienen.

Willst du mehr? Melde dich kostenlos an für 30K Tokens/Tag + 10K Bonus
Kostenlos anmelden

Ihre Anfrage bearbeiten...

Konvertieren Sie jedes PDF in ein sauberes GitHub-Geschmackmarkdown mit erhaltenen Überschriften, Tabellen, Listen und Codeblöcken. Powered by IBM Granite-Docling. Kostenlos, unbegrenzt, ohne Anmeldung.

Verwendung PDF zum Markdown

1
Geben Sie Ihre Eingabe ein

Geben Sie Text ein, laden Sie eine Datei hoch oder beschreiben Sie, was Sie wollen.

2
Klicken Sie auf Generieren

Unsere KI verarbeitet Ihre Anfrage in Sekundenschnelle mit den besten Open-Source-Modellen.

3
Herunterladen & Teilen

Downloaden, kopieren oder teilen Sie Ihr Ergebnis. Kostenlos für den persönlichen und kommerziellen Gebrauch.

Verwenden Sie dieses Tool über API

Automatisieren Sie dieses Tool aus Ihrem eigenen Code. OpenAI-kompatible REST-Endpunkt, Bearer-Token-Auth, kein zusätzliches SDK erforderlich. Tokenkosten entsprechen der Web-Schnittstelle.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF zum Markdown tool on: ..."}]}'

PDF zum Markdown — FAQ

Drop in jedem PDF und die KI konvertiert es in sauberen GitHub-geschmackten Markdown — Überschriften bleiben Überschriften, Tabellen bleiben Tabellen, Listen bleiben Listen, Code-Blöcke bleiben Code-Blöcke. Geht weit über einfache Textextraktion; die Strukturhierarchie des Dokuments ist erhalten, so dass Sie die Ausgabe direkt in eine Docs-Website, eine LLM RAG-Pipeline oder einen Suchindex fallen lassen können.

IBM Granite-Docling-258M (Apache 2.0). Kleines vision-to-sequence-Modell fein abgestimmt für Layout-aware-Dokument-Konvertierung — schlägt pdftotext + viel schneller + intelligenter als ein generisches vision-language-Modell auf jeder Seite.

pdftotext ist ein flacher Dump — Absätze und Tabellen kollabieren in eine Wand aus Wörtern. Adobe Export to Word bewahrt Layout, produziert aber.docx + Kosten ~$15/mo. Docling bewahrt die SEMANTIC-Struktur (Spitzenebenen, Listen als Listen, Tabellen als Markdown-Tabellen) und gibt ein Format LLMs und dev-Tools können beide nativ verbrauchen.

LlamaParse und unstrukturiert haben beide freie Ebenen, aber Cap-Seiten/Monat und benötigen einen API-Schlüssel. Docling-258M läuft lokal auf unserer GPU + ist vollständig selbst gehostet Apache 2.0, keine pro Seite Metering, keine Schlüsselanmeldung. Qualität ist konkurrenzfähig mit LlamaParse auf Standard-Dokumenten.

Ja – Tabellen kommen als richtige Markdown-Pipe-Tabellen zurück. Komplexe Multi-Spalten/Verschachtelte Tische werden aggressiver abgeflacht (eine grundlegende Markdown-Begrenzung, nicht die Fehler des Modells). Für perfekte Tabellentreue unterstützen wir auch `format=html` über die API, die rowspan/colspan bewahrt.

Granit-Docling macht den OCR-Schritt selbst – funktioniert auf born-digitalen und gescannten PDFs gleichermaßen. Gescannt bei niedrigerem DPI (<150) verliert etwas an Textgenauigkeit; Rescan bei 200+ DPI für beste Ergebnisse.

Die meisten LaTeX-gerendered Gleichungen kommen durch als inline `$...$` Markdown-Mathematik. Für Forschungsarbeiten mit schwerer Mathematik, bieten wir auch die akademische-Papier-Extrakt-Tool (Nougat), das speziell für Gleichungen und Zitationen abgestimmt ist.

Etwa 5-10 Sekunden pro Seite auf unserem H200. Ein 30-seitiges Bericht ist ~3-5 Minuten. Kleines Modell bedeutet, dass Chargen von kleinen PDFs im täglichen Pool im Wesentlichen kostenlos sind.

200 Token pro Seite, mit 500 Token Boden. Ein 5-Seiten-Vertrag = 1.000 Token. Ein 30-Seiten-Bericht = 6.000 Token. Der 5K täglich kostenlos Pool deckt die typischste Verwendung.

PDF — born-digital + gescannt beide unterstützt. Max 50 MB Upload. Andere Dokumentformate (DOCX, EPUB, HTML, etc.) sind auf der Roadmap; zum jetzigen Zeitpunkt upload-and-convert mit dem PDF-Konversionswerkzeug zuerst.

Die Markdown-Ausgabe wird sofort verarbeitet (24h anonym / 7d bezahlter Share-Link-Auslauf), die Quelle PDF wird direkt nach der Extraktion gelöscht.

Ja — POST a multipart `file` to /v1/document/pdf-to-markdown/. Gibt {markdown_url, Seiten, Vorschau, Token, share_url} zurück. Bearer auth (sk-free-...) gibt 10K kostenlose Token/Monat. /api/ hat das Curl-Beispiel.

Melde dich kostenlos an für 30.000 Token

Kostenloses Konto erstellen

Keine Kreditkarte erforderlich

Wie würden Sie dieses Tool bewerten?

Love this tool? Share it!