PDF către Markdown

Utilizare comercială OK 380+ modele Fără semn de apă Nu este nevoie de înscriere
Model:
+ GPT-5, Claude, Gemini
Aruncă un PDF — IA-l transformă în marcă curată cu gust GitHub cu poziții, paragrafe, liste, tabele și blocuri de cod toate conservate. Alimentate de IBM Granite-Docling-258M (Apache 2.0). Mai rapid + mai inteligent decât extracția textului simplu.

Aruncă un PDF aici sau click pentru a încărca

PDF până la 50 MB. ~200 tokens pe pagină.

Extragerea Markdown cu atenție la layout... ~5-10 sec/pagina
Opțiuni avansate
Rezultatul
Tokens scade. Obține mai multe tokens
Vrei rezultate mai bune? Modele premium (GPT-5, Claude, Gemini) oferă o calitate mai mare. Vizualizare planuri

❤️ Love this tool? Share it!

Inscrie-te pentru a obține o legătură de referință și câștiga 25.000 de jetoni pe prieten.

Vrei mai mult? Inregistreaza-te gratis pentru 30K tokens/zi + 10K bonus
Inscrie-te gratis

Prelucrarea cererii...

Convertiți orice PDF în curățat GitHub-savored Markdown cu poziții, tabele, liste și blocuri de cod conservate. Alimentat de IBM Granite-Docling. Gratuit, nelimitat, fără înscriere.

Cum să utilizaţi PDF către Markdown

1
Introduceți intrarea

Tastați text, încărcați un fișier sau descrieți ce doriți. Nu este nevoie de cont.

2
Click generare

IA noastra proceseaza cererea ta in secunde folosind cele mai bune modele de open-source.

3
Descărcați & împărțiți

Descărcaţi, copiaţi sau împărtăşiţi rezultatul. Gratuit pentru utilizare personală şi comercială.

Folosește acest instrument prin API

Automatizați acest instrument din propriul cod. Endpoint REST-compatibil cu OpenAI, Bearer-token auth, nu este necesar SDK suplimentar. Costurile token corespunde interfață web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF către Markdown tool on: ..."}]}'

PDF către Markdown — FAQ

Aruncați în orice PDF și IA-l transformă în curățat GitHub-savored Markdown — întinderea de ședere, tabele de ședere, liste de ședere, blocuri de cod blocuri de cod rămâne blocuri de cod. Merge mult mai departe de extracția textului simplu; ierarhia structurală a documentului este păstrată astfel încât să puteți lăsa ieșirea direct într-un site de documente, o conductă LLM RAG sau un indice de căutare.

IBM Granite-Docling-258M (Apache 2.0). Modelul mici de viziune-la-secunță ajustat pentru conversia documentelor conștienți de layout – bate pdftotext + mult mai rapid + mai inteligent decât rulând un model generic de limba vizuală pe fiecare pagină.

pdftotext este un dump plat — paragrafele și tabelele se prăbușesc într-un perete de cuvinte. Adobe Export to Word păstrează layout, dar produce.docx + costuri ~$15/mo. Docling păstrează structura SEMANTIC (nivelele de poziție, listele ca liste, tabelele ca Markdown tabele) și ieși un format LLM și instrumentele dev pot consuma atât în mod nativ.

LlamaParse și unstructurat ambele au niveluri gratuite, dar cap pagini/luna și necesită o cheie API. Docling-258M rulează local pe GPU + este complet auto-hosted Apache 2.0, fără mediere per pagină, fără înregistrare cheie. Calitatea este competitivă cu LlamaParse pe documente standard.

Da — tabelele se întorc ca tabelele Markdown. Tabelele multi-columna complexă / cuidate sunt aplanate mai agresiv (o limitație fundamentală Markdown, nu vina modelului). Pentru fidelitatea perfectă a tabelului, noi susținem, de asemenea, `format=html` prin API care menține rândurile/colspan.

Granit-Docling face pasul OCR în sine – lucrează pe PDF-uri digitale și scanate la fel. scanat la DPI mai jos (<150) pierde unele precizie text; rescand la 200+ DPI pentru cele mai bune rezultate.

Majoritatea ecuațiilor renunțate la LaTeX provin ca inline `$...$` Markdown matematic. Pentru documentele de cercetare cu matematică grea, oferim, de asemenea, instrumentul de extragere de hârtie-academic (Nougat) care este specificat pentru ecuații și citații.

Aproximativ 5-10 secunde pe pagina noastră H200. Un raport de 30 de pagini este ~3-5 minute. Model mic înseamnă loturi de PDF mici sunt esențial gratuit în piscina zilnică.

200 tokens pe pagina, cu un etaj de 500 de token. Un contract de 5 pagini = 1000 tokens. Un raport de 30 de pagini = 6.000 tokens. Piscina gratuită de 5K zilnic acoperă cele mai tipice utilizări.

PDF – nascut-digital + scanat ambele suportate. Max 50 MB încărcare. Alte formate de document (DOCX, EPUB, HTML, etc.) sunt pe roadmap; pentru acum încărcare-și-convert cu instrumentul de conversie pdf mai întâi.

Procesată imediat, ieșirea Markdown este menținută (24h anonimă / 7d plăți de expirare a legăturii de acțiuni), sursa PDF este șterse imediat după extracție. Niciodată utilizată pentru formare. /privacy / pentru întreaga politică.

Da — POST a multipart `file` to /v1/document/pdf-to-markdown /. Returneaza {markdown_url, pagini, previzualizare, tokens, share_url}. Bear auth (sk-free-...) oferă 10K free tokens/luna. /api/ are exemplul curl.

Inscrie-te gratis pentru 10.000 de jetoni

Creează cont liber

Nu sunt necesare carduri de credit

Cum ai evalua acest instrument?

Love this tool? Share it!