Extractor PDF PDF la text Extractor de hârtie academică Hârtie de cercetare la text extractor PDF arXiv Mai mult →

PDF către Markdown

Q: Cum se ocupă de matematică / ecuaţii?

Majoritatea ecuațiilor renunțate la LaTeX provin ca inline `$...$` Markdown matematic. Pentru documentele de cercetare cu matematică grea, oferim, de asemenea, instrumentul de extragere de hârtie-academic (Nougat) care este specificat pentru ecuații și citații.

Q: Cât de repede este?

Aproximativ 5-10 secunde pe pagina noastră H200. Un raport de 30 de pagini este ~3-5 minute. Model mic înseamnă loturi de PDF mici sunt esențial gratuit în piscina zilnică.

Q: Cât costă?

200 tokens pe pagina, cu un etaj de 500 de token. Un contract de 5 pagini = 1000 tokens. Un raport de 30 de pagini = 6.000 tokens. Piscina gratuită de 5K zilnic acoperă cele mai tipice utilizări.

Q: Ce formate de intrare?

PDF – nascut-digital + scanat ambele suportate. Max 50 MB încărcare. Alte formate de document (DOCX, EPUB, HTML, etc.) sunt pe roadmap; pentru acum încărcare-și-convert cu instrumentul de conversie pdf mai întâi.

Utilizare comercială OK 380+ modele Fără semn de apă Nu este nevoie de înscriere

Aruncă un PDF — IA-l transformă în marcă curată cu gust GitHub cu poziții, paragrafe, liste, tabele și blocuri de cod toate conservate. Alimentate de IBM Granite-Docling-258M (Apache 2.0). Mai rapid + mai inteligent decât extracția textului simplu.

Convertiți orice PDF în curățat GitHub-savored Markdown cu poziții, tabele, liste și blocuri de cod conservate. Alimentat de IBM Granite-Docling. Gratuit, nelimitat, fără înscriere.

Cum să utilizaţi PDF către Markdown

Introduceți intrarea

Tastați text, încărcați un fișier sau descrieți ce doriți. Nu este nevoie de cont.

Click generare

IA noastra proceseaza cererea ta in secunde folosind cele mai bune modele de open-source.

Descărcați & împărțiți

Descărcaţi, copiaţi sau împărtăşiţi rezultatul. Gratuit pentru utilizare personală şi comercială.

Folosește acest instrument prin API

Automatizați acest instrument din propriul cod. Endpoint REST-compatibil cu OpenAI, Bearer-token auth, nu este necesar SDK suplimentar. Costurile token corespunde interfață web.

Documentare API Obține cheie API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF către Markdown tool on: ..."}]}'

Unelte de IA Gratuite asociate

Extractor PDF

PDF la text

Extractor de hârtie academică

Hârtie de cercetare la text

extractor PDF arXiv

PDF către Markdown — FAQ

Aruncați în orice PDF și IA-l transformă în curățat GitHub-savored Markdown — întinderea de ședere, tabele de ședere, liste de ședere, blocuri de cod blocuri de cod rămâne blocuri de cod. Merge mult mai departe de extracția textului simplu; ierarhia structurală a documentului este păstrată astfel încât să puteți lăsa ieșirea direct într-un site de documente, o conductă LLM RAG sau un indice de căutare.

IBM Granite-Docling-258M (Apache 2.0). Modelul mici de viziune-la-secunță ajustat pentru conversia documentelor conștienți de layout – bate pdftotext + mult mai rapid + mai inteligent decât rulând un model generic de limba vizuală pe fiecare pagină.

pdftotext este un dump plat — paragrafele și tabelele se prăbușesc într-un perete de cuvinte. Adobe Export to Word păstrează layout, dar produce.docx + costuri ~$15/mo. Docling păstrează structura SEMANTIC (nivelele de poziție, listele ca liste, tabelele ca Markdown tabele) și ieși un format LLM și instrumentele dev pot consuma atât în mod nativ.

LlamaParse și unstructurat ambele au niveluri gratuite, dar cap pagini/luna și necesită o cheie API. Docling-258M rulează local pe GPU + este complet auto-hosted Apache 2.0, fără mediere per pagină, fără înregistrare cheie. Calitatea este competitivă cu LlamaParse pe documente standard.

Da — tabelele se întorc ca tabelele Markdown. Tabelele multi-columna complexă / cuidate sunt aplanate mai agresiv (o limitație fundamentală Markdown, nu vina modelului). Pentru fidelitatea perfectă a tabelului, noi susținem, de asemenea, `format=html` prin API care menține rândurile/colspan.

Granit-Docling face pasul OCR în sine – lucrează pe PDF-uri digitale și scanate la fel. scanat la DPI mai jos (<150) pierde unele precizie text; rescand la 200+ DPI pentru cele mai bune rezultate.

Majoritatea ecuațiilor renunțate la LaTeX provin ca inline `$...$` Markdown matematic. Pentru documentele de cercetare cu matematică grea, oferim, de asemenea, instrumentul de extragere de hârtie-academic (Nougat) care este specificat pentru ecuații și citații.

Aproximativ 5-10 secunde pe pagina noastră H200. Un raport de 30 de pagini este ~3-5 minute. Model mic înseamnă loturi de PDF mici sunt esențial gratuit în piscina zilnică.

200 tokens pe pagina, cu un etaj de 500 de token. Un contract de 5 pagini = 1000 tokens. Un raport de 30 de pagini = 6.000 tokens. Piscina gratuită de 5K zilnic acoperă cele mai tipice utilizări.

PDF – nascut-digital + scanat ambele suportate. Max 50 MB încărcare. Alte formate de document (DOCX, EPUB, HTML, etc.) sunt pe roadmap; pentru acum încărcare-și-convert cu instrumentul de conversie pdf mai întâi.

Procesată imediat, ieșirea Markdown este menținută (24h anonimă / 7d plăți de expirare a legăturii de acțiuni), sursa PDF este șterse imediat după extracție. Niciodată utilizată pentru formare. /privacy / pentru întreaga politică.

Da — POST a multipart `file` to /v1/document/pdf-to-markdown /. Returneaza {markdown_url, pagini, previzualizare, tokens, share_url}. Bear auth (sk-free-...) oferă 10K free tokens/luna. /api/ are exemplul curl.

Inscrie-te gratis pentru 10.000 de jetoni

Creează cont liber

Nu sunt necesare carduri de credit

Cum ai evalua acest instrument?

PDF către Markdown

Rezultatul

Cum să utilizaţi PDF către Markdown

Introduceți intrarea

Click generare

Descărcați & împărțiți

Folosește acest instrument prin API

Unelte de IA Gratuite asociate

PDF către Markdown — FAQ

Ce este IA PDF pentru Markdown?

Care model îi dă putere?

Cum diferă de pdftotext / Adobe export?

Cum se compară cu LlamaParse / unstructured.io?

Se ocupă de mese?

Cum rămâne cu PDF-urile scanate (imagine)?

Cum se ocupă de matematică / ecuaţii?

Cât de repede este?

Cât costă?

Ce formate de intrare?

Sunt încărcate PDF-uri stocate?

Există o API?

Obţine 10.000 de token gratuit

Aşteaptă! Ia 10K tokens gratis!

Vrei mai mult?