PDF në Markdown

Përdorimi komercial OK 380+ modele Pa shenjë uji Nuk është e nevojshme regjistrimi
Modeli:
+ GPT-5, Claude, Gemini
Lësho një PDF — AI e konverton atë në Markdown të pastër me shije GitHub me tituj, paragrafë, lista, tabela dhe blloqe kodi të ruajtur. I mbështetur nga IBM Granite-Docling-258M (Apache 2.0). Më i shpejtë + i zgjuar se nxjerrja e tekstit të thjeshtë.

Lëshoj PDF këtu ose kliko për të ngarkuar

PDF deri në 50 MB. ~200 tokens për faqe.

Duke nxjerrë Markdown-aware... ~5-10 sekonda/faqe
Mundësitë e avancuara
Rezultati
Tokenët po i mbaron. Merr më shumë token
Dëshiron rezultate më të mira? Modelet Premium (GPT-5, Claude, Gemini) ofrojnë cilësi më të lartë. Shiko Planet

❤️ Të pëlqen Free.ai?

Regjistrohu për të marrë një lidhje referuese dhe fiton 25,000 token për mik.

Do më shumë? Regjistrohu falas për 30K token/ditë + 10K bonus
Regjistrohu

Duke përpunuar kërkesën tuaj...

Shndërro çdo PDF në Markdown të pastër me shije GitHub me tituj, tabela, lista dhe blloqe kodi të ruajtur. Mbështetur nga IBM Granite-Docling. Pa pagesë, pa kufizim, pa regjistrim.

Si të përdorësh PDF në Markdown

1
Shkruaj

Shkruaj tekst, ngarko një file, ose përshkruaj atë që do. Nuk duhet asnjë llogari.

2
Kliko për të krijuar

AI jonë e përpunon kërkesën tuaj në sekonda duke përdorur modelet më të mira të burimit të hapur.

3
Shkarko dhe nda

Shkarko, kopjo ose ndaje rezultatin tënd. Pa pagesë për përdorim personal dhe komercial.

Përdor këtë mjet nëpërmjet API

Automatizo këtë mjet nga kodi juaj. Pika e fundit REST e përshtatshme me OpenAI, autentifikimi me token e bartësit, nuk kërkohet SDK shtesë. Kostot e token-it përputhen me interfaqen web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF në Markdown tool on: ..."}]}'

PDF në Markdown — FAQ

Shko në çdo PDF dhe AI e konverton atë në Markdown të pastër me shije GitHub - titujt mbeten tituj, tabelat mbeten tabela, listat mbeten lista, blloqet e kodit mbeten blloqe kodi. Shkon shumë më tej se nxjerrja e tekstit të thjeshtë; hierarkia strukturore e dokumentit ruhet kështu që mund të hidhni daljen drejtpërsëdrejti në një faqe docs, një LLM RAG pipeline, ose një indeks kërkimi.

IBM Granite-Docling-258M (Apache 2.0). Model i vogël i vizionit në sekuencë i rregulluar për konvertimin e dokumenteve të njohura nga formati - mund pdftotext + shumë më shpejt + më inteligjent se sa të përdorësh një model të përgjithshëm të gjuhës së vizionit në çdo faqe.

pdftotext është një dëmtim i rrafshtë — paragrafët dhe tabelat rrëzohen në një mur fjalësh. Adobe Export to Word ruan strukturën por prodhon.docx + kushton ~$15/muaj. Docling ruan strukturën SEMANTIK (nivelet e titujve, listat si lista, tabelat si tabela Markdown) dhe nxjerr një format që LLMs dhe mjetet e zhvilluesit mund të konsumojnë në mënyrë native.

LlamaParse dhe unstructured të dyja kanë nivele të lira por kanë një kufizim faqesh/muaj dhe kërkojnë një kyç API. Docling-258M funksionon lokalisht në GPU + është krejtësisht i vetë-hostuar Apache 2.0, pa matje për faqe, pa regjistrim kyçi. Cilësia është konkurruese me LlamaParse në dokumentet standarde.

Po — tabelat kthehen si tabela të rregullta Markdown. Tabelat komplekse me shumë kollona/të ndërlikuara janë të rrafshuar më agresivisht (një kufizim thelbësor Markdown, jo faji i modelit). Për besnikëri të përsosur ndaj tabelës, ne gjithashtu suportojmë `format=html` nëpërmjet API që ruan rowspan/colspan.

Granite-Docling bën vetë hapin OCR — punon në PDF-të dixhitale dhe të skanuara. Të skanuar me DPI më të ulët (<150) humbin një pjesë të saktësisë së tekstit; riskanoj me 200+ DPI për rezultate më të mira.

Shumica e ekuacioneve të paraqitura në LaTeX vijnë si `$...$` Markdown math. Për dokumentet kërkimore me matematikë të rëndë, ofrojmë gjithashtu instrumentin academic-paper-extract (Nougat) që është specifikisht i rregulluar për ekuacionet dhe citimet.

Rreth 5-10 sekonda për faqe në H200-në tonë. Një raport 30-faqesh është ~3-5 minuta. Modeli i vogël do të thotë se grupet e vogla të PDF-ve janë në thelb të lira në bazen e përditshme.

200 token për faqe, me një fund prej 500 token. Një kontratë 5-faqëshe = 1,000 token. Një raport 30-faqësh = 6,000 token. 5K e përditshme e lirë mbulon përdorimin më të zakonshëm.

PDF — i lindur dixhital + i skanuar të dyja të mbështetura. Maksimum 50 MB ngarkim. Formatet e tjera të dokumenteve (DOCX, EPUB, HTML, etj.) janë në udhë; për tani ngarko dhe konverto me instrumentin e konvertimit pdf së pari.

Përpunuar menjëherë, rezultati Markdown ruhet (24 orë anonim / 7 ditë me pagesë për ndarjen e lidhjes), burimi PDF eleminohet menjëherë pas nxjerrjes. Nuk përdoret kurrë për trainim. /privacy/ për politikën e plotë.

Po — POST një `file` me shumë pjesë tek /v1/document/pdf-to-markdown/. Kthen {markdown_url, pages, preview, tokens, share_url}. Autentifikimi i bartësit (sk-free-…) jep 10K tokens falas/muaj. /api/ ka shembullin e curl.

Regjistrohu falas për 10,000 token

Krijo një profil të ri

Nuk kërkohet karta e kreditit

Si do ta vlerësoni këtë mjet?

Të pëlqen Free.ai?