Echdynnwr PDF PDF i Testun Allforiwr Papur AcademaiddName Dogfen Ymchwil i Destun Echdynnwr PDF arXiv Mwy →

PDF i Markdown

Q: Sut mae'n trin gwyddor cyfrifiadurol/equations?

Mae' r rhan fwyaf o gydraddoldebau a ddarperir gan LaTeX yn dod drwy fel math Markdown `$...$` mewnlin. Ar gyfer papurau ymchwil gyda mathemateg fawr, rydym hefyd yn cynnig yr erfyn academaidd- papur- echdynnu (Nougat) sydd wedi ei addasu' n benodol ar gyfer cydraddoldebau a dyfyniadau.

Q: Pa mor gyflym yw hi?

Am 5-10 eiliad y dudalen ar ein H200. Mae adroddiad 30 tudalen yn ~ 3-5 munud. Mae model bach yn golygu bod batches o PDFau bach yn hollol rhad ac am ddim yn y gronfa ddyddiol.

Q: Faint mae'n costio?

200 tocyn am bob tudalen, gyda llawr o 500 tocyn. Contract 5 tudalen = 1,000 tocyn. Adroddiad 30 tudalen = 6,000 tocyn. Mae'r gronfa 5K am ddim bob dydd yn cwmpasu'r defnydd mwyaf cyffredin.

Q: Pa fformatau mewnbwn?

PDF — cynhelir y ddau, geni-digidol a sganio. Uchafswm o 50 MB i'w lawrlwytho. Mae fformatau dogfennau eraill (DOCX, EPUB, HTML, ac ati) ar y map ffordd; ar hyn o bryd, lawrlwythwch a throsiwch gyda'r erfyn trawsnewid pdf yn gyntaf.

Defnydd masnachol OK 380+ modelau Dim dyfynbris Dim angen cofrestru

Rholio PDF — Mae AI yn ei drosi i Markdown glan GitHub-flawd gyda phenawdau, paragraffau, rhestrau, tablau, a blociau cod yn cael eu cadw. Cynhaliwyd gan IBM Granite-Docling-258M (Apache 2.0). Mwy cyflym + deallus na echdynnu testun plaen.

Trosi unrhyw PDF i Markdown GitHub-flavored glan gyda phenawdau, tablau, rhestrau, a blociau cod wedi'u cadw. Ceir gan IBM Granite-Docling. Am ddim, heb gyfyngiad, dim angen cofrestru.

Sut i ddefnyddio PDF i Markdown

Rhowch eich mewnbwn

Teipiwch destun, lanlwythwch ffeil, neu disgrifiwch beth ydych chi eisiau. Nid oes angen cyfrif.

Cliciwch i greu

Mae ein AI yn prosesu eich cais mewn eiliad gan ddefnyddio'r modelau ffynhonnell agored gorau.

Lawrlwytho a rhannu

Lawrlwytho, copïo, neu rannu eich canlyniad. Am ddim ar gyfer defnydd personol a masnachol.

Defnyddio'r erfyn hwn drwy API

Awtomatigi'r erfyn hwn o'ch cod eich hun. Diwedd-bwynt REST cydnaws â OpenAI, dilysiant tocyn-berchennog, dim angen SDK ychwanegol. Mae cost tocynnau yn cydweddu â'r rhyngwyneb gwe.

Dogfennaeth API Nôl Allwedd API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF i Markdown tool on: ..."}]}'

Erfyn Rhydd AI

Echdynnwr PDF

PDF i Testun

Allforiwr Papur AcademaiddName

Dogfen Ymchwil i Destun

Echdynnwr PDF arXiv

PDF i Markdown — FAQ

Rhowch unrhyw PDF a bydd y AI yn ei drosi i Markdown GitHub-flavored glan — mae penawdau yn aros yn benawdau, mae tablau yn aros yn tablau, mae rhestrau yn aros yn rhestrau, mae blociau cod yn aros yn blociau cod. Mae'n mynd ymhellach na echdynnu testun plaen; caiff hierarchaeth strwythurol y ddogfen ei chadw fel y gallwch roi'r allbwn yn uniongyrchol i safle dogfennau, pibell LLM RAG, neu mynegai chwilio.

IBM Granite-Docling-258M (Apache 2.0). Model syniad-i-sefyllfa bach wedi ei addasu'n fanwl ar gyfer trawsnewid dogfennau sy'n ymwybodol o'r cynllun - yn well na pdftotext + llawer cyflymach + mwy deallus na rhedeg model syniad-iaith generig ar bob tudalen.

Mae pdftotext yn ddalfa llyfn — mae paragraffau a thabl yn cwympo i mewn i wal o eiriau. Mae Adobe Export to Word yn cadw'r cynllun ond yn cynhyrchu.docx + mae'n costio ~$15/mo. Mae Docling yn cadw'r strwythur SEMANTIC (lefelau pennawd, rhestrau fel rhestrau, tablau fel tablau Markdown) ac yn allbwn fformat y gall LLMs a deunyddiau datblygwr eu defnyddio'n naturiol.

Mae gan LlamaParse a unstructured ddau lefel am ddim ond mae gan bob un ohono derfyn tudalennau/mis ac mae angen allwedd API. Docling-258M yn rhedeg yn lleol ar ein GPU + mae Apache 2.0 yn hunan-westeio'n llwyr, dim mesur ar gyfer pob tudalen, dim cofrestru allwedd. Mae ansawdd yn gydweithredol â LlamaParse ar ddogfennau safonol.

Ie — mae tablau'n dychwelyd fel tablau pibellau Markdown cywir. Mae tablau cymhleth aml-golofn / neilltuedig yn cael eu llyfnhau'n fwy ymylol (dim ond cyfyngiad Markdown sylfaenol, nid gwall y model). Er mwyn sicrhau cywirdeb tabl perffaith, rydym hefyd yn cynnal `format=html` drwy'r API sy'n cadw rowspan/colspan.

Mae Granite-Docling yn gwneud y cam OCR ei hun — yn gweithio ar PDFau a anwyd yn ddigidol A PDFau a archwiliwyd yn yr un modd. Mae archwiliad ar DPI isel (<150) yn colli rhywfaint o gywirdeb testun; ail-archwiliwch ar 200+ DPI er mwyn cael y canlyniadau gorau.

Mae' r rhan fwyaf o gydraddoldebau a ddarperir gan LaTeX yn dod drwy fel math Markdown `$...$` mewnlin. Ar gyfer papurau ymchwil gyda mathemateg fawr, rydym hefyd yn cynnig yr erfyn academaidd- papur- echdynnu (Nougat) sydd wedi ei addasu' n benodol ar gyfer cydraddoldebau a dyfyniadau.

Am 5-10 eiliad y dudalen ar ein H200. Mae adroddiad 30 tudalen yn ~ 3-5 munud. Mae model bach yn golygu bod batches o PDFau bach yn hollol rhad ac am ddim yn y gronfa ddyddiol.

200 tocyn am bob tudalen, gyda llawr o 500 tocyn. Contract 5 tudalen = 1,000 tocyn. Adroddiad 30 tudalen = 6,000 tocyn. Mae'r gronfa 5K am ddim bob dydd yn cwmpasu'r defnydd mwyaf cyffredin.

PDF — cynhelir y ddau, geni-digidol a sganio. Uchafswm o 50 MB i'w lawrlwytho. Mae fformatau dogfennau eraill (DOCX, EPUB, HTML, ac ati) ar y map ffordd; ar hyn o bryd, lawrlwythwch a throsiwch gyda'r erfyn trawsnewid pdf yn gyntaf.

Prosesir yn syth, caiff yr allbwn Markdown ei gadw (24 awr yn ddi-enw / 7 diwrnod yn dod i ben ar gyfer cysylltiadau rhannu a dalwyd), dileuir y PDF ffynhonnell ar ôl ei echdynnu. Ni ddefnyddir erioed ar gyfer hyfforddiant. / privacy / am y polisi llawn.

Ie — POST `ffeil` aml-ran i /v1/document/pdf-to-markdown/. Dychwelyd {markdown_url, pages, preview, tokens, share_url}. Mae awdurdodi'r barwr (sk-free-…) yn rhoi 10K o tocynnau am ddim/mis. Mae gan /api/ y enghraifft curl.

Cofrestru am ddim am 30,000 o tocynnau

Creu Cyfrif

Dim angen cerdyn credyd

Sut ydych chi'n graddio'r erfyn yma?

PDF i Markdown

Canlyniad

Sut i ddefnyddio PDF i Markdown

Rhowch eich mewnbwn

Cliciwch i greu

Lawrlwytho a rhannu

Defnyddio'r erfyn hwn drwy API

Erfyn Rhydd AI

PDF i Markdown — FAQ

Beth yw AI PDF i Markdown?

Pa ddull sy'n ei bweru?

Sut mae'n wahanol i allforio pdftotext / Adobe?

Sut mae'n cymharu â LlamaParse / unstructured.io?

A yw'n trin tablau?

Beth am PDFau arsefydlu (delwedd)?

Sut mae'n trin gwyddor cyfrifiadurol/equations?

Pa mor gyflym yw hi?

Faint mae'n costio?

Pa fformatau mewnbwn?

A gafodd y PDFau a lwythwyd i fyny eu cadw?

A oes API?

Derbyn 10,000 o Tocynnau Am Ddim

Aros — Cael 10K o Ddyfeisiau Am Ddim!

Hoffech fwy?