PDF-ի արտահանում PDF-ից տեքստի Ակադեմիական նյութերի արտահանում Գործիք arXiv PDF-ի արտահանող Ավելին →

PDF-ից Markdown

Q: Ինչպե՞ս է այն աշխատում մաթեմատիկական/ հավասարումների հետ։

LaTeX- ով ներկայացված հավասարումների մեծամասնությունը ներառված են `$...$` Markdown math- ում։ Ֆիզիկական ծանրությամբ մաթեմատիկական աշխատանքների համար մենք առաջարկում ենք academic- paper- extract գործիք (Nougat), որը հատուկ հարմարեցված է հավասարումների և հղումների համար։

Q: Որքա՞ն արագ է այն։

Մեր H200-ի դեպքում էջը կազմում է 5-10 վայրկյան։ 30-էջանոց զեկույցը կազմում է ~3-5 րոպե։ Փոքր մոդելը նշանակում է, որ փոքր PDF-ների խմբերը օրական ռեսուրսների մեջ անվճար են։

Q: Որքա՞ն է արժե։

200 տոկոս յուրաքանչյուր էջում, 500 տոկոս շեմը. 5-էջանի պայմանագիր = 1000 տոկոս. 30-էջանի զեկույց = 6000 տոկոս. 5K օրական անվճար պոլիսը ներառում է առավել տիպիկ օգտագործումը:

Q: Ո՞ր մուտքագրման ձևաչափերը:

PDF — աջակցվում է թվային և սկանավորված տարբերակները։ Առավելագույնը 50 ՄԲ բովանդակություն է ներբեռնվում։ Դիտարկվում են նաև այլ փաստաթղթի ձևաչափեր (DOCX, EPUB, HTML և այլն)։ Այժմ նախ ներբեռնեք և վերափոխեք դրանք pdf-ի վերափոխման գործիքով։

Առևտրային օգտագործման համար 380+ մոդելներ Ջրային նշան չկա Չի պահանջվում գրանցվել

PDF-ի թողնում է AI-ն այն վերածում է GitHub-ի համով Markdown-ի, որի գլխամասերը, կետեր, ցուցակներ, աղյուսակներ և կոդային բլոկները պահպանված են։ Գործարկվում է IBM Granite-Docling-258M (Apache 2.0)-ով։ Շատ ավելի արագ և խելացի, քան պարզ տեքստի դուրսբերումը։

Ցանկացած PDF-ի վերածում GitHub-ի համով Markdown-ի, պահպանելով վերնագրերը, աղյուսակները, ցուցակները և կոդային բլոկները։ Հաղորդվում է IBM Granite-Docling-ի կողմից։ Ազատ, անսահմանափակ, առանց գրանցման։

Ինչպես օգտագործել PDF-ից Markdown

Տեղադրել ձեր մուտքագրումը

Տպեք տեքստը, ներբեռնեք ֆայլը կամ նկարագրեք այն, ինչ ցանկանում եք։ Հաշիվը պահանջվում չէ։

Սեղմել ստեղծելու համար

Մեր արհեստական բանականությունը վայրկյանների ընթացքում կպատասխանի ձեր հարցին՝ օգտագործելով լավագույն բաց կոդով մոդելները։

Տեղադրել և կիսվել

Տեղադրել, պատճենել կամ կիսվել արդյունքներով։ Ազատ է անձնական և առևտրային օգտագործման համար։

Օգտագործել այս գործիքը API-ի միջոցով

Ավտոմատացրեք այս գործիքը ձեր սեփական կոդից։ OpenAI- համապատասխան REST վերջնական կետը, Bearer-token auth, ոչ մի ավելորդ SDK պահանջվում է։ Token- ի արժեքը համապատասխանում է վեբ ինտերֆեյսին։

API փաստաթղթավորում Գրանցվել API կոդով

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF-ից Markdown tool on: ..."}]}'

Առցանց AI գործիքներ

PDF-ի արտահանում

PDF-ից տեքստի

Ակադեմիական նյութերի արտահանում

Գործիք

arXiv PDF-ի արտահանող

PDF-ից Markdown — FAQ

Ձերբեռնեք ցանկացած PDF և AI-ն կվերածի այն GitHub-ի համով Markdown-ի՝ վերնագրերը մնալու են վերնագրեր, աղյուսակները մնալու են աղյուսակներ, ցուցակները մնալու են ցուցակներ, կոդային բլոկները մնալու են կոդային բլոկներ։ Այն շատ ավելին է, քան պարզ տեքստի դուրսբերում, փաստաթղթի կառուցվածքային հերոսխորհրդարանը պահպանվում է, այնպես որ դուք կարող եք ելքը ուղղակիորեն տեղադրել docs կայքում, LLM RAG ալիքում կամ որոնման ինդեքսում։

IBM Granite-Docling-258M (Apache 2.0)։ Փոքր տեսողական-հետևողական մոդել, որը հարմարեցված է փաստաթղթի կառուցվածքի մասին տեղեկացված մոդելի համար՝ գերազանցում է pdftotext-ը + շատ ավելի արագ + խելացի, քան յուրաքանչյուր էջում գործող գենետիկ տեսողական-լեզու մոդելը։

pdftotext-ը լայնածավալ ցուցակ է, որտեղ պարբերությունները և աղյուսակները փակվում են բառերի պատի մեջ։ Adobe Export to Word-ը պահպանում է դասավորությունը, բայց ստեղծում է.docx + արժեքը ~$15/month է։ Docling-ը պահպանում է SEMANTIC կառուցվածքը (գլխավորների մակարդակներ, ցուցակներ որպես ցուցակներ, աղյուսակներ որպես Markdown աղյուսակներ) և արտադրում է այնպիսի ձևաչափ, որը LLM-ները և զարգացման գործիքները կարող են օգտագործել բնական կերպով։

LlamaParse և unstructured-ը երկուսն էլ ունեն անվճար մակարդակներ, բայց ամսական էջերի սահմանափակում և պահանջում են API կոդ։ Docling-258M-ը աշխատում է տեղական մեր GPU-ի վրա + ամբողջությամբ ինքնուրույն ապահովված է Apache 2.0-ով, առանց էջերի հաշվարկման, առանց կոդերի գրանցման։ Կանոնավոր փաստաթղթերի համար որակը մրցունակ է LlamaParse-ի հետ։

Այո, աղյուսակները վերադարձվում են որպես Markdown-ի ճիշտ աղյուսակներ։ Բարդ բազմակողմանի / ինտեգրված աղյուսակները ավելի ագրեսիվ են դասավորվում (Markdown-ի հիմնային սահմանափակում, ոչ թե մոդելի սխալ)։ Աղյուսակի կատարյալ հավաստիության համար մենք նաև աջակցում ենք `format=html` API-ի միջոցով, որը պահպանում է rowspan/colspan-ը։

Granite-Docling-ը ինքն է կատարում OCR-ի քայլերը. աշխատում է թվային և սկանավորված PDF-ների վրա։ Սկանավորված ցածր DPI-ով (<150) տեքստը կորցնում է որոշակի ճշգրտություն։ Լավագույն արդյունքների համար կրկին սկանավորեք 200+ DPI-ով։

LaTeX- ով ներկայացված հավասարումների մեծամասնությունը ներառված են `$...$` Markdown math- ում։ Ֆիզիկական ծանրությամբ մաթեմատիկական աշխատանքների համար մենք առաջարկում ենք academic- paper- extract գործիք (Nougat), որը հատուկ հարմարեցված է հավասարումների և հղումների համար։

Մեր H200-ի դեպքում էջը կազմում է 5-10 վայրկյան։ 30-էջանոց զեկույցը կազմում է ~3-5 րոպե։ Փոքր մոդելը նշանակում է, որ փոքր PDF-ների խմբերը օրական ռեսուրսների մեջ անվճար են։

200 տոկոս յուրաքանչյուր էջում, 500 տոկոս շեմը. 5-էջանի պայմանագիր = 1000 տոկոս. 30-էջանի զեկույց = 6000 տոկոս. 5K օրական անվճար պոլիսը ներառում է առավել տիպիկ օգտագործումը:

PDF — աջակցվում է թվային և սկանավորված տարբերակները։ Առավելագույնը 50 ՄԲ բովանդակություն է ներբեռնվում։ Դիտարկվում են նաև այլ փաստաթղթի ձևաչափեր (DOCX, EPUB, HTML և այլն)։ Այժմ նախ ներբեռնեք և վերափոխեք դրանք pdf-ի վերափոխման գործիքով։

Անմիջապես ընթանում է, Markdown- ի ելքը պահվում է (24 ժամ անանուն / 7 օր վճարված կիսում- հղման ժամկետը), աղբյուրի PDF- ը անջատվում է դուրս բերումից հետո: Ոչ մի դեպքում չի օգտագործվում ուսուցման համար. /privacy/ ամբողջական քաղաքականության համար

Այո — POST մի քանի մասից բաղկացած `ֆայլ` /v1/document/pdf-to-markdown/-ին։ Վերադարձնում է {markdown_url, pages, preview, tokens, share_url}։ Bearer auth (sk-free-…) տալիս է 10K անվճար tokens/month։ /api/-ում կա curl օրինակ։

Գրանցվել անվճար 30,000 tokens

Ընտրեք հաշիվ

Կրեդիտ քարտի կարիք չկա

Ինչպե՞ս կգնահատեիք այս գործիքը։

PDF-ից Markdown

Արդյունք

Ինչպես օգտագործել PDF-ից Markdown

Տեղադրել ձեր մուտքագրումը

Սեղմել ստեղծելու համար

Տեղադրել և կիսվել

Օգտագործել այս գործիքը API-ի միջոցով

Առցանց AI գործիքներ

PDF-ից Markdown — FAQ

Ի՞նչ է AI PDF-ից Markdown-ը։

Ո՞ր մոդելն է այն ապահովում:

Ինչպե՞ս է այն տարբերվում pdftotext / Adobe արտահանումից։

Ինչպե՞ս է այն համեմատվում LlamaParse / unstructured.io-ի հետ։

Այն արդյոք աշխատում է սեղանների հետ։

Ի՞նչ է պատահում սկանավորված (նկար) PDF-ների հետ։

Ինչպե՞ս է այն աշխատում մաթեմատիկական/ հավասարումների հետ։

Որքա՞ն արագ է այն։

Որքա՞ն է արժե։

Ո՞ր մուտքագրման ձևաչափերը:

Արդյո՞ք պահպանվում են ներբեռնված PDF- ները։

Կա՞ API- ՞

Գրանցվել 10,000 անվճար Tokens

10K անվճար տոկոսադրույքներ

Ուզում եք ավելին։