PDF-ից Markdown

Առևտրային օգտագործման համար 380+ մոդելներ Ջրային նշան չկա Չի պահանջվում գրանցվել
մոդել
+ GPT-5, Claude, Gemini
PDF-ի թողնում է AI-ն այն վերածում է GitHub-ի համով Markdown-ի, որի գլխամասերը, կետեր, ցուցակներ, աղյուսակներ և կոդային բլոկները պահպանված են։ Գործարկվում է IBM Granite-Docling-258M (Apache 2.0)-ով։ Շատ ավելի արագ և խելացի, քան պարզ տեքստի դուրսբերումը։

PDF- ը այստեղ թողնել կամ սեղմել ՝ ներբեռնելու համար

500 թվական, ոչ նահանջ տարի, ըստ Գրիգորյան օրացույցի սկսում է ուրբաթ։ Սա մեր թվարկության 500 թվականն է, II դարի 200-րդ տարին։

Բացել Markdown-ի էջը... ~5-10 վայրկյան/էջ
Ավելի բարդ ընտրանքներ
Արդյունք
Ցուցանիշները վերջանում են։ Ավելացնել տոկոսադրույքը
Ուզում եք ավելի լավ արդյունքներ ստանալ։ Առաջին կարգի մոդելներ (GPT-5, Claude, Gemini) ապահովում է ավելի բարձր որակ. Տեսանյութ

❤️ Սիրում ես Free.ai-ը, ասա ընկերներիդ։

Sign up to get a referral link and earn 30,000 tokens per friend.

Ուզում եք ավելին։ Գրանցվել անվճար համար 30K tokens/օր + 10K բոնուս
Անվճար գրանցում

Ձեր խնդրի վերլուծություն...

Ցանկացած PDF-ի վերածում GitHub-ի համով Markdown-ի, պահպանելով վերնագրերը, աղյուսակները, ցուցակները և կոդային բլոկները։ Հաղորդվում է IBM Granite-Docling-ի կողմից։ Ազատ, անսահմանափակ, առանց գրանցման։

Ինչպես օգտագործել PDF-ից Markdown

1
Տեղադրել ձեր մուտքագրումը

Տպեք տեքստը, ներբեռնեք ֆայլը կամ նկարագրեք այն, ինչ ցանկանում եք։ Հաշիվը պահանջվում չէ։

2
Սեղմել ստեղծելու համար

Մեր արհեստական բանականությունը վայրկյանների ընթացքում կպատասխանի ձեր հարցին՝ օգտագործելով լավագույն բաց կոդով մոդելները։

3
Տեղադրել և կիսվել

Տեղադրել, պատճենել կամ կիսվել արդյունքներով։ Ազատ է անձնական և առևտրային օգտագործման համար։

Օգտագործել այս գործիքը API-ի միջոցով

Ավտոմատացրեք այս գործիքը ձեր սեփական կոդից։ OpenAI- համապատասխան REST վերջնական կետը, Bearer-token auth, ոչ մի ավելորդ SDK պահանջվում է։ Token- ի արժեքը համապատասխանում է վեբ ինտերֆեյսին։

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF-ից Markdown tool on: ..."}]}'

PDF-ից Markdown — FAQ

Ձերբեռնեք ցանկացած PDF և AI-ն կվերածի այն GitHub-ի համով Markdown-ի՝ վերնագրերը մնալու են վերնագրեր, աղյուսակները մնալու են աղյուսակներ, ցուցակները մնալու են ցուցակներ, կոդային բլոկները մնալու են կոդային բլոկներ։ Այն շատ ավելին է, քան պարզ տեքստի դուրսբերում, փաստաթղթի կառուցվածքային հերոսխորհրդարանը պահպանվում է, այնպես որ դուք կարող եք ելքը ուղղակիորեն տեղադրել docs կայքում, LLM RAG ալիքում կամ որոնման ինդեքսում։

IBM Granite-Docling-258M (Apache 2.0)։ Փոքր տեսողական-հետևողական մոդել, որը հարմարեցված է փաստաթղթի կառուցվածքի մասին տեղեկացված մոդելի համար՝ գերազանցում է pdftotext-ը + շատ ավելի արագ + խելացի, քան յուրաքանչյուր էջում գործող գենետիկ տեսողական-լեզու մոդելը։

pdftotext-ը լայնածավալ ցուցակ է, որտեղ պարբերությունները և աղյուսակները փակվում են բառերի պատի մեջ։ Adobe Export to Word-ը պահպանում է դասավորությունը, բայց ստեղծում է.docx + արժեքը ~$15/month է։ Docling-ը պահպանում է SEMANTIC կառուցվածքը (գլխավորների մակարդակներ, ցուցակներ որպես ցուցակներ, աղյուսակներ որպես Markdown աղյուսակներ) և արտադրում է այնպիսի ձևաչափ, որը LLM-ները և զարգացման գործիքները կարող են օգտագործել բնական կերպով։

LlamaParse և unstructured-ը երկուսն էլ ունեն անվճար մակարդակներ, բայց ամսական էջերի սահմանափակում և պահանջում են API կոդ։ Docling-258M-ը աշխատում է տեղական մեր GPU-ի վրա + ամբողջությամբ ինքնուրույն ապահովված է Apache 2.0-ով, առանց էջերի հաշվարկման, առանց կոդերի գրանցման։ Կանոնավոր փաստաթղթերի համար որակը մրցունակ է LlamaParse-ի հետ։

Այո, աղյուսակները վերադարձվում են որպես Markdown-ի ճիշտ աղյուսակներ։ Բարդ բազմակողմանի / ինտեգրված աղյուսակները ավելի ագրեսիվ են դասավորվում (Markdown-ի հիմնային սահմանափակում, ոչ թե մոդելի սխալ)։ Աղյուսակի կատարյալ հավաստիության համար մենք նաև աջակցում ենք `format=html` API-ի միջոցով, որը պահպանում է rowspan/colspan-ը։

Granite-Docling-ը ինքն է կատարում OCR-ի քայլերը. աշխատում է թվային և սկանավորված PDF-ների վրա։ Սկանավորված ցածր DPI-ով (<150) տեքստը կորցնում է որոշակի ճշգրտություն։ Լավագույն արդյունքների համար կրկին սկանավորեք 200+ DPI-ով։

LaTeX- ով ներկայացված հավասարումների մեծամասնությունը ներառված են `$...$` Markdown math- ում։ Ֆիզիկական ծանրությամբ մաթեմատիկական աշխատանքների համար մենք առաջարկում ենք academic- paper- extract գործիք (Nougat), որը հատուկ հարմարեցված է հավասարումների և հղումների համար։

Մեր H200-ի դեպքում էջը կազմում է 5-10 վայրկյան։ 30-էջանոց զեկույցը կազմում է ~3-5 րոպե։ Փոքր մոդելը նշանակում է, որ փոքր PDF-ների խմբերը օրական ռեսուրսների մեջ անվճար են։

200 տոկոս յուրաքանչյուր էջում, 500 տոկոս շեմը. 5-էջանի պայմանագիր = 1000 տոկոս. 30-էջանի զեկույց = 6000 տոկոս. 5K օրական անվճար պոլիսը ներառում է առավել տիպիկ օգտագործումը:

PDF — աջակցվում է թվային և սկանավորված տարբերակները։ Առավելագույնը 50 ՄԲ բովանդակություն է ներբեռնվում։ Դիտարկվում են նաև այլ փաստաթղթի ձևաչափեր (DOCX, EPUB, HTML և այլն)։ Այժմ նախ ներբեռնեք և վերափոխեք դրանք pdf-ի վերափոխման գործիքով։

Անմիջապես ընթանում է, Markdown- ի ելքը պահվում է (24 ժամ անանուն / 7 օր վճարված կիսում- հղման ժամկետը), աղբյուրի PDF- ը անջատվում է դուրս բերումից հետո: Ոչ մի դեպքում չի օգտագործվում ուսուցման համար. /privacy/ ամբողջական քաղաքականության համար

Այո — POST մի քանի մասից բաղկացած `ֆայլ` /v1/document/pdf-to-markdown/-ին։ Վերադարձնում է {markdown_url, pages, preview, tokens, share_url}։ Bearer auth (sk-free-…) տալիս է 10K անվճար tokens/month։ /api/-ում կա curl օրինակ։

Գրանցվել անվճար 30,000 tokens

Ընտրեք հաշիվ

Կրեդիտ քարտի կարիք չկա

Ինչպե՞ս կգնահատեիք այս գործիքը։

Սիրում ես Free.ai-ը, ասա ընկերներիդ։