PDF у Markdown

Камерцыйнае выкарыстанне 380+ мадэляў Без вадзянога знака Не патрабуецца рэгістрацыя
Модэль:
+ GPT-5, Claude, Gemini
Перадача PDF - ШІ пераўтворыць яго ў чыстую Markdown з густам GitHub з загалоўкамі, абзацамі, спісамі, табліцамі і блокамі кода, якія захоўваюцца. Праграма працуе на IBM Granite- Docling- 258M (Apache 2. 0). Хутчэй і больш інтэлектуальна, чым выцягванне звычайнага тэксту.

Захаваць файл PDF

Памер файла PDF да 50 Мб. ~200 знакаў на старонку.

Выцягванне Markdown з улікам раскладкі... ~ 5- 10 сек/ старонку
Сцягнуць Markdown (.md)
Адмысловыя параметры
Вынікі
Не хапае значкоў. Атрымаць больш значкоў
Вы хочаце лепшыя вынікі? Модулі Premium (GPT-5, Claude, Gemini) даюць больш высокую якасць. Прагляд планаў

❤️ Любіце Free.ai? Раскажыце сваім сябрам!

Зарэгіструйцеся, каб атрымаць спасылку і атрымаць 25 000 знакаў на сябра.

Хочаце больш? Зарэгіструйцеся бясплатна на 30K знакаў / дзень + 10K бонус
Зарэгіструйцеся

Апрацоўка запыту...

Пераўтварэньне любога PDF у чыстую Markdown з густам GitHub з захаванымі загалоўкамі, табліцамі, спісамі і блокамі кода. Праграмнае забесьпячэньне IBM Granite-Docling. Бясплатна, без абмежаваньняў, без рэгістрацыі.

Як выкарыстоўваць PDF у Markdown

1
Увядзіце ваш увод

Увядзіце тэкст, загрузіце файл або апісайце, што вы хочаце. Не патрабуецца ўліковы запіс.

2
Націсніце, каб стварыць

Нашы машынныя навучанні апрацоўваюць ваш запыт за секунды, выкарыстоўваючы лепшыя мадэлі з адкрытым зыходным кодам.

3
Сцягнуць і падзяліцца

Сцягнуць, скапіраваць або падзяліцца сваімі вынікамі. Бясплатна для асабістага і камерцыйнага выкарыстання.

Выкарыстоўваць гэтую прыладу праз API

Аўтаматызацыя гэтай інструмента з вашага кода. OpenAI- сумяшчальны REST канец, Bearer- токен аўтарызацыі, не патрабуецца дадатковы SDK. Кошт токенаў адпавядае інтэрфейсу вэб.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF у Markdown tool on: ..."}]}'

PDF у Markdown — FAQ

Устаўце любы PDF і ШІ пераўтворыць яго ў чысты Markdown з густам GitHub - загалоўкі застаюцца загалоўкамі, табліцы застаюцца табліцамі, спісы застаюцца спісамі, блокі кода застаюцца блокамі кода. Ідзе далёка за выцягванне звычайнага тэксту; структурная іерархія дакумента захоўваецца, таму вы можаце ўстаўляць вывад прама ў сайт docs, канвеер LLM RAG або індэкс пошуку.

IBM Granite- Docling- 258M (Apache 2. 0). Маленькая мадэль змены зроку ў паслядоўнасць, адладжаная для пераўтварэння дакументаў з улікам макету - пераўзыходзіць pdftotext + значна хутчэй + больш разумна, чым запуск агульнай мадэлі змены зроку на кожнай старонцы.

pdftotext - гэта плоскі сметнік - абзацы і табліцы зліваюцца ў сцену слоў. Adobe Export to Word захоўвае макет, але вырабляе.docx + каштуе ~ $ 15 / месяц. Docling захоўвае SEMANTIC структуру (узроўні загалоўкаў, спісы як спісы, табліцы як табліцы Markdown) і выводзіць фармат LLMs і інструменты для распрацоўшчыкаў могуць спажываць нацыянальна.

LlamaParse і unstructured маюць свабодныя ўзроўні, але абмежаваныя па колькасці старонак у месяц і патрабуюць ключа API. Docling-258M працуе лакальна на нашым GPU +, поўнасцю самастойна захоўваецца Apache 2.0, без вылічэнняў па старонках, без падпіскі на ключ. Якасць канкурэнтаздольная з LlamaParse на стандартных дакументах.

Так — табліцы вяртаюцца як правільныя табліцы Markdown. Складаныя шматслупковыя / убудаваныя табліцы згладжваюцца больш агрэсіўна (фундаментальнае абмежаванне Markdown, а не памылка мадэлі). Для поўнай дакладнасці табліцы мы таксама падтрымліваем `format=html` праз API, які захоўвае rowspan/ colspan.

Granite- Docling сам выконвае працэс OCR - працуе як з лічбавымі, так і са сканаванымі PDF. Пры сканаваннях з меншай раздзяляльнасцю (< 150 DPI) тэксты губляюць частку дакладнасці; для лепшых вынікаў перасканаваць з 200+ DPI.

Большасць раўнанняў, адлюстраваных у LaTeX, паказваюцца ў выглядзе матэматычных значэнняў '$... $'. Для даследчых работ з цяжкай матэматыкай мы таксама прапануем інструмент для вываду навуковай працы (Nougat), які спецыяльна настроены для раўнанняў і цытавання.

Прыблізна 5-10 секунд на старонку на нашым H200. 30-старонкавы справаздача ~ 3-5 хвілін. Маленькая мадэль азначае, што партыі маленькіх PDF-файлаў па сутнасці бясплатныя ў штодзённым басейне.

200 знакаў на старонку, з 500 знакамі на паверхню. 5- старонкавы кантракт = 1000 знакаў. 30- старонкавы справаздача = 6000 знакаў. 5K штодзённы бясплатны фонд ахоплівае большасць звычайнага выкарыстання.

PDF — падтрымліваюцца як лічбавыя, так і сканаваныя файлы. Максімальны памер файла 50 Мб. Іншыя фарматы дакументаў (DOCX, EPUB, HTML і г. д.) таксама будуць падтрымлівацца; пакуль спачатку загрузіце і пераўтварыце файл з дапамогай інструмента пераўтварэння pdf.

Адразу апрацоўваецца, вывад Markdown захоўваецца (24 гадзіны ананімна / 7 дзён аплачаная спасылка на падзелу), зыходны PDF выдаляецца адразу пасля вываду. Ніколі не выкарыстоўваецца для трэніровак. / privacy / для поўнай палітыкі.

Дадатак да кнігі «Пра зямлю і чалавека» (1999) «Пра зямлю і чалавека» (2000) «Пра зямлю і чалавека» (2001) «Пра зямлю і чалавека» (2002) «Пра зямлю і чалавека» (2003) «Пра зямлю і чалавека» (2004) «Пра зямлю і чалавека» (2005) «Пра зямлю і чалавека» (2006) «Пра зямлю і чалавека» (2007) «Пра зямлю і чалавека» (2008) «Пра зямлю і чалавека» (2009)

Зарэгіструйцеся бясплатна на 30 000 знакаў

Стварыць новы рахунак

Крэдытная карта не патрабуецца

Як вы ацэньваеце гэтую прыладу?

Любіце Free.ai? Раскажыце сваім сябрам!