Выцягванне PDF Змяніць фармат тэксту Выцягванне акадэмічных дакументаў Даследчая праца ў тэкст Выцягваньне PDF з arXiv Больш →

PDF у Markdown

Q: Як ён працуе з матэматычнымі / раўненнямі?

Большасць раўнанняў, адлюстраваных у LaTeX, паказваюцца ў выглядзе матэматычных значэнняў '$... $'. Для даследчых работ з цяжкай матэматыкай мы таксама прапануем інструмент для вываду навуковай працы (Nougat), які спецыяльна настроены для раўнанняў і цытавання.

Q: Наколькі хутка?

Прыблізна 5-10 секунд на старонку на нашым H200. 30-старонкавы справаздача ~ 3-5 хвілін. Маленькая мадэль азначае, што партыі маленькіх PDF-файлаў па сутнасці бясплатныя ў штодзённым басейне.

Q: Колькі гэта каштуе?

200 знакаў на старонку, з 500 знакамі на паверхню. 5- старонкавы кантракт = 1000 знакаў. 30- старонкавы справаздача = 6000 знакаў. 5K штодзённы бясплатны фонд ахоплівае большасць звычайнага выкарыстання.

Q: Якія фарматы ўводу?

PDF — падтрымліваюцца як лічбавыя, так і сканаваныя файлы. Максімальны памер файла 50 Мб. Іншыя фарматы дакументаў (DOCX, EPUB, HTML і г. д.) таксама будуць падтрымлівацца; пакуль спачатку загрузіце і пераўтварыце файл з дапамогай інструмента пераўтварэння pdf.

Камерцыйнае выкарыстанне 380+ мадэляў Без вадзянога знака Не патрабуецца рэгістрацыя

Перадача PDF - ШІ пераўтворыць яго ў чыстую Markdown з густам GitHub з загалоўкамі, абзацамі, спісамі, табліцамі і блокамі кода, якія захоўваюцца. Праграма працуе на IBM Granite- Docling- 258M (Apache 2. 0). Хутчэй і больш інтэлектуальна, чым выцягванне звычайнага тэксту.

Пераўтварэньне любога PDF у чыстую Markdown з густам GitHub з захаванымі загалоўкамі, табліцамі, спісамі і блокамі кода. Праграмнае забесьпячэньне IBM Granite-Docling. Бясплатна, без абмежаваньняў, без рэгістрацыі.

Як выкарыстоўваць PDF у Markdown

Увядзіце ваш увод

Увядзіце тэкст, загрузіце файл або апісайце, што вы хочаце. Не патрабуецца ўліковы запіс.

Націсніце, каб стварыць

Нашы машынныя навучанні апрацоўваюць ваш запыт за секунды, выкарыстоўваючы лепшыя мадэлі з адкрытым зыходным кодам.

Сцягнуць і падзяліцца

Сцягнуць, скапіраваць або падзяліцца сваімі вынікамі. Бясплатна для асабістага і камерцыйнага выкарыстання.

Выкарыстоўваць гэтую прыладу праз API

Аўтаматызацыя гэтай інструмента з вашага кода. OpenAI- сумяшчальны REST канец, Bearer- токен аўтарызацыі, не патрабуецца дадатковы SDK. Кошт токенаў адпавядае інтэрфейсу вэб.

Дакументацыя API Атрымаць ключ API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF у Markdown tool on: ..."}]}'

Сродкі для свабоднага разумовага інтэлекту

Выцягванне PDF

Змяніць фармат тэксту

Выцягванне акадэмічных дакументаў

Даследчая праца ў тэкст

Выцягваньне PDF з arXiv

PDF у Markdown — FAQ

Устаўце любы PDF і ШІ пераўтворыць яго ў чысты Markdown з густам GitHub - загалоўкі застаюцца загалоўкамі, табліцы застаюцца табліцамі, спісы застаюцца спісамі, блокі кода застаюцца блокамі кода. Ідзе далёка за выцягванне звычайнага тэксту; структурная іерархія дакумента захоўваецца, таму вы можаце ўстаўляць вывад прама ў сайт docs, канвеер LLM RAG або індэкс пошуку.

IBM Granite- Docling- 258M (Apache 2. 0). Маленькая мадэль змены зроку ў паслядоўнасць, адладжаная для пераўтварэння дакументаў з улікам макету - пераўзыходзіць pdftotext + значна хутчэй + больш разумна, чым запуск агульнай мадэлі змены зроку на кожнай старонцы.

pdftotext - гэта плоскі сметнік - абзацы і табліцы зліваюцца ў сцену слоў. Adobe Export to Word захоўвае макет, але вырабляе.docx + каштуе ~ $ 15 / месяц. Docling захоўвае SEMANTIC структуру (узроўні загалоўкаў, спісы як спісы, табліцы як табліцы Markdown) і выводзіць фармат LLMs і інструменты для распрацоўшчыкаў могуць спажываць нацыянальна.

LlamaParse і unstructured маюць свабодныя ўзроўні, але абмежаваныя па колькасці старонак у месяц і патрабуюць ключа API. Docling-258M працуе лакальна на нашым GPU +, поўнасцю самастойна захоўваецца Apache 2.0, без вылічэнняў па старонках, без падпіскі на ключ. Якасць канкурэнтаздольная з LlamaParse на стандартных дакументах.

Так — табліцы вяртаюцца як правільныя табліцы Markdown. Складаныя шматслупковыя / убудаваныя табліцы згладжваюцца больш агрэсіўна (фундаментальнае абмежаванне Markdown, а не памылка мадэлі). Для поўнай дакладнасці табліцы мы таксама падтрымліваем `format=html` праз API, які захоўвае rowspan/ colspan.

Granite- Docling сам выконвае працэс OCR - працуе як з лічбавымі, так і са сканаванымі PDF. Пры сканаваннях з меншай раздзяляльнасцю (< 150 DPI) тэксты губляюць частку дакладнасці; для лепшых вынікаў перасканаваць з 200+ DPI.

Большасць раўнанняў, адлюстраваных у LaTeX, паказваюцца ў выглядзе матэматычных значэнняў '$... $'. Для даследчых работ з цяжкай матэматыкай мы таксама прапануем інструмент для вываду навуковай працы (Nougat), які спецыяльна настроены для раўнанняў і цытавання.

Прыблізна 5-10 секунд на старонку на нашым H200. 30-старонкавы справаздача ~ 3-5 хвілін. Маленькая мадэль азначае, што партыі маленькіх PDF-файлаў па сутнасці бясплатныя ў штодзённым басейне.

200 знакаў на старонку, з 500 знакамі на паверхню. 5- старонкавы кантракт = 1000 знакаў. 30- старонкавы справаздача = 6000 знакаў. 5K штодзённы бясплатны фонд ахоплівае большасць звычайнага выкарыстання.

PDF — падтрымліваюцца як лічбавыя, так і сканаваныя файлы. Максімальны памер файла 50 Мб. Іншыя фарматы дакументаў (DOCX, EPUB, HTML і г. д.) таксама будуць падтрымлівацца; пакуль спачатку загрузіце і пераўтварыце файл з дапамогай інструмента пераўтварэння pdf.

Адразу апрацоўваецца, вывад Markdown захоўваецца (24 гадзіны ананімна / 7 дзён аплачаная спасылка на падзелу), зыходны PDF выдаляецца адразу пасля вываду. Ніколі не выкарыстоўваецца для трэніровак. / privacy / для поўнай палітыкі.

Дадатак да кнігі «Пра зямлю і чалавека» (1999) «Пра зямлю і чалавека» (2000) «Пра зямлю і чалавека» (2001) «Пра зямлю і чалавека» (2002) «Пра зямлю і чалавека» (2003) «Пра зямлю і чалавека» (2004) «Пра зямлю і чалавека» (2005) «Пра зямлю і чалавека» (2006) «Пра зямлю і чалавека» (2007) «Пра зямлю і чалавека» (2008) «Пра зямлю і чалавека» (2009)

Зарэгіструйцеся бясплатна на 30 000 знакаў

Стварыць новы рахунак

Крэдытная карта не патрабуецца

Як вы ацэньваеце гэтую прыладу?

PDF у Markdown

Вынікі

Як выкарыстоўваць PDF у Markdown

Увядзіце ваш увод

Націсніце, каб стварыць

Сцягнуць і падзяліцца

Выкарыстоўваць гэтую прыладу праз API

Сродкі для свабоднага разумовага інтэлекту

PDF у Markdown — FAQ

Што такое ШІ PDF у Markdown?

Якая мадэль яго забяспечвае?

Як гэта адрозніваецца ад pdftotext / Adobe экспарту?

Як гэта параўнаць з LlamaParse / unstructured.io?

Ці працуе ён з табліцамі?

Што з сканаванымі (выявамі) PDF?

Як ён працуе з матэматычнымі / раўненнямі?

Наколькі хутка?

Колькі гэта каштуе?

Якія фарматы ўводу?

Захоўваюцца загружаныя файлы PDF?

Ці ёсць API?

Атрымаць 10,000 бясплатных жетонаў

Застаецца чакаць — атрымайце 10K бясплатных жетонаў!

Хочаце больш?