Выцягванне акадэмічных дакументаў

Камерцыйнае выкарыстанне 380+ мадэляў Без вадзянога знака Не патрабуецца рэгістрацыя
Модэль:
+ GPT-5, Claude, Gemini
Выкіньце артыкул з arXiv, артыкул з часопіса ці тэзавую главу - машынны пераклад ператворыць іх у тэксты з густам LaTeX. Матэматычныя раўнанні застаюцца раўнаннямі, шматслупковыя раскладкі разгортваюцца, цытаты захоўваюцца. Праграмнае забеспячэнне Meta Nougat- base.

Захаваць файл у фармаце PDF

1500 — 3000 гадоў да н.э. — перыяд эвалюцыі чалавецтва (пачатак эоцена).

Чытанне раўнанняў + разгортванне слупкоў... ~ 10 сек/ старонка
Адмысловыя параметры
Вынікі
Не хапае значкоў. Атрымаць больш значкоў
Вы хочаце лепшыя вынікі? Модулі Premium (GPT-5, Claude, Gemini) даюць больш высокую якасць. Прагляд планаў

❤️ Любіце Free.ai? Раскажыце сваім сябрам!

Зарэгіструйцеся, каб атрымаць спасылку і атрымаць 25 000 знакаў на сябра.

Хочаце больш? Зарэгіструйцеся бясплатна на 30K знакаў / дзень + 10K бонус
Зарэгіструйцеся

Апрацоўка запыту...

Выцягванне тэксту і раўнанняў з артыкулаў, часопісаў і дысертацыяў arXiv. Матэматычныя раўнанні пераўтвараюцца ў LaTeX, шматслупковыя раскладкі разгортваюцца, цытаты захоўваюцца. Праграма працуе на Meta Nougat. Бясплатная, без рэгістрацыі.

Як выкарыстоўваць Выцягванне акадэмічных дакументаў

1
Увядзіце ваш увод

Увядзіце тэкст, загрузіце файл або апісайце, што вы хочаце. Не патрабуецца ўліковы запіс.

2
Націсніце, каб стварыць

Нашы машынныя навучанні апрацоўваюць ваш запыт за секунды, выкарыстоўваючы лепшыя мадэлі з адкрытым зыходным кодам.

3
Сцягнуць і падзяліцца

Сцягнуць, скапіраваць або падзяліцца сваімі вынікамі. Бясплатна для асабістага і камерцыйнага выкарыстання.

Выкарыстоўваць гэтую прыладу праз API

Аўтаматызацыя гэтай інструмента з вашага кода. OpenAI- сумяшчальны REST канец, Bearer- токен аўтарызацыі, не патрабуецца дадатковы SDK. Кошт токенаў адпавядае інтэрфейсу вэб.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Выцягванне акадэмічных дакументаў tool on: ..."}]}'

Выцягванне акадэмічных дакументаў — FAQ

Устаўце любы навуковы або даследчы дакумент у фармаце PDF - arXiv preprint, дысертацыю, артыкул у часопісе, тэзавую артыкул - і машынны пераклад ператворыць яго ў тэкст у фармаце LaTeX. Матэматычныя раўнанні будуць выглядаць як звычайны LaTeX, шматслупковыя раскладкі будуць разгорнутыя ў парадку чытання, а цытаты і спісы крыніц будуць захаваныя. Стварана спецыяльна для пераўтварэння шчыльных навуковых дакументаў у PDF.

Нугат- база Meta — мадэль візуальнага кодэра-дэкодэра, якая была навучана на мільёнах старонак arXiv. Яна трактуе кожную старонку PDF як малюнак і выводзіць структураваны Markdown + LaTeX, таму раўнанні праходзяць правільна нават калі яны адлюстраваны як растравыя гліфы ў зыходным PDF.

Інструмент Docling (PDF у Markdown) выкарыстоўвае IBM Granite- Docling - хуткі, з улікам макетаў, аптымалізаваны для агульных бізнес- дакументаў, такіх як кантракты, справаздачы, кіраўніцтва. Nougat павольней, але НАДЗВІТ лепш для навуковых работ, бо ён спецыяльна трэніраваўся на матэматычных + шматслупковых навуковых макетах. Выкарыстоўвайце Docling для бізнес- дакументаў, Nougat для даследаванняў.

Так - гэта выдатная магчымасць. Убудаваная матэматыка вяртаецца як `$... $`, паказаныя раўнанні як `$$... $$`. Ён можа чытаць як раўнанні, адлюстраваныя ў LaTeX з arXiv, так і растравыя раўнанні, сканаваныя са старых артыкулаў. Якасць большасці артыкулаў адпавядае стандартам для публікацыі.

Дазволіць - Nougat аўтаматычна разгортвае двух- і трохслупковыя раскладкі ў правільны парадак чытання. Больш няма пераскокаў паміж слупкамі. Звесткі ў нізніх радках выцягваюцца ў блокі звестак у канцы кожнага раздзела.

Маркеры цытавання `[12]` / `(Smith 2020)` застаюцца ў радку. Спісы спасылак у канцы застаюцца з непарушным фарматаваннем, таму вы можаце перадаць вывад у Zotero / Mendeley / уласны аналізатар цытавання.

Прыблізна 8-15 секунд на старонку на нашым H200. Тыповая 10-старонка конференц-дакумента працуе ў ~ 2 хвілін. Доўгія апытальныя дакументы (50+ старонак) займаюць 8-12 хвілін - падаваць і ісці.

300 знакаў за старонку (паверх 600). 10- старонкавы артыкул на канферэнцыі = 3000 знакаў. 30- старонкавы раздзел дысертацыі = 9000 знакаў. Штодзённы бясплатны фонд дазваляе чытаць большасць даследаванняў.

Выкарыстоўвайце ChatGPT/Claude для падвядзення вынікаў працы, стварыце асабісты RAG з корпусу работ, праверце семантыку ў сваёй бібліятэцы, скапіруйце раўнанні прама ў праекты LaTeX, або проста прачытайце працу ў выглядзе звычайнага тэксту на сваім тэлефоне.

Так - Nougat робіць свой уласны крок OCR. Цифровые arXiv- запісы лепшыя (чыстае адлюстраванне раўнанняў); сканаваныя старыя дакументы таксама працуюць, але матэматычная дакладнасць неяк зніжае. Для лепшых матэматычных вынікаў на сканаваннях, перасканаваць пры 300+ DPI перад загрузкай.

Адразу апрацоўваецца, тэкставы вывад LaTeX захоўваецца (24 гадзіны ананімна / 7 дзён з заканчэннем тэрміну дзеяння платнай спасылкі), зыходны PDF выдаляецца адразу пасля выдалення. Ніколі не выкарыстоўваецца для трэніровак. / privacy / для поўнай палітыкі.

Дадзеныя аб карыстальніку //www.academic-pdf.org/files/docs/academic-pdf/files/docs/

Зарэгіструйцеся бясплатна на 30 000 знакаў

Стварыць новы рахунак

Крэдытная карта не патрабуецца

Як вы ацэньваеце гэтую прыладу?

Любіце Free.ai? Раскажыце сваім сябрам!