Выцягваньне PDF з arXiv

Камерцыйнае выкарыстанне 380+ мадэляў Без вадзянога знака Не патрабуецца рэгістрацыя
Модэль:
+ GPT-5, Claude, Gemini
Выкіньце артыкул з arXiv, артыкул з часопіса ці тэзавую главу - машынны пераклад ператворыць іх у тэксты з густам LaTeX. Матэматычныя раўнанні застаюцца раўнаннямі, шматслупковыя раскладкі разгортваюцца, цытаты захоўваюцца. Праграмнае забеспячэнне Meta Nougat- base.

Захаваць файл у фармаце PDF

1500 — 3000 гадоў да н.э. — перыяд эвалюцыі чалавецтва (пачатак эоцена).

Чытанне раўнанняў + разгортванне слупкоў... ~ 10 сек/ старонка
Адмысловыя параметры
Вынікі
Не хапае значкоў. Атрымаць больш значкоў
Вы хочаце лепшыя вынікі? Модулі Premium (GPT-5, Claude, Gemini) даюць больш высокую якасць. Прагляд планаў

❤️ Любіце Free.ai? Раскажыце сваім сябрам!

Зарэгіструйцеся, каб атрымаць спасылку і атрымаць 25 000 знакаў на сябра.

Хочаце больш? Зарэгіструйцеся бясплатна на 30K знакаў / дзень + 10K бонус
Зарэгіструйцеся

Апрацоўка запыту...

Выдаленне arXiv- тэксту, атрыманне чыстага тэксту ў стылі LaTeX з кожным раўнаннем, адлюстраваным у радку. Выкарыстанне шматслупковых раскладак, захаванне спасылак. Бясплатны, на базе машыннага навучаньня.

Як выкарыстоўваць Выцягваньне PDF з arXiv

1
Увядзіце ваш увод

Увядзіце тэкст, загрузіце файл або апісайце, што вы хочаце. Не патрабуецца ўліковы запіс.

2
Націсніце, каб стварыць

Нашы машынныя навучанні апрацоўваюць ваш запыт за секунды, выкарыстоўваючы лепшыя мадэлі з адкрытым зыходным кодам.

3
Сцягнуць і падзяліцца

Сцягнуць, скапіраваць або падзяліцца сваімі вынікамі. Бясплатна для асабістага і камерцыйнага выкарыстання.

Выкарыстоўваць гэтую прыладу праз API

Аўтаматызацыя гэтай інструмента з вашага кода. OpenAI- сумяшчальны REST канец, Bearer- токен аўтарызацыі, не патрабуецца дадатковы SDK. Кошт токенаў адпавядае інтэрфейсу вэб.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Выцягваньне PDF з arXiv tool on: ..."}]}'

Выцягваньне PDF з arXiv — FAQ

Устаўце файл arXiv preprint, і машынны перакладчык ператворыць увесь дакумент у тэкст з густам LaTeX. Равенствы будуць вярнутыя як правільны LaTeX, шматслупковыя раскладкі будуць разгорнутыя, спасылкі будуць захаваныя. Пабудаваны на Meta Nougat, спецыяльна трэніраваны на мільёнах старонак arXiv.

Праграма для вывучэння корпуса Nougat была створана на аснове arXiv — таму яна выдатна працуе з сям' ёй макетаў IEEE / ACM / NeurIPS / ICML / arXiv. Іншыя праграмы для вываду PDF- файлаў не могуць справіцца з шматслупковай матэматыкай; гэтая праграма была распрацавана менавіта для гэтага.

Загрузіць PDF з arXiv (напрыклад, arxiv.org/pdf/2401.12345), загрузіць яго сюды, атрымаць адзін.txt файл з поўнай працай як LaTeX-ароматызаваны тэкст. arXiv API ключ не патрэбны; нам трэба толькі PDF.

Так, гэта функцыя загалоўка. Убудаваная матэматыка - гэта `$... $`, а паказаная матэматыка - гэта `$$... $$`. Дарэчы, нават растравыя раўнанні ў старых дакументах праглядаюцца правільна, бо мадэль разглядае кожную старонку як малюнак.

Аўтаматычнае. Двухслупковы стыль IEEE - найбольш распаўсюджаны расклад arXiv, і Nougat разгортвае яго ў правільны парадак чытання без флага настаўлення.

Так — убудаваныя `[12]` / `[Smith2020]` маркеры застаюцца там, дзе яны павінны быць, і поўны спіс крыніц у канцы выцягваецца непашкоджаным для выкарыстання BibTeX / Zotero.

~8-15 сек/старонка. 12-старонкавы дакумент на канферэнцыю займае ~2-3 хвіліны. НеурIPS-стыль 30+ старонак дакументаў з дадаткамі: 8-12 хвілін. Даслаць і сысці.

300 знакаў/старонка, паверх 600. Большасць артыкулаў канферэнцыі arXiv (8-15 старонак) маюць 2,400-4,500 знакаў. Штодзённы бясплатны фонд ахоплівае ~ 1-2 артыкулы ў дзень для ўваходных карыстальнікаў; платныя планы маюць неабмежаваную колькасць.

Вы можаце даслаць яго ў ChatGPT / Claude для "абгрунтавання гэтай працы", стварыць асабісты RAG над вашымі захаванымі працамі, правесці семантычны пошук у спісе чытання, скапіраваць раўнанні ў свой уласны праект LaTeX або прачытаць працу як звычайны тэкст на сваім тэлефоне.

Так — Nougat OCR унутрана. arXiv быў рэндаваны LaTeX на працягу 25+ гадоў, таму большасць preprints чыста лічбавыя. Старыя сканаваныя дакументы працуюць, але матэматычная дакладнасць неяк зніжаецца; перасканаваць на 300+ DPI для лепшых вынікаў.

PDF- файлы выдаляюцца адразу пасля атрымання. Вывад LaTeX захоўваецца 24 гадзіны (аноністычна) / 7 дзён (платная спасылка). Ніколі не выкарыстоўваецца для трэніровак. arXiv PDF- файлы ў любым выпадку публічныя CC- BY, але мы не захоўваем іх.

[Translation temporarily unavailable. Please try again.]

Зарэгіструйцеся бясплатна на 30 000 знакаў

Стварыць новы рахунак

Крэдытная карта не патрабуецца

Як вы ацэньваеце гэтую прыладу?

Любіце Free.ai? Раскажыце сваім сябрам!