PDF у Markdown Выцягванне PDF Змяніць фармат тэксту Выцягванне акадэмічных дакументаў Даследчая праца ў тэкст Больш →

Выцягваньне PDF з arXiv

Камерцыйнае выкарыстанне 380+ мадэляў Без вадзянога знака Не патрабуецца рэгістрацыя

Выкіньце артыкул з arXiv, артыкул з часопіса ці тэзавую главу - машынны пераклад ператворыць іх у тэксты з густам LaTeX. Матэматычныя раўнанні застаюцца раўнаннямі, шматслупковыя раскладкі разгортваюцца, цытаты захоўваюцца. Праграмнае забеспячэнне Meta Nougat- base.

Выдаленне arXiv- тэксту, атрыманне чыстага тэксту ў стылі LaTeX з кожным раўнаннем, адлюстраваным у радку. Выкарыстанне шматслупковых раскладак, захаванне спасылак. Бясплатны, на базе машыннага навучаньня.

Як выкарыстоўваць Выцягваньне PDF з arXiv

Увядзіце ваш увод

Увядзіце тэкст, загрузіце файл або апісайце, што вы хочаце. Не патрабуецца ўліковы запіс.

Націсніце, каб стварыць

Нашы машынныя навучанні апрацоўваюць ваш запыт за секунды, выкарыстоўваючы лепшыя мадэлі з адкрытым зыходным кодам.

Сцягнуць і падзяліцца

Сцягнуць, скапіраваць або падзяліцца сваімі вынікамі. Бясплатна для асабістага і камерцыйнага выкарыстання.

Выкарыстоўваць гэтую прыладу праз API

Аўтаматызацыя гэтай інструмента з вашага кода. OpenAI- сумяшчальны REST канец, Bearer- токен аўтарызацыі, не патрабуецца дадатковы SDK. Кошт токенаў адпавядае інтэрфейсу вэб.

Дакументацыя API Атрымаць ключ API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Выцягваньне PDF з arXiv tool on: ..."}]}'

Сродкі для свабоднага разумовага інтэлекту

PDF у Markdown

Выцягванне PDF

Змяніць фармат тэксту

Выцягванне акадэмічных дакументаў

Даследчая праца ў тэкст

Выцягваньне PDF з arXiv — FAQ

Устаўце файл arXiv preprint, і машынны перакладчык ператворыць увесь дакумент у тэкст з густам LaTeX. Равенствы будуць вярнутыя як правільны LaTeX, шматслупковыя раскладкі будуць разгорнутыя, спасылкі будуць захаваныя. Пабудаваны на Meta Nougat, спецыяльна трэніраваны на мільёнах старонак arXiv.

Праграма для вывучэння корпуса Nougat была створана на аснове arXiv — таму яна выдатна працуе з сям' ёй макетаў IEEE / ACM / NeurIPS / ICML / arXiv. Іншыя праграмы для вываду PDF- файлаў не могуць справіцца з шматслупковай матэматыкай; гэтая праграма была распрацавана менавіта для гэтага.

Загрузіць PDF з arXiv (напрыклад, arxiv.org/pdf/2401.12345), загрузіць яго сюды, атрымаць адзін.txt файл з поўнай працай як LaTeX-ароматызаваны тэкст. arXiv API ключ не патрэбны; нам трэба толькі PDF.

Так, гэта функцыя загалоўка. Убудаваная матэматыка - гэта `$... $`, а паказаная матэматыка - гэта `$$... $$`. Дарэчы, нават растравыя раўнанні ў старых дакументах праглядаюцца правільна, бо мадэль разглядае кожную старонку як малюнак.

Аўтаматычнае. Двухслупковы стыль IEEE - найбольш распаўсюджаны расклад arXiv, і Nougat разгортвае яго ў правільны парадак чытання без флага настаўлення.

Так — убудаваныя `[12]` / `[Smith2020]` маркеры застаюцца там, дзе яны павінны быць, і поўны спіс крыніц у канцы выцягваецца непашкоджаным для выкарыстання BibTeX / Zotero.

~8-15 сек/старонка. 12-старонкавы дакумент на канферэнцыю займае ~2-3 хвіліны. НеурIPS-стыль 30+ старонак дакументаў з дадаткамі: 8-12 хвілін. Даслаць і сысці.

300 знакаў/старонка, паверх 600. Большасць артыкулаў канферэнцыі arXiv (8-15 старонак) маюць 2,400-4,500 знакаў. Штодзённы бясплатны фонд ахоплівае ~ 1-2 артыкулы ў дзень для ўваходных карыстальнікаў; платныя планы маюць неабмежаваную колькасць.

Вы можаце даслаць яго ў ChatGPT / Claude для "абгрунтавання гэтай працы", стварыць асабісты RAG над вашымі захаванымі працамі, правесці семантычны пошук у спісе чытання, скапіраваць раўнанні ў свой уласны праект LaTeX або прачытаць працу як звычайны тэкст на сваім тэлефоне.

Так — Nougat OCR унутрана. arXiv быў рэндаваны LaTeX на працягу 25+ гадоў, таму большасць preprints чыста лічбавыя. Старыя сканаваныя дакументы працуюць, але матэматычная дакладнасць неяк зніжаецца; перасканаваць на 300+ DPI для лепшых вынікаў.

PDF- файлы выдаляюцца адразу пасля атрымання. Вывад LaTeX захоўваецца 24 гадзіны (аноністычна) / 7 дзён (платная спасылка). Ніколі не выкарыстоўваецца для трэніровак. arXiv PDF- файлы ў любым выпадку публічныя CC- BY, але мы не захоўваем іх.

[Translation temporarily unavailable. Please try again.]

Зарэгіструйцеся бясплатна на 30 000 знакаў

Стварыць новы рахунак

Крэдытная карта не патрабуецца

Як вы ацэньваеце гэтую прыладу?

Выцягваньне PDF з arXiv

Вынікі

Як выкарыстоўваць Выцягваньне PDF з arXiv

Увядзіце ваш увод

Націсніце, каб стварыць

Сцягнуць і падзяліцца

Выкарыстоўваць гэтую прыладу праз API

Сродкі для свабоднага разумовага інтэлекту

Выцягваньне PDF з arXiv — FAQ

Што такое arXiv PDF Extractor?

Чаму менавіта arXiv?

Як я магу ім карыстацца?

Выраўнаванне праходзіць?

Парадак чытання для некалькіх слупкоў?

Захаваць цытаты?

Хуткасць?

Цэны?

Што я магу зрабіць з вывадамі?

Ці падтрымліваюцца сканаваныя файлы arXiv PDF?

Прыватнасць?

API?

Атрымаць 10,000 бясплатных жетонаў

Застаецца чакаць — атрымайце 10K бясплатных жетонаў!

Хочаце больш?