arXiv Вытяжное устройство PDF

Коммерческое использование 380+ модели Нет водяного знака Нет необходимости в регистрации
Модель:
+ GPT-5, Claude, Gemini
Брось предпечатку arXiv, газету или главу диссертации — ИИ преобразует его в чистый текст LaTeX. Математические уравнения остаются в качестве уравнений, многоколумбовые компоновки удаляются, ссылки сохранены. При помощи Meta Nougat-базы.

Брось исследовательскую бумагу PDF здесь или нажмите на загрузку

PDF до 50 МБ. ~ 300 символов на страницу (показатель математики).

Уравнения чтения + размораживание колонок... ~10 секунд/страница
Дополнительные варианты
Результат
Токены кончаются. Возьмите больше токенов
Хочешь получить результаты получше? Модели премиума (GPT-5, Claude, Gemini) обеспечивает более высокое качество. Планы просмотра

❤️ Love this tool? Share it!

Подпишитесь , чтобы получить ссылку на направление и заработать 25 000 символов на друга.

Хочешь еще? Бесплатно подписывайтесь за 30K символов/день + 10K бонус
Не подписываться

Обработка вашей просьбы...

Бросьте предпечатку arXiv, получите чистый текст с латексом LaTeX с каждым уравнением, переведенным в линию. Множественные компоновки обработаны, ссылки сохранены. Свободный, с АИ.

Как пользоваться arXiv Вытяжное устройство PDF

1
Введите свой вход

Введите текст, загрузите файл или опишите, что вам нужно.

2
Нажмите на генератор

Наша АИ обрабатывает ваш запрос в секунды с использованием лучших моделей с открытым исходным кодом.

3
Загрузить & долю

Загружайте, копируете или делитесь результатами. Бесплатно для личного и коммерческого использования.

Использовать этот инструмент через API

Автоматизировать этот инструмент из своего собственного кода. OpenAI-совместимый REST конечный пункт, Bearer-Tken Auth, не требуется дополнительных SDK. Затраты соответствуют веб-интерфейсу.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv Вытяжное устройство PDF tool on: ..."}]}'

arXiv Вытяжное устройство PDF — FAQ

Сбросить предпечатку arXiv, и ИИ преобразует всю бумагу в чистый текст с латексом LaTeX. Уравнения возвращаются как правильные LaTeX, многоколумбовые компоновки не загорелись, ссылки не повреждены. Построен на Meta Nougat, специально обученный миллионам страниц arXiv.

Тренировочный корпус Nougat был arXiv preprints — так что он сияет на IEEE / ACM / NeurIPS / ICML / arXiv. Другие экстракторы PDF подавились многоколумбовой математикой; эта была разработана для этого.

Загрузить PDF из arXiv (например, arxiv.org/pdf/2401.12345), загрузить его здесь, вернуть один файл.txt с полной бумагой как LaTeX-flavored текст. Не нужен ключ ArXiv API; нам просто нужен PDF.

Да, это заголовок. Встроенная математика — $...$, показана математика $$$$$. Даже растровые уравнения в старых газетах проходят правильно, потому что модель рассматривает каждую страницу как изображение.

Двухколумбовый стиль IEEE является самым распространенным форматом arXiv, и Нугат отключает его в правильном порядке чтения без конвейерного флага.

Да — встроенные маркеры «[12]»/ «[Smith2020]» остаются там, где они принадлежат, и полный справочный список в конце извлекается нетронутым для последующего использования BibTeX/Зотеро.

~8-15 секунд/страница. 12 страниц конференционного документа занимает ~2-3 минуты. 30+ страниц в формате NeurIPS с добавлениями: 8-12 мин. Отправляйте и уходите.

600. Большинство конференционных документов Арксива (8-15 страниц) представляют собой 2400-4 500 символов. " Ежедневно бесплатный " бильярдный обложок ~1-2 бумаги в день для подписываемых пользователей; оплачиваемые планы становятся неограниченными.

Направьте это в ChatGPT / Claude для "объяснения этой работы", создайте персональную ОВЗ над вашими сохранёнными бумагами, семантически изучите ваш список чтения, копируете уравнения в вашем собственном проекте LaTeX или прочтите бумагу как простой текст на вашем телефоне.

Да, ноугат ОЦР внутри себя. arXiv был выдан LaTeX в течение 25+ лет, так что большинство предварительных отпечатков являются чистыми цифровыми. Старые отсканированные бумаги работают, но математическая достоверность слегка снижается; ресканирование на 300+ ДОИ для наилучших результатов.

PDF удаляются сразу же после извлечения. Выход LaTeX поддерживается 24 часа (анонимный) / 7 дней (оплачиваемая ссылка на акции). Никогда не используется для тренировки. arXiv PDF в любом случае являются публичным CC-BY, но мы не храним их в любом случае.

Да - POST многочастотный "file" - /v1/document/academic-pdf/.

Запишитесь бесплатно за 30 000 жетонов.

Создать свободный счет

Кредитная карта не требуется

Как бы вы оценили этот инструмент?

Love this tool? Share it!