АрXiv PDF екстрактор

Търговско ползване ОК 380+ модели Няма воден знак Няма нужда от регистрация.
Модел:
+ GPT-5, Claude, Gemini
Пуснете arXiv предпечат, дневник хартия, или дисертация глава — ИИ го преобразува в чист текст, ароматизиран от LaTeX. Математичните уравнения остават като уравнения, мулти-колонове графики получават незапазени, цитати запазени. Захранван от Meta Nougat-база.

Пуснете изследователска книга PDF тук или кликнете за качване

PDF до 50 MB. ~300 жетони на страница (мати-съзнаване).

Четене на уравнения + развити колони... ~10 сек/страница
Напредни опции
Резултат
Токените свършват. Намерете още токове
Искаш ли по-добри резултати? Модели на премиум (GPT-5, Claude, Gemini) осигурява по-високо качество. Преглед на плановете

❤️ Love this tool? Share it!

Запишете се за да получите референтна връзка и печелете 25 000 жетона на приятел.

Искаш ли още? Регистрирайте се безплатно за 30K жетони/дневен + 10K бонус
Запишете се безплатно

Обработка на искането ви...

Пускане на arXiv предпечат, получаване на чист текст с LaTeX аромат с всяко изработено уравнение в линия. Многоколонни графики се обработват, препратки се държат непокътнати. Свободни, ИИ-мощни.

Как да използвате АрXiv PDF екстрактор

1
Въведете входа си

Въведете текст, качите файл или опишете какво искате. Няма нужда от акаунт.

2
Кликнете върху генериране

Нашата ИИ обработва вашето искане в секунди с помощта на най-добрите отворени модели.

3
Изтегляне и споделяне

Изтегляне, копие или споделяне на резултата си. Безплатно за лична и търговска употреба.

Използване на този инструмент чрез API

Автоматизирайте този инструмент от вашия код. Компатибилна с OpenAI REST крайна точка, автентизация на носителя, не е необходима допълнителна SDK. Такен разходи съответстват на уеб интерфейса.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the АрXiv PDF екстрактор tool on: ..."}]}'

АрXiv PDF екстрактор — FAQ

Капка в arXiv предварително отпечатък и ИИ преобразува цялата хартия в чист текст с LaTeX аромат. Уравнения се връщат като правилно LaTeX, многоколонови разпределителни компонации, препратки непокътнати. Построени на Meta Nougat, обучени специално на милиони arXiv страници.

Обучаващият корпус на Nougat е arXiv предпечатни отпечатъци — така че тя напълно блести върху IEEE / ACM / NeuriPS / ICML / arXiv layout family. Други PDF екстрактори се задушават от многоколонова математика; този е проектиран за него.

Изтеглете PDF от arXiv (напр. arxiv.org/pdf/2401.12345), качете го тук, получите един.txt файл с пълна хартия като текст с LaTeX. Без arXiv API ключ трябва; ние просто се нуждаем от PDF.

Да — това е заглавието. Вътрешната математика е `$...$', показана математика `$...$'. Дори растрови уравнения в по-стари статии идват правилно, защото моделът третира всяка страница като изображение.

Автоматично обработване. Двуколонков IEEE-style е най-често срещаното arXiv оформление и Nougat го отваря в правилен ред за четене без конфигурационен флаг.

Да — в линия `[12]` / `[Smith2020]’ маркери остават там, където принадлежат, а пълният референтен списък в края се извлича непокътнат за употребата на BibTeX / Zotero.

~8-15 сек/страница. 12 страници конференционен документ взема ~2-3 мин. NeuriPS-style 30+ страници документи с добавки: 8-12 мин. Предайте и си вървите.

300 жетони/страница, пода 600. Повечето arXiv конференционни документи (8-15 страници) са 2400-4.500 жетона. Дневен свободен басейн обхваща ~1-2 документи/дневна за регистрирани потребители; платени планове се неограничен.

Нахранете го за ChatGPT Claude за "обясни тази книга", изграждане на лични RAG върху запазените си документи, семантично-търсете списъка за четене, копиране на уравнения във вашия собствен проект LaTeX, или прочетете хартия като обикновен текст на вашия телефон.

Да — Nougat OCRs вътрешно. arXiv е бил предаден от LaTeX в продължение на 25+ години, така че повечето предварително отпечатъци са чисти цифрови. Старите сканирани документи работа, но математична верност пада леко; ресканиране на 300+ DPI за най-добри резултати.

PDF изтрити веднага след екстракцията. Изходът от LaTeX се съхранява 24 часа (анонимно) / 7 дни (платена акция връзка). Никога не се използва за обучение. arXiv PDFs са публични CC-BY така или иначе, но ние не ги съхраняваме така или иначе.

Да — POST multipart `file` to /v1/document/academic-pdf /. JSON отговор с `text_url`, `pages`, `preview`, `tokens`, `share_url`. Носителът автентифицира (sk-freee-...) дава 10K безплатни жетони/месец. /api/ за къдрав пример.

Запишете се безплатно за 30 000 жетона

Създаване на безплатна сметка

Няма нужда от кредитна карта

Как би оценил този инструмент?

Love this tool? Share it!