arXiv PDF Extractor

Εμπορική χρήση OK 380+ μοντέλα Χωρίς υδατογράφημα Δεν χρειάζεται εγγραφή.
Υπόδειγμα:
+ GPT-5, Claude, Gemini
Drop an arXiv preprint, journal paper, or thesis chapter — AI converts it into clean LaTeX-flavored text. Math equations stay as equations, multi-column layouts get unwound, citations preserved. Powered by Meta Nougat-base.

Drop a research paper PDF here or click to upload

PDF up to 50 MB. ~300 tokens per page (math-aware).

Reading equations + unwinding columns… ~10 sec/page
Προηγμένες επιλογές
Αποτέλεσμα
Ο Τόκενς τελειώνει. Get More Tokens
Want better results? Μοντέλα Premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Sign up to get a reference link and κερδίζουν 25.000 μάρκες ανά φίλο.

Θέλεις κι άλλο; ΕΓΓΡΑΦΕΙΤΕ δωρεάν για 5K μάρκες/ημέρα + 10K μπόνους
Εγγραφή δωρεάν

Επεξεργάζεται το αίτημά σας...

Drop an arXiv preprint, get clean LaTeX-flavored text with every equation rendered inline. Multi-column layouts handled, references kept intact. Free, AI-powered.

Πώς να χρησιμοποιήσετε το φάρμακο arXiv PDF Extractor

1
Εισάγετε την εισαγωγή σας

Πληκτρολογήστε το κείμενο, ανεβάστε ένα αρχείο, ή περιγράψτε τι θέλετε.

2
Κάντε κλικ στη δημιουργία

Η AI μας επεξεργάζεται το αίτημά σας σε δευτερόλεπτα χρησιμοποιώντας τα καλύτερα μοντέλα ανοικτού κώδικα.

3
Κατεβάστε & μερίδιο

Κατεβάστε, αντιγράψτε ή μοιραστείτε το αποτέλεσμα σας. Δωρεάν για προσωπική και εμπορική χρήση.

Χρησιμοποιήστε αυτό το εργαλείο μέσω API

Αυτόματη επεξεργασία αυτού του εργαλείου από το δικό σας κώδικα. OpenAI συμβατό σημείο REST, Bearer-token auth, δεν απαιτείται επιπλέον SDK. Token κόστος ταιριάζει με τη διεπαφή ιστού.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Extractor tool on: ..."}]}'

arXiv PDF Extractor — FAQ

Drop in an arXiv preprint and the AI converts the entire paper into clean LaTeX-flavored text. Equations come back as proper LaTeX, multi-column layouts unwound, references intact. Built on Meta Nougat, trained specifically on millions of arXiv pages.

Nougat's training corpus was arXiv preprints — so it absolutely shines on the IEEE / ACM / NeurIPS / ICML / arXiv layout family. Other PDF extractors choke on multi-column math; this one was designed for it.

Download the PDF from arXiv (e.g. arxiv.org/pdf/2401.12345), upload it here, get back a single .txt file with the full paper as LaTeX-flavored text. No arXiv API key needed; we just need the PDF.

Yes — that's the headline feature. Inline math is `$...$`, displayed math `$$...$$`. Even raster-rendered equations in older papers come through correctly because the model treats each page as an image.

Auto-handled. Two-column IEEE-style is the most common arXiv layout and Nougat unwinds it into proper reading order without a config flag.

Yes — inline `[12]` / `[Smith2020]` markers stay where they belong, and the full reference list at the end is extracted intact for downstream BibTeX / Zotero use.

~8-15 sec/page. A 12-page conference paper takes ~2-3 min. NeurIPS-style 30+ page papers with appendices: 8-12 min. Submit and walk away.

300 tokens/page, floor 600. Most arXiv conference papers (8-15 pages) are 2,400-4,500 tokens. Daily free pool covers ~1-2 papers/day for signed-in users; paid plans get unlimited.

Feed it to ChatGPT / Claude for "explain this paper", build personal RAG over your saved papers, semantic-search your reading list, copy equations into your own LaTeX project, or read the paper as plain text on your phone.

Yes — Nougat OCRs internally. arXiv has been LaTeX-rendered for 25+ years so most preprints are clean digital. Older scanned papers work but math fidelity drops slightly; rescan at 300+ DPI for best results.

PDFs deleted right after extraction. LaTeX output is kept 24h (anonymous) / 7 days (paid share link). Never used for training. arXiv PDFs are public CC-BY anyway, but we don't store them either way.

Yes — POST multipart `file` to /v1/document/academic-pdf/. JSON response with `text_url`, `pages`, `preview`, `tokens`, `share_url`. Bearer auth (sk-free-…) gives 10K free tokens/month. /api/ for curl example.

Εγγραφείτε δωρεάν για 10.000 μάρκες

Δημιουργία ελεύθερου λογαριασμού

Δεν απαιτείται πιστωτική κάρτα

Πώς θα αξιολογούσες αυτό το εργαλείο;

Love this tool? Share it!