arXiv PDF Extractor

Commercieel gebruik OK 380+ modellen Geen watermerk Geen aanmelding nodig
Model:
+ GPT-5, Claude, Gemini
Laat een arXiv preprint, journal paper, of thesis hoofdstuk. AI zet het om in schone LaTeX-smaak tekst. Wiskunde vergelijkingen blijven als vergelijkingen, multi-column lay-outs krijgen unwound, citaten bewaard. Aangedreven door Meta Nougat-base.

Laat hier een onderzoekspaper PDF vallen of klik om te uploaden

PDF tot 50 MB. ~300 tokens per pagina (wiskunde-bewuste).

Vergelijkingen lezen + kolommen ontspannen... ~10 sec/pagina
Geavanceerde opties
Resultaat
De tokens zijn bijna op. Haal meer tokens
Wil je betere resultaten? Premiummodellen (GPT-5, Claude, Gemini) leveren een hogere kwaliteit. Weergaveplannen

❤️ Love this tool? Share it!

Aanmelden om een verwijzingslink te krijgen en 25.000 tokens per vriend te verdienen.

Wil je meer? Gratis inschrijven voor 30K tokens / dag + 10K bonus
Gratis aanmelden

Bezig met verwerken van uw verzoek...

Laat een arXiv preprint vallen, krijg schone LaTeX-smaak tekst met elke vergelijking weergegeven inline. Multi-kolom lay-outs behandeld, referenties intact gehouden. Vrij, AI-aangedreven.

Hoe gebruikt u dit middel? arXiv PDF Extractor

1
Voer uw invoer in

Typ tekst, upload een bestand of beschrijf wat u wilt. Er is geen account nodig.

2
Klik op genereren

Onze AI verwerkt uw verzoek in seconden met behulp van de beste open-source modellen.

3
Downloaden & delen

Download, kopieer of deel uw resultaat. Gratis voor persoonlijk en commercieel gebruik.

Gebruik deze tool via API

Automatiseer deze tool vanuit uw eigen code. OpenAI-compatibele REST-eindpunt, Bearer-token auth, geen extra SDK nodig. Tokenkosten komen overeen met de webinterface.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Extractor tool on: ..."}]}'

arXiv PDF Extractor — FAQ

Drop in een arXiv preprint en de AI zet het hele papier om in schone LaTeX-smaak tekst. Vergelijkingen komen terug als de juiste LaTeX, multi-column lay-outs unwound, referenties intact. Gebouwd op Meta Nougat, speciaal getraind op miljoenen arXiv pagina's.

Nougat's training corpus was arXiv preprints, zodat het absoluut schijnt op de IEEE / ACM / NeurIPS / ICML / arXiv layout familie. Andere PDF-extractors stikken op multi-kolom wiskunde; deze was ontworpen voor het.

Download de PDF van arXiv (bijv. arxiv.org/pdf/2401.12345), upload het hier, krijg een enkel.txt bestand terug met het volledige papier als LaTeX-gearomatiseerde tekst. Geen arXiv API sleutel nodig; we hebben alleen de PDF nodig.

Ja, dat is de kop functie. Inline wiskunde is $...$..$$$...$$... zelfs raster-rendered vergelijkingen in oudere papieren correct komen omdat het model behandelt elke pagina als een afbeelding.

Twee-kolom IEEE-stijl is de meest voorkomende arXiv lay-out en Nougat ontspant het tot een juiste leesvolgorde zonder een configuratievlag.

Ja, inline markers blijven waar ze thuishoren, en de volledige referentielijst aan het einde is intact voor downstream BibTeX / Zotero gebruik.

~8-15 sec/pagina. Een 12 pagina's tellend conferentiedocument duurt ~2-3 min. NeurIPS-stijl 30+ pagina's met bijlagen: 8-12 min. Inleveren en weglopen.

300 tokens/pagina, verdieping 600. De meeste arXiv conferentiepapieren (8-15 pagina's) zijn 2.400-4.500 tokens. Dagelijks gratis zwembad covers ~1-2 papieren/dag voor ingelogde gebruikers; betaalde plannen onbeperkt.

Feed it to ChatGPT / Claude for "explain this paper," build personal RAG over your saved papers, semantic-search your reading list, copy vergelijkingen in your own LaTeX project, or read the paper as plain text on your phone.

Ja, Nougat OCRs intern. arXiv is LaTeX-rendered voor 25+ jaar, zodat de meeste preprints zijn schoon digitaal. Oudere gescande papieren werken maar wiskunde trouw daalt licht; herscannen op 300+ DPI voor de beste resultaten.

PDF's verwijderd direct na extractie. LaTeX output wordt 24h (anonieme) / 7 dagen gehouden (betaalde deellink). Nooit gebruikt voor training. arXiv PDF's zijn sowieso publieke CC-BY, maar we slaan ze niet op beide manieren op.

Ja, POST multipart-bestand... naar /v1/document/academisch-pdf/. JSON response met tekst_url..., pagina's, preview..., Tokens..., Share_url... Bearer auth (sk-free-...) geeft 10K gratis tokens/maand. /api/ voor krul bijvoorbeeld.

Gratis aanmelden voor 30.000 tokens

Vrije account aanmaken

Geen creditcard vereist

Hoe zou je dit gereedschap beoordelen?

Love this tool? Share it!