arXiv PDF Extractor

Kommerzielle Nutzung OK 380+ Modelle Kein Wasserzeichen Keine Anmeldung erforderlich
Modell:
+ GPT-5, Claude, Gemini
Drop a arXiv preprint, Journal Paper, oder These Kapitel - KI wandelt es in sauberen LaTeX-geschmackten Text. Math-Gleichungen bleiben als Gleichungen, Multi-Spalten-Layouts erhalten ungewickelt, Zitate erhalten. Powered by Meta Nougat-Basis.

Lassen Sie ein Forschungspapier PDF hier fallen oder klicken Sie zum Hochladen

PDF bis 50 MB. ~300 Token pro Seite (Math-aware).

Lesegleichungen + Abrollen von Spalten... ~10 sec/page
Erweiterte Optionen
Ergebnis
Die Tokens sind knapp. Erhalten Sie mehr Token
Willst du bessere Ergebnisse? Premium-Modelle (GPT-5, Claude, Gemini) liefern eine höhere Qualität. Pläne anzeigen

❤️ Love this tool? Share it!

Sign up um einen Verweis zu erhalten und 25.000 Token pro Freund zu verdienen.

Willst du mehr? Melde dich kostenlos an für 30K Tokens/Tag + 10K Bonus
Kostenlos anmelden

Ihre Anfrage bearbeiten...

Lassen Sie einen arXiv-Vordruck fallen, erhalten Sie sauberen LaTeX-geflochtenen Text mit jeder Gleichung gerendert Inline. Multi-Spalten-Layouts behandelt, Referenzen intakt gehalten. Frei, KI-powered.

Verwendung arXiv PDF Extractor

1
Geben Sie Ihre Eingabe ein

Geben Sie Text ein, laden Sie eine Datei hoch oder beschreiben Sie, was Sie wollen.

2
Klicken Sie auf Generieren

Unsere KI verarbeitet Ihre Anfrage in Sekundenschnelle mit den besten Open-Source-Modellen.

3
Herunterladen & Teilen

Downloaden, kopieren oder teilen Sie Ihr Ergebnis. Kostenlos für den persönlichen und kommerziellen Gebrauch.

Verwenden Sie dieses Tool über API

Automatisieren Sie dieses Tool aus Ihrem eigenen Code. OpenAI-kompatible REST-Endpunkt, Bearer-Token-Auth, kein zusätzliches SDK erforderlich. Tokenkosten entsprechen der Web-Schnittstelle.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Extractor tool on: ..."}]}'

arXiv PDF Extractor — FAQ

Drop in einem arXiv-Vordruck und die KI wandelt das gesamte Papier in sauberen LaTeX-Geschmack Text. Gleichungen kommen wieder als richtige LaTeX, Multi-Spalten-Layouts ungewickelt, Referenzen intakt. Gebaut auf Meta Nougat, speziell auf Millionen von arXiv Seiten trainiert.

Nougat's Trainingskorpus war arXiv Preprints – so glänzt es absolut auf der IEEE / ACM / NeurIPS / ICML / arXiv Layout-Familie. Andere PDF-Extraktoren ersticken an Multi-Spalte-Mathematik; dieser wurde dafür entwickelt.

Laden Sie das PDF von arXiv herunter (z.B. arxiv.org/pdf/2401.12345), laden Sie es hier hoch, erhalten Sie eine einzelne.txt-Datei mit dem vollständigen Papier als LaTeX-aromatisierter Text zurück.

Ja — das ist das Hauptmerkmal. Inline-Mathematik ist `$...$`, angezeigte Mathematik `$$...$$`. Sogar raster-gerenderte Gleichungen in älteren Papieren kommen richtig durch, weil das Modell jede Seite als Bild behandelt.

Auto-handled. Zwei-Spalte IEEE-Stil ist die häufigste arXiv-Layout und Nougat löst es in richtige Lesereihenfolge ohne eine Konfigurationsflagge.

Ja — inline `[12]` / `[Smith2020]` Marker bleiben dort, wo sie hingehören, und die vollständige Referenzliste am Ende wird für die nachgeschaltete BibTeX / Zotero-Anwendung intakt extrahiert.

~8-15 sek/page. Ein 12-seitiges Konferenzpapier dauert ~2-3 min. NeurIPS-Stil 30+ Seitenpapiere mit Anhängen: 8-12 min. Abschicken und zu Fuß weg.

300 Token / Seite, Etage 600. Die meisten arXiv Konferenzpapiere (8-15 Seiten) sind 2.400-4.500 Token. Täglich kostenlos Pool deckt ~1-2 Papiere / Tag für angemeldete Benutzer; bezahlte Pläne erhalten unbegrenzt.

Feed it to ChatGPT / Claude_ for "explain this paper", bauen persönliche RAG über Ihre gespeicherten Papiere, semantisch-Suche Ihre Leseliste, kopieren Sie Gleichungen in Ihrem eigenen LaTeX-Projekt, oder lesen Sie das Papier als Klartext auf Ihrem Telefon.

Ja — Nougat OCRs intern. arXiv wurde seit über 25 Jahren LaTeX-rendered, so dass die meisten Preprints sind sauber digital. Ältere gescannte Papiere arbeiten, aber Mathetreue fällt leicht; Rescan bei 300+ DPI für beste Ergebnisse.

PDFs werden direkt nach der Extraktion gelöscht. LaTeX-Ausgabe wird 24h (anonym) / 7 Tage (paid share link) gespeichert. arXiv PDFs sind sowieso öffentlich CC-BY, aber wir speichern sie auf keinen Fall.

Ja — POST multipart `file` to /v1/document/academic-pdf/. JSON response with `text_url`, `pages`, `preview`, `tokens`, `share_url`. Bearer auth (sk-free-...) gibt 10K kostenlose Token/Monat. /api/ für Curl Beispiel.

Melde dich kostenlos an für 30.000 Token

Kostenloses Konto erstellen

Keine Kreditkarte erforderlich

Wie würden Sie dieses Tool bewerten?

Love this tool? Share it!