ArXiv PDF-extraktor

Kommersiell användning OK 380+ modeller Inget vattenmärke Ingen registrering behövs
Förlaga:
+ GPT-5, Claude, Gemini
Släpp en arXiv preprint, journalpapper, eller avhandling kapitel - AI omvandlar det till ren LaTeX-smakade text. Math ekvationer stanna som ekvationer, multi-kolumn layouter få unwound, citeringar bevaras. Drivs av Meta Nougat-bas.

Släpp ett forskningsdokument PDF här eller klicka för att ladda upp

PDF upp till 50 MB. ~300 polletter per sida (matt-aware).

Avläsningsekvationer + avrullande kolumner... ~10 sek/page
Avancerade alternativ
Resultat
Tokens börjar ta slut. Hämta fler tokener
Vill du ha bättre resultat? Premiemodeller (GPT-5, Claude, Gemini) levererar högre kvalitet. Visa Planer

❤️ Love this tool? Share it!

< a href="/signup/" style="color:#16A34A">Registrera dig för att få en referenslänk och tjäna 25 000 polletter per vän.

Vill du ha mer? Registrera dig gratis för 30K tokens/dag + 10K bonus
Registrera dig gratis

Bearbetning av din begäran...

Släpp en arXiv preprint, få ren LaTeX-smakad text med varje ekvation återges inline. Multi-kolumn layouter hanteras, referenser hålls intakt. Gratis, AI-driven.

Hur du använder ArXiv PDF-extraktor

1
Ange din inmatning

Skriv text, ladda upp en fil eller beskriv vad du vill. Inget konto behövs.

2
Klicka på generera

Vår AI behandlar din begäran på några sekunder med hjälp av de bästa open-source modellerna.

3
Ladda ner & resurs

Ladda ner, kopiera eller dela ditt resultat. Gratis för personligt och kommersiellt bruk.

Använd det här verktyget via API

Automatisera detta verktyg från din egen kod. OpenAI-kompatibel REST endpoint, Bearer-token auth, ingen extra SDK krävs. Token kostnader matchar webbgränssnittet.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the ArXiv PDF-extraktor tool on: ..."}]}'

ArXiv PDF-extraktor — FAQ

Drop in en arXiv preprint och AI konverterar hela papper till ren LaTeX-smakade text. Ekvationer kommer tillbaka som korrekt LaTeX, multi-kolumn layouter unwound, referenser intakt. Byggd på Meta Nougat, tränas specifikt på miljontals ArXiv sidor.

Nougat's tränings corpus var arXiv preprints — så det helt skiner på IEEE / ACM / NeurIPS / ICML / arXiv layout familj. Andra PDF-extraktorer kvävas av multi-kolumn matematik; denna var utformad för det.

Ladda ner PDF från arXiv (t.ex. arxiv.org/pdf/2401.12345), ladda upp den här, få tillbaka en enda.txt-fil med hela papperet som LaTeX-färgad text. Ingen arXiv API-nyckel behövs; vi behöver bara PDF.

Ja — det är rubriken funktionen. Inline matte är "$...$", visade matematik "$$...$$". Även raster-renderade ekvationer i äldre papper kommer igenom korrekt eftersom modellen behandlar varje sida som en bild.

Auto-handledd. Tvåkolumn IEEE-stil är den vanligaste arXiv layout och Nougat spolar upp den i rätt läsordning utan en konfigurationsflagga.

Ja – inline `[12]" / `[Smith2020]" markörer stanna där de hör hemma, och den fullständiga referenslistan i slutet extraheras intakt för nedströms BibTeX / Zotero användning.

~8-15 sek/page. En 12-sidig konferenspapper tar ~2-3 min. NeurIPS-stil 30+ sidpapper med bilagor: 8-12 min. Skicka in och gå bort.

300 polletter / sida, våning 600. De flesta arXiv konferenspapper (8-15 sidor) är 2.400-4.500 polletter. Dagligen gratis pool täcker ~1-2 papper / dag för inloggade användare; betalas planer få obegränsad.

Mata den till ChatGPT / Claude för "förklara detta papper", bygga personliga RAG över dina sparade papper, semantic-sök din läslista, kopiera ekvationer i ditt eget LaTeX-projekt, eller läsa tidningen som ren text på telefonen.

Ja — Nougat OCRs internt. arXiv har varit LaTeX-renderas i 25+ år så de flesta preprints är rena digitala. Äldre skannade papper fungerar men matte fidelity sjunker något; rescan vid 300+ DPI för bästa resultat.

PDF-filer raderas direkt efter extraktion. LaTeX-utmatningen hålls 24 timmar (anonym) / 7 dagar (betald aktielänk). Används aldrig för utbildning. arXiv PDF-filer är offentliga CC-BY i alla fall, men vi lagrar dem inte åt något håll.

Ja — POST multipart `file` till /v1/dokument/akademisk-pdf/. JSON svar med `text_url`, `sidor', `preview`, `tokens`, `share_url`. Bearer auth (sk-free-...) ger 10K gratis tokens/månad. /api/ för curl exempel.

Registrera dig gratis för 30 000 polletter

Skapa gratis konto

Inget kreditkort krävs

Hur skulle du värdera det här verktyget?

Love this tool? Share it!