extractor PDF arXiv

Utilizare comercială OK 380+ modele Fără semn de apă Nu este nevoie de înscriere
Model:
+ GPT-5, Claude, Gemini
Aruncați o pretipărire arXiv, ziarul, sau capitolul tezei — IA-l transformă în text curat cu gust LaTeX. Ecuațiile matematice rămân ca ecuații, planurile multi-columna devin neschimbate, citații conservate. Powered by Meta Nougat-base.

Aruncă o hârtie de cercetare PDF aici sau click pentru a încărca

PDF până la 50 MB. ~300 tokens pe pagină (math-aware).

Ecuații de citire + coloane dezboaie... ~10 sec/page
Opțiuni avansate
Rezultatul
Tokens scade. Obține mai multe tokens
Vrei rezultate mai bune? Modele premium (GPT-5, Claude, Gemini) oferă o calitate mai mare. Vizualizare planuri

❤️ Love this tool? Share it!

Inscrie-te pentru a obține o legătură de referință și câștiga 25.000 de jetoni pe prieten.

Vrei mai mult? Inregistreaza-te gratis pentru 30K tokens/zi + 10K bonus
Inscrie-te gratis

Prelucrarea cererii...

Aruncați o pretipărire arXiv, obțineți text curățat cu sabor LaTeX cu fiecare ecuație respinsă inline. Layouturi multi-columna manipulate, referințe păstrate intact. Gratuit, alimentat de IA.

Cum să utilizaţi extractor PDF arXiv

1
Introduceți intrarea

Tastați text, încărcați un fișier sau descrieți ce doriți. Nu este nevoie de cont.

2
Click generare

IA noastra proceseaza cererea ta in secunde folosind cele mai bune modele de open-source.

3
Descărcați & împărțiți

Descărcaţi, copiaţi sau împărtăşiţi rezultatul. Gratuit pentru utilizare personală şi comercială.

Folosește acest instrument prin API

Automatizați acest instrument din propriul cod. Endpoint REST-compatibil cu OpenAI, Bearer-token auth, nu este necesar SDK suplimentar. Costurile token corespunde interfață web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the extractor PDF arXiv tool on: ..."}]}'

extractor PDF arXiv — FAQ

Aruncați într-o pre-imprimare arXiv și IA transformă întreaga hârtie în text curat cu sabor LaTeX. Ecuațiile se întorc ca layout LaTeX, multi-columna corespunzător, referințe intact. Construit pe Meta Nougat, instruit în special pe milioane de pagini arXiv.

Corpusul de antrenament Nougat a fost pre-imprimate arXiv - astfel încât strălucește absolut pe IEEE / ACM / NeuriPS / ICML / arXiv layout familie. Alte extractoare PDF sufocă pe matematică multi-columna; acesta a fost proiectat pentru el.

Descarcă PDF-ul de la arXiv (de exemplu arxiv.org/pdf/2401.12345), încărcați-l aici, obțineți un singur fișier.txt cu hârtia completă ca text cu sabor LaTeX. Nu este nevoie de cheie API arXiv; avem nevoie doar de PDF.

Da - aceasta este caracteristica de titlu. Matematica inline este `$...$`, afișat matematică `$...$`. Chiar și ecuațiile renunțate raster în hârtii vechi vin prin corect deoarece modelul tratează fiecare pagină ca o imagine.

Auto-managed. IEEE-style de două coloane este cea mai frecventă layout arXiv și Nougat o deplasează în ordine de lectură adecvată fără un steag de configurare.

Da — inline `[12]` / `[Smith2020]`'să rămână unde aparțin, iar lista completă de referință de la sfârșit este extrasă intact pentru utilizarea BibTeX în aval / Zotero.

~8-15 sec/page. O hârtie de conferință de 12 pagini ia ~2-3 min. Nourips-style 30+ hârtii de pagini cu apendice: 8-12 min. Trimite și pleacă.

300 tokens/page, etajul 600. Cele mai multe documente de conferință arXiv (8-15 pagini) sunt 2.400-4.500 jetonuri. Piscina gratuită zilnic acoperă ~1-2 hârtii/zi pentru utilizatorii semnați; planurile plătite obtine nelimitat.

Alimentați-l la ChatGPT / Claude pentru "explicați acest hârtie", construiți RAG personal pe hârtiile salvate, semantic-cercați lista de lectură, copiați ecuațiile în propriul proiect LaTeX, sau citiți hârtia ca text simplu pe telefon.

Da — Nougat OCR intern. arXiv a fost remis LaTeX de 25 de ani, deci majoritatea pre-imprimantelor sunt digitale curate. Lucrări mai vechi scanate, dar fidelitatea matematică scade ușor; reescand la 300+ DPI pentru cele mai bune rezultate.

PDF-uri șterse imediat după extracție. Ieșirea LaTeX este păstrată 24h (anonim) / 7 zile (asociere de acțiuni plătite). Niciodată folosit pentru antrenament. arXiv PDF-uri sunt public CC-BY oricum, dar noi nu le stoca în nici un fel.

Da — POST multipart `file` to /v1/document/academic-pdf /. Răspunsul JSON cu `text_url`, `pages`, `preview`, `tokens`, `share_url`. Bear auth (free-sk-...) oferă 10K jet/luna gratuit. /api/ pentru exemplu curl.

Inscrie-te gratis pentru 10.000 de jetoni

Creează cont liber

Nu sunt necesare carduri de credit

Cum ai evalua acest instrument?

Love this tool? Share it!