arXiv PDF Extractor

Përdorimi komercial OK 380+ modele Pa shenjë uji Nuk është e nevojshme regjistrimi
Modeli:
+ GPT-5, Claude, Gemini
Hidhe një preprint arXiv, një artikull të revistës, apo një kapitull teze — AI e konverton atë në tekst të pastër me shije LaTeX. Ekuacionet matematike mbeten si ekuacione, strukturimet me shumë kollona zhvendoset, citimet ruhen.

Lëshoje këtu një dokument kërkimi PDF ose kliko për të ngarkuar

PDF deri në 50 MB. ~300 tokens për faqe (math-aware).

Duke lexuar ekuacionet + duke shpalosur kollonat... ~10 sek/faqe
Mundësitë e avancuara
Rezultati
Tokenët po i mbaron. Merr më shumë token
Dëshiron rezultate më të mira? Modelet Premium (GPT-5, Claude, Gemini) ofrojnë cilësi më të lartë. Shiko Planet

❤️ Të pëlqen Free.ai?

Regjistrohu për të marrë një lidhje referuese dhe fiton 25,000 token për mik.

Do më shumë? Regjistrohu falas për 30K token/ditë + 10K bonus
Regjistrohu

Duke përpunuar kërkesën tuaj...

Hiq një preprint arXiv, merr tekst të pastër me shije LaTeX me çdo ekuacion të paraqitur në rresht. Përdoret për formatet me shumë kollona, referencat mbeten të paprekura. Lirë, me fuqi AI.

Si të përdorësh arXiv PDF Extractor

1
Shkruaj

Shkruaj tekst, ngarko një file, ose përshkruaj atë që do. Nuk duhet asnjë llogari.

2
Kliko për të krijuar

AI jonë e përpunon kërkesën tuaj në sekonda duke përdorur modelet më të mira të burimit të hapur.

3
Shkarko dhe nda

Shkarko, kopjo ose ndaje rezultatin tënd. Pa pagesë për përdorim personal dhe komercial.

Përdor këtë mjet nëpërmjet API

Automatizo këtë mjet nga kodi juaj. Pika e fundit REST e përshtatshme me OpenAI, autentifikimi me token e bartësit, nuk kërkohet SDK shtesë. Kostot e token-it përputhen me interfaqen web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Extractor tool on: ..."}]}'

arXiv PDF Extractor — FAQ

Shto një preprint arXiv dhe AI konverton të gjithë letër në tekst të pastër me shije LaTeX. Ekuacionet kthehen si LaTeX i duhur, strukturat me shumë kollona të shpërndarë, referenca të paprekura. Ndërtuar mbi Meta Nougat, trajnuar posaçërisht në miliona faqe arXiv.

Korpusi i trajnimit i Nougat ishte arXiv preprints — kështu që absolutisht shkëlqen në familjen e IEEE / ACM / NeurIPS / ICML / arXiv. Shtypësit e tjerë të PDF-ve mbysohen në matematikën me shumë kollona; ky është projektuar për këtë.

Shkarko PDF nga arXiv (p.sh. arxiv.org/pdf/2401.12345), ngarko këtu, merr një file të vetëm.txt me dokumentin e plotë si tekst me shije LaTeX. Nuk na duhet kyçi i API të arXiv; na duhet vetëm PDF.

Po — kjo është karakteristika e titullit. Matematika e brendshme është `$...$`, matematika e shfaqur është `$$...$$`. Edhe ekuacionet e raster-renderuara në dokumentet e vjetra dalin siç duhet sepse modeli trajton çdo faqe si një figurë.

Duke përdorur stilin IEEE me dy kollona është rregullimi më i zakonshëm i arXiv dhe Nougat e shpërndan atë në rendin e duhur të leximit pa një flamur konfigurimi.

Po — markat e brendshme `[12]` / `[Smith2020]` qëndrojnë ku i përkasin, dhe lista e plotë e referencës në fund nxjerret e paprekur për përdorim në BibTeX / Zotero.

~8-15 sekonda në faqe. Një dokument i konferencës prej 12 faqesh merr ~2-3 minuta. Dokumente në stilin NeurIPS me më shumë se 30 faqe me shtigje: 8-12 minuta.

300 tokens/page, floor 600. Shumica e dokumenteve të konferencës arXiv (8-15 faqe) janë 2,400-4,500 tokens. Pool i përditshëm i lirë mbulon ~1-2 dokumente në ditë për përdoruesit e regjistruar; planet e paguar marrin të pakufizuar.

Shpërndaje tek ChatGPT / Claude për "shkruaj këtë artikull", ndërto RAG personale mbi artikullet e ruajtura, kërko semantikisht në listën tënde të leximit, kopjo ekuacionet në projektin tënd LaTeX, ose lexo artikullin si tekst të thjeshtë në telefonin tënd.

Po — Nougat OCRs brenda. arXiv ka qenë në LaTeX për më shumë se 25 vjet kështu që shumica e preprints janë të pastra dixhitale. Letrat e vjetra të skanuara punojnë por besnikëria matematikore bie pak; ri-skano me 300+ DPI për rezultatet më të mira.

PDF-të eleminohen menjëherë pas nxjerrjes. Rezultati LaTeX ruhet 24 orë (anonim) / 7 ditë (lidhja e ndarjes së paguar). Nuk përdoret kurrë për trainim. PDF-të arXiv janë publike CC-BY gjithsesi, por nuk i ruajmë ato në asnjë mënyrë.

Po — POST shumëpjesëshe `file` në /v1/document/academic-pdf/. Përgjigjja JSON me `text_url`, `pages`, `preview`, `tokens`, `share_url`. Autentifikimi i mbajtësit (sk-free-…) jep 10K tokens falas/muaj. /api/ për shembull curl.

Regjistrohu falas për 10,000 token

Krijo një profil të ri

Nuk kërkohet karta e kreditit

Si do ta vlerësoni këtë mjet?

Të pëlqen Free.ai?