arXiv PDF Extractor

Użu kummerċjali OK 380 + mudelli L-ebda marka tal-ilma Ebda sign-up meħtieġa
Mudell:
+ GPT-5, Claude, Gemini
Aqta' preprint ta' arXiv, karta ta' ġurnal, jew kapitolu ta' teżi — l-AI tikkonvertih f'test nadif bit-togħma ta' LaTeX. L-ekwazzjonijiet matematiċi jibqgħu bħala ekwazzjonijiet, it-tqassim b'diversi kolonni jinfetaħ, il-kwotazzjonijiet jinżammu.

Waqqa' l-PDF tar-riċerka hawn jew ikklikkja biex ittella'

PDF sa 50 MB. ~300 tokens għal kull paġna (matematika konxja).

Qari ekwazzjonijiet + unwinding kolonni... ~ 10 sekonda/paġna
Għażliet avvanzati
Riżultat
Tokens qed jaħdem baxx. Ikseb aktar Tokens
Tixtieq riżultati aħjar? Mudelli premium (GPT-5, Claude, Gemini) jipprovdu kwalità ogħla. Ara l-Pjanijiet

❤️ Imħabba Free.ai? Għid lill-ħbieb tiegħek!

Irreġistra biex tikseb link ta' referenza u taqla' 25,000 tokens għal kull ħabib.

Trid aktar? Irreġistra b'xejn għal 30K tokens/jum + 10K bonus
Irreġistra b'xejn

Ipproċessar tal-applikazzjoni tiegħek...

Drop preprint arXiv, tikseb test nadif LaTeX-togħma ma kull ekwazzjoni magħmula inline. Multi-kolonna layouts mmaniġġjati, referenzi miżmuma intatti.

Kif għandek tuża arXiv PDF Extractor

1
Daħħal l-input tiegħek

Ittajpja test, ittella' fajl, jew iddeskrivi dak li trid. M'hemmx bżonn ta' kont.

2
Ikklikkja Iġġenera

AI tagħna tipproċessa t-talba tiegħek f'sekondi billi tuża l-aħjar mudelli open-source.

3
Niżżel & jaqsmu

Niżżel, kopja, jew jaqsmu r-riżultat tiegħek. Ħieles għall-użu personali u kummerċjali.

Uża din l-għodda permezz tal-API

Awtomatizza din l-għodda mill-kodiċi tiegħek stess. OpenAI-kompatibbli REST endpoint, Bearer-token awth, l-ebda SDK żejda meħtieġa.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Extractor tool on: ..."}]}'

arXiv PDF Extractor — FAQ

Meta tpoġġi preprint ta’ arXiv, l-AI tikkonverti l-karta kollha f’test nadif b’togħma ta’ LaTeX. L-ekwazzjonijiet jiġu lura bħala LaTeX xieraq, it-tqassim ta’ kolonni multipli maħlul, ir-referenzi intatta.

Il-korpus tat-taħriġ ta' Nougat kien preprints ta' arXiv — għalhekk assolutament jispikka fuq il-familja ta' layouts ta' IEEE/ACM/NeurIPS/ICML/arXiv.Estratturi oħra ta' PDF iħabbtu wiċċhom ma' matematika b'ħafna kolonni; dan kien iddisinjat għalih.

Niżżel il-PDF minn arXiv (eż. arxiv.org/pdf/2401.12345), ittella’ hawn, u ġib lura fajl.txt wieħed bil-karta sħiħa bħala test b’togħma LaTeX. M’hemmx bżonn ta’ arXiv API key; għandna bżonn biss il-PDF.

Iva — dik hija l-karatteristika tal-intestatura. Il-matematika inline hija `$...$`, il-matematika murija hija `$$...$$`. Anki l-ekwazzjonijiet raster-rendered f'karti aktar antiki jgħaddu b'mod korrett minħabba li l-mudell jittratta kull paġna bħala immaġni.

L-istil IEEE b'żewġ kolonni huwa l-aktar tqassim komuni ta' arXiv u Nougat iġibu f'ordni ta' qari xieraq mingħajr bandiera ta' konfigurazzjoni.

Iva — il-markaturi inline `[12]` / `[Smith2020]` jibqgħu fejn jappartjenu, u l-lista sħiħa tar-referenzi fl-aħħar tiġi estratta intatta għall-użu downstream ta' BibTeX / Zotero.

~8-15 sekonda/paġna. Dokument ta’ konferenza ta’ 12-il paġna jieħu ~2-3 minuti. Dokumenti ta’ 30+ paġna bl-appendiċijiet fl-istil ta’ NeurIPS: 8-12-il minuta.

Ħafna mill-artikli tal-konferenza ta' arXiv (8-15-il paġna) huma 2,400-4,500 token. Il-pool b'xejn ta' kuljum ikopri ~1-2 artikli/jum għall-utenti li jkunu ffirmaw; il-pjanijiet imħallsa jġibu l-limitu.

Iforniha lil ChatGPT / Claude għal "spjega dan id-dokument", ibni RAG personali fuq id-dokumenti ssejvjati tiegħek, tfittxija semantika tal-lista tal-qari tiegħek, kopja ta' ekwazzjonijiet fil-proġett LaTeX tiegħek stess, jew aqra d-dokument bħala test sempliċi fuq it-telefon tiegħek.

Iva — Nougat OCRs internament. arXiv ilu jintuża fil-LaTeX għal 25 sena u aktar, għalhekk il-biċċa l-kbira tal-preprints huma diġitali. Il-karti skennjati aktar antiki jaħdmu iżda l-fedeltà tal-matematika tonqos ftit; iskennja mill-ġdid b'300+ DPI għall-aħjar riżultati.

Il-PDFs jitħassru eżatt wara l-estrazzjoni. Il-produzzjoni LaTeX tinżamm 24 siegħa (anonimità) / 7 ijiem (link ta' qsim imħallas). Qatt ma tintuża għat-taħriġ. arXiv PDFs huma CC-BY pubbliċi xorta waħda, iżda ma nħażnuhomx b'xi mod.

Iva — POST multipart `file` to /v1/document/academic-pdf/. JSON response with `text_url`, `pages`, `preview`, `tokens`, `share_url`. Bearer auth (sk-free-…) jagħti 10K tokens b'xejn/xahar. /api/ for curl example.

Irreġistra b'xejn għal 30,000 tokens

Oħloq Kont Ħieles

Ebda karta ta' kreditu meħtieġa

Kif tirraporta din l-għodda?

Imħabba Free.ai? Għid lill-ħbieb tiegħek!