PDF në Markdown PDF Extractor PDF në tekst Zgjidhja e Dokumenteve Akademike Dokumenti kërkimor në tekst Më shumë →

arXiv PDF Extractor

Përdorimi komercial OK 380+ modele Pa shenjë uji Nuk është e nevojshme regjistrimi

Hidhe një preprint arXiv, një artikull të revistës, apo një kapitull teze — AI e konverton atë në tekst të pastër me shije LaTeX. Ekuacionet matematike mbeten si ekuacione, strukturimet me shumë kollona zhvendoset, citimet ruhen.

Hiq një preprint arXiv, merr tekst të pastër me shije LaTeX me çdo ekuacion të paraqitur në rresht. Përdoret për formatet me shumë kollona, referencat mbeten të paprekura. Lirë, me fuqi AI.

Si të përdorësh arXiv PDF Extractor

Shkruaj

Shkruaj tekst, ngarko një file, ose përshkruaj atë që do. Nuk duhet asnjë llogari.

Kliko për të krijuar

AI jonë e përpunon kërkesën tuaj në sekonda duke përdorur modelet më të mira të burimit të hapur.

Shkarko dhe nda

Shkarko, kopjo ose ndaje rezultatin tënd. Pa pagesë për përdorim personal dhe komercial.

Përdor këtë mjet nëpërmjet API

Automatizo këtë mjet nga kodi juaj. Pika e fundit REST e përshtatshme me OpenAI, autentifikimi me token e bartësit, nuk kërkohet SDK shtesë. Kostot e token-it përputhen me interfaqen web.

Dokumentimi i API Merr kyçin e API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Extractor tool on: ..."}]}'

Mjetë të lidhura të AI të lira

PDF në Markdown

PDF Extractor

PDF në tekst

Zgjidhja e Dokumenteve Akademike

Dokumenti kërkimor në tekst

arXiv PDF Extractor — FAQ

Shto një preprint arXiv dhe AI konverton të gjithë letër në tekst të pastër me shije LaTeX. Ekuacionet kthehen si LaTeX i duhur, strukturat me shumë kollona të shpërndarë, referenca të paprekura. Ndërtuar mbi Meta Nougat, trajnuar posaçërisht në miliona faqe arXiv.

Korpusi i trajnimit i Nougat ishte arXiv preprints — kështu që absolutisht shkëlqen në familjen e IEEE / ACM / NeurIPS / ICML / arXiv. Shtypësit e tjerë të PDF-ve mbysohen në matematikën me shumë kollona; ky është projektuar për këtë.

Shkarko PDF nga arXiv (p.sh. arxiv.org/pdf/2401.12345), ngarko këtu, merr një file të vetëm.txt me dokumentin e plotë si tekst me shije LaTeX. Nuk na duhet kyçi i API të arXiv; na duhet vetëm PDF.

Po — kjo është karakteristika e titullit. Matematika e brendshme është `$...$`, matematika e shfaqur është `$$...$$`. Edhe ekuacionet e raster-renderuara në dokumentet e vjetra dalin siç duhet sepse modeli trajton çdo faqe si një figurë.

Duke përdorur stilin IEEE me dy kollona është rregullimi më i zakonshëm i arXiv dhe Nougat e shpërndan atë në rendin e duhur të leximit pa një flamur konfigurimi.

Po — markat e brendshme `[12]` / `[Smith2020]` qëndrojnë ku i përkasin, dhe lista e plotë e referencës në fund nxjerret e paprekur për përdorim në BibTeX / Zotero.

~8-15 sekonda në faqe. Një dokument i konferencës prej 12 faqesh merr ~2-3 minuta. Dokumente në stilin NeurIPS me më shumë se 30 faqe me shtigje: 8-12 minuta.

300 tokens/page, floor 600. Shumica e dokumenteve të konferencës arXiv (8-15 faqe) janë 2,400-4,500 tokens. Pool i përditshëm i lirë mbulon ~1-2 dokumente në ditë për përdoruesit e regjistruar; planet e paguar marrin të pakufizuar.

Shpërndaje tek ChatGPT / Claude për "shkruaj këtë artikull", ndërto RAG personale mbi artikullet e ruajtura, kërko semantikisht në listën tënde të leximit, kopjo ekuacionet në projektin tënd LaTeX, ose lexo artikullin si tekst të thjeshtë në telefonin tënd.

Po — Nougat OCRs brenda. arXiv ka qenë në LaTeX për më shumë se 25 vjet kështu që shumica e preprints janë të pastra dixhitale. Letrat e vjetra të skanuara punojnë por besnikëria matematikore bie pak; ri-skano me 300+ DPI për rezultatet më të mira.

PDF-të eleminohen menjëherë pas nxjerrjes. Rezultati LaTeX ruhet 24 orë (anonim) / 7 ditë (lidhja e ndarjes së paguar). Nuk përdoret kurrë për trainim. PDF-të arXiv janë publike CC-BY gjithsesi, por nuk i ruajmë ato në asnjë mënyrë.

Po — POST shumëpjesëshe `file` në /v1/document/academic-pdf/. Përgjigjja JSON me `text_url`, `pages`, `preview`, `tokens`, `share_url`. Autentifikimi i mbajtësit (sk-free-…) jep 10K tokens falas/muaj. /api/ për shembull curl.

Regjistrohu falas për 10,000 token

Krijo një profil të ri

Nuk kërkohet karta e kreditit

Si do ta vlerësoni këtë mjet?

arXiv PDF Extractor

Rezultati

Si të përdorësh arXiv PDF Extractor

Shkruaj

Kliko për të krijuar

Shkarko dhe nda

Përdor këtë mjet nëpërmjet API

Mjetë të lidhura të AI të lira

arXiv PDF Extractor — FAQ

Çfarë është arXiv PDF extractor?

Pse arXiv në veçanti?

Si e përdor?

Ekuacionet janë të pranueshme?

Rregull leximi shumë-kollonësh?

Citatet e ruajtura?

Shpejtësia?

Çmimet?

Çfarë mund të bëj me të dhënat?

A suportohen PDF-të e skanuara arXiv?

Privatësi?

API?

Merr 10,000 token falas

Prit — Merr 10K Tokens falas!

Do më shumë?