arXiv PDF Extractor

Komersial 380+ model Ora ana tanda banyu Ora perlu ndhaptar
Model:
+ GPT-5, Claude, Gemini
Tibaké preprint arXiv, kertas jurnal, utawa bab tesis — AI ngowahi dadi teks LaTeX-flavored sing resik. Persamaan matematika tetep minangka persamaan, tata letak multi-kolom diuncolé, cithakan dilestarikaké. Didhukung déning Meta Nougat-base.

Nyelehake kertas riset PDF ing kene utawa pencet kanggo ngunggah

5000 SM) lan 300 SM (kanggo 1000 SM) ing jaman Prasejarah.

Membaca persamaan + ngresiki kolom... ~10 detik/layar
Opsi Kaluwihan
Hasil
Kutha krajané ya iku Lower Silesian. Njupuk Token Tambahan
Kanggé hasil ingkang langkung saé? Model Premium (Ing basa Inggris, "free" tegesé "gratis", "freedom" tegesé "kabebasan"). Papan

❤️ Free.ai? Nyathet kanca-kancamu!

Sign up kanggo njaluk link referral lan entuk 25,000 token per kanca.

Ingkang langkung? Ing taun 2000, dhèwèké menang 100K lan 100K+ ing acara iki.
Sign Up Free

Ngolah panjalukmu...

Nglebokaké preprint arXiv, entuk teks LaTeX-flavored kang resik karo saben persamaan kang digambar ing baris. Layout multi-kolom ditangani, referensi tetep ora kena rusak. Bebas, didhukung AI.

Cara Nggunakake arXiv PDF Extractor

1
Ngetik inputmu

Ngetik teks, ngundhuh file, utawa nggambarake apa sing sampeyan karep. Ora ana akun sing dibutuhaké.

2
Klik kanggo nyipta

Ing jaman saiki, algoritma iki bisa digunakaké kanggo nganalisa data kanthi luwih apik.

3
Muter & bagéan

Muter, salinan, utawa share asil sampeyan. Free kanggo pribadi lan komersial.

Gunake piranti iki liwat API

Otomatisasi piranti iki saka kode dhewe. OpenAI-kompatibel REST endpoint, Bearer-token otentikasi, ora ekstra SDK dibutuhaké. Token biaya match the web interface.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Extractor tool on: ..."}]}'

arXiv PDF Extractor — FAQ

Seret ing arXiv preprint lan AI bakal ngowahi kabèh kertas dadi teks LaTeX-flavored sing resik. Persamaan bakal bali dadi LaTeX sing bener, tata letak multi-kolom diuncolé, referensi ora rusak. Digawé ing Meta Nougat, dilatih khusus ing yuta-juta kaca arXiv.

Korpus latihan Nougat ya iku preprints arXiv — mula iku sampurna ing kulawarga tata letak IEEE / ACM / NeurIPS / ICML / arXiv. Pengekstrak PDF liya ora bisa ngrampungaké matematika multi-kolom; iki dirancang kanggo iku.

Ngundhuh PDF saka arXiv (misalné arxiv.org/pdf/2401.12345), unggah ing kene, lan entuk siji berkas.txt kanthi kertas lengkap minangka teks LaTeX-flavored. Ora ana kunci API arXiv sing dibutuhaké; kita mung butuh PDF.

Ya — iku fitur headline. Matematika ing baris iku `$...$`, matematika kang ditampilaké ya iku `$$...$$`. Malah persamaan raster-render ing kertas lawas bisa dijupuk kanthi bener amarga model nganggep saben kaca minangka gambar.

Ditangani kanthi otomatis. Gaya IEEE-dua-kolom iku tata letak arXiv kang paling umum lan Nougat nglumpukaké ing urutan maca sing bener tanpa bendera konfigurasi.

Ya — inline `[12]` / `[Smith2020]` markers tetep ing ngendi dhèwèké asalé, lan dhaptar referensi lengkap ing pungkasané diekstraksi tanpa cacat kanggo downstream BibTeX / Zotero.

12-15 menit, 15-20 menit, 20-30 menit, 30-40 menit, 40-50 menit, 50-60 menit, 60-70 menit, 70-80 menit, 80-90 menit, 90-100 menit, 100-120 menit, 120-130 menit, 130-140 menit, 140-150 menit, 150-160 menit, 160-170 menit, 170-180 menit.

300 token/pagina, lantai 600. Kabèh kertas konferensi arXiv (8-15 halaman) 2,400-4,500 token. pool gratis saben dinané nglumpukaké ~1-2 kertas/dina kanggo pangguna sing wis ndhaptar; rencana bayaran ora ana watesé.

Ing basa Inggris, istilah iki bisa dijupuk saka tembung Latin "aqua" kang tegesé "ing banyu", "aqua" kang tegesé "ing banyu", lan "latus" kang tegesé "panjang", lan bisa uga dijupuk saka tembung Latin "latus" kang tegesé "panjang".

Ya — Nougat OCRs ing njero. arXiv wis digawé nganggo LaTeX kanggo 25+ taun, mula akèh preprints sing digital. Kertu sing discan luwih tuwa bisa dianggo nanging kacepetan matematikané mudhun; scan maneh ing 300+ DPI kanggo asil paling apik.

PDF dipatèni sawisé dièkstrak. Output LaTeX disimpen 24 jam (anonymous) /7dina (payshare link). Ora pernah digunakake kanggo latihan. arXiv PDF iku CC-BY umum, nanging ora disimpen ing cara apa wae.

Ya — POST multipart `file` to /v1/document/academic-pdf/. JSON reply with `text_url`, `pages`, `preview`, `tokens`, `share_url`. Bearer auth (sk-free-…) gives 10K free tokens/month. /api/ for curl example.

Ing taun 2000, jumlahné wis tekan 30.000.

Akun

Ora perlu kertu kredit

Kepiye sampeyan bakal ngrekam alat iki?

Free.ai? Nyathet kanca-kancamu!