Pengekstrak PDF arXiv

Penggunaan komersial OK 380+ model Tiada tanda air Tiada pendaftaran diperlukan
Model:
+ GPT-5, Claude, Gemini
Jatuhkan pracetak arXiv, kertas jurnal, atau bab tesis — AI menukarnya ke teks LaTeX-rasa bersih. Persamaan matematik kekal sebagai persamaan, susunatur berbilang-kolum diputar, rujukan dipelihara. Dikuasakan oleh Meta Nougat-base.

Letakkan kertas penyelidikan PDF di sini atau klik untuk muat naik

PDF sehingga 50 MB. ~300 token per halaman (math-aware).

Membaca persamaan + menggulung lajur... ~10 saat/halaman
Opsyen Lanjutan
Hasil
Token semakin habis. Dapatkan Lebih Token
Nak hasil yang lebih baik? Model premium (GPT-5, Claude, Gemini) memberikan kualiti yang lebih tinggi. Lihat Reka Bentuk

❤️ Love this tool? Share it!

Mendaftar untuk mendapatkan pautan rujukan dan memperoleh 25,000 token per rakan.

Nak lagi? Daftar percuma untuk 30K token/hari + 10K bonus
Daftar Masuk

Memproses permintaan anda...

Tinggalkan pracetak arXiv, dapatkan teks LaTeX-rasa bersih dengan setiap persamaan dihasilkan dalam baris. Bentangan berbilang-kolum diurus, rujukan dikekalkan utuh. Bebas, dikuasakan AI.

Bagaimana untuk Guna Pengekstrak PDF arXiv

1
Masukkan input anda

Taip teks, muat naik fail, atau jelaskan apa yang anda mahu. Tiada akaun diperlukan.

2
Klik cipta

AI kami memproses permintaan anda dalam beberapa saat menggunakan model sumber terbuka terbaik.

3
Muat turun & kongsi

Muat turun, salin, atau kongsi hasil anda. Muat turun percuma untuk kegunaan peribadi dan komersial.

Guna alat ini melalui API

Automatikkan alat ini dari kod anda sendiri. Titik akhir REST serasi OpenAI, pengesahan token-pemegang, tiada SDK tambahan diperlukan. Kos token sepadan dengan antaramuka web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Pengekstrak PDF arXiv tool on: ..."}]}'

Pengekstrak PDF arXiv — FAQ

Letakkan pracetak arXiv dan AI menukarkan seluruh kertas ke teks LaTeX-rasa bersih. Persamaan kembali sebagai LaTeX yang betul, susunatur lajur berbilang diputar, rujukan tidak rosak. Dibina pada Meta Nougat, dilatih khas pada jutaan halaman arXiv.

Korpus latihan Nougat adalah pracetak arXiv — jadi ia benar-benar bersinar pada keluarga susunatur IEEE / ACM / NeurIPS / ICML / arXiv. Pengekstrak PDF lain tercekik pada matematik lajur-berbilang; ini direka untuknya.

Muat turun PDF dari arXiv (e.g. arxiv.org/pdf/2401.12345), muat naik di sini, dapatkan semula fail.txt tunggal dengan kertas penuh sebagai teks LaTeX-flavored. Tiada kunci API arXiv diperlukan; kami hanya perlukan PDF.

Ya — itu ciri pengepala. Matematik dalaman ialah `$...$`, matematik dipaparkan `$$...$$`. Bahkan persamaan raster-render dalam kertas lama datang dengan betul kerana model menganggap setiap halaman sebagai imej.

Diurus secara automatik. Gaya IEEE dua lajur adalah susunatur arXiv yang paling biasa dan Nougat menggulungnya ke dalam tertib bacaan yang betul tanpa bendera konfigurasi.

Ya — penanda `[12]` / `[Smith2020]` dalam baris tetap di mana mereka berada, dan senarai rujukan penuh di hujung diekstrak utuh untuk penggunaan BibTeX / Zotero.

~8-15 saat/halaman. Kertas persidangan 12 halaman mengambil masa ~2-3 minit. Kertas gaya NeurIPS 30+ halaman dengan appendiks: 8-12 minit. Hantar dan pergi.

300 token/halaman, tingkat 600. Kebanyakan kertas arXiv (8-15 halaman) adalah 2,400-4,500 token. Pool percuma harian meliputi ~1-2 kertas/hari untuk pengguna yang mendaftar masuk; rancangan berbayar tidak terhad.

Suapan ke ChatGPT / Claude untuk "jelaskan kertas ini", bina RAG peribadi ke atas kertas yang disimpan, carian semantik senarai bacaan anda, salin persamaan ke dalam projek LaTeX anda sendiri, atau baca kertas sebagai teks biasa pada telefon anda.

Ya — Nougat OCR secara dalaman. arXiv telah dirender LaTeX selama 25+ tahun jadi kebanyakan pracetak adalah digital bersih. Kertas yang diimbas lebih lama berfungsi tetapi ketulenan matematik sedikit menurun; imbas semula pada 300+ DPI untuk hasil terbaik.

PDF dipadam segera selepas pengekstrakan. Output LaTeX disimpan 24h (anonymous) / 7 hari (payshare link). Tidak pernah digunakan untuk latihan. PDF arXiv adalah CC-BY awam, tapi kami tidak menyimpannya sama ada cara.

Ya — POST `file` berbilang bahagian ke /v1/document/academic-pdf/. Balasan JSON dengan `text_url`, `pages`, `preview`, `tokens`, `share_url`. Pengesahan pemegang (sk-free-…) memberikan 10K token percuma/bulan. /api/ untuk contoh curl.

Daftar percuma untuk 30,000 token

Cipta Akaun Bebas

Tiada kad kredit diperlukan

Bagaimana anda menilai alat ini?

Love this tool? Share it!