arXiv PDF Ekstractor

Penggunaan komersial OK 380+ model Tidak ada tanda air Tidak perlu sign-up
Model:
+ GPT-5, Claude, Gemini
Jatuhkan arXiv preprint, jurnal paper, atau tesis bab II mengubahnya menjadi teks bersih LaTeX-flavored. Matematika persamaan tetap sebagai persamaan, tata letak multi-kolumn mendapatkan unwound, kutipan diawetkan. Powered by Meta Nougat-base.

Jatuhkan kertas penelitian PDF di sini atau klik untuk meng-upload

PDF sampai 50 MB. ~300 token per halaman (math-aware).

Membaca persamaan + unwinding kolom... ~10 sec/page
Opsi tingkat lanjut
Hasil
Tokens berjalan rendah. Dapatkan Lebih Banyak Token
Ingin hasil yang lebih baik? Model Premium (GPT-5, Claude, Gemini) deliver higher quality. Tilik Rencana

❤️ Love this tool? Share it!

Tandai untuk mendapatkan link referral dan mendapatkan 25.000 token per teman.

Mau lagi? Daftar gratis untuk 30K token/hari + 10K bonus
Daftar Bebas

Memproses permintaan Anda...

Jatuhkan praprint arXiv, bersihkan teks LaTeX-flavored dengan setiap persamaan yang dirender inline. tata letak multi-column ditangani, referensi tetap utuh.

Cara Menggunakan arXiv PDF Ekstractor

1
Masukkan input Anda

Ketikkan teks, unggah berkas, atau jelaskan apa yang Anda inginkan. Tidak perlu akun.

2
Klik hasilkan

Al kami memproses permintaan Anda dalam hitungan detik menggunakan model open-source terbaik.

3
Unduh & bagi

Unduh, salin, atau bagikan hasilnya. Bebas untuk penggunaan pribadi dan komersial.

Gunakan perkakas ini melalui API

Otomatiskan alat ini dari kode anda sendiri. Titik akhir REST yang kompatibel dengan OpenAI, auth bearer-token, tidak ada tambahan SDK yang diperlukan. Biaya Token cocok dengan antarmuka web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Ekstractor tool on: ..."}]}'

arXiv PDF Ekstractor — FAQ

Jatuhkan dalam arXiv preprint dan AI mengubah seluruh kertas menjadi teks bersih LaTeX-flavored. Equations come back as right LaTeX, multi-kolumn layouts unwound, reference unwound utuh. Dibangun di Meta Nougat, dilatih khusus pada jutaan halaman arXiv.

Pelatihan Nougat corpus adalah arXiv preprints sehingga benar-benar bersinar pada IEEE / ACM / NeurIPS / ICML / arXiv tata letak keluarga. Exktors PDF lain tersedak pada matematika multi-kolumn; yang ini dirancang untuk itu.

Unduh PDF dari arXiv (misalnya arxiv.org/pdf/2401.12345), upload di sini, dapatkan kembali satu berkas.txt dengan kertas penuh sebagai teks LaTeX-flavored. Tidak perlu kunci arXiv API; kita hanya perlu PDF.

Ya, itu adalah fitur utama. matematika inline adalah $... $, ditampilkan matematika $$... $. $.

Auto-handled. 2-Column IEEE-style adalah yang paling umum arXiv layout dan Nougat unwinds ke urutan membaca yang tepat tanpa config flag.

Ya, garis inline (12]) / (Smith20]) penanda tetap berada di mana mereka berada, dan daftar referensi lengkap di akhir diekstrak utuh untuk penggunaan hilir BibTeX / Zotero.

~8-15 sec/page. sebuah kertas konferensi 12 halaman mengambil ~2-3 menit.

300 token/halaman, lantai 600 kebanyakan dokumen konferensi arXiv 8-15 halaman) adalah 2.400-4500 token. token kolam gratis harian mencakup ~1-2 kertas/hari untuk pengguna yang ditandatangani; rencana dibayar mendapatkan tak terbatas.

Feed it to ChatGPT /Claudeplainkan makalah ini, bangun RAG pribadi atas kertas disimpan Anda, semantik-saji daftar baca Anda, salin persamaan ke dalam proyek LaTeX Anda sendiri, atau baca kertas sebagai teks biasa di telepon Anda.

Ya, nougat OCRs secara internal. arXiv telah dimasukkan ke LaTeX selama 25+ tahun jadi sebagian besar praprint bersih digital. Kertas lama dipindai bekerja tapi kesetiaan matematika turun sedikit; dapat kembali pada 300+ DPI untuk hasil terbaik.

PDF dihapus tepat setelah ekstraksi. Keluaran LaTeX disimpan 24h (anonim) / 7 hari (say share link). Tidak pernah digunakan untuk pelatihan. arXiv PDFs adalah CC-BY umum pula, tapi kami tidak menyimpan mereka dengan cara baik.

Ya. <i>POST multipart>kepada /v1/document/academic-pdf/. <i>JSON merespons dengan teks_url;, halaman ▪preview;, ·tokens</url.</i>. Bearer auth (bebas-...) memberikan 10K token gratis/bulan. /api/untuk contoh keriting.

Daftar gratis untuk 30.000 token

Buat Akun Bebas

Tidak ada kartu kredit yang diperlukan

Bagaimana Anda menilai alat ini?

Love this tool? Share it!