Pengekstrak Kertas Akademik

Penggunaan komersial OK 380+ model Tiada tanda air Tiada pendaftaran diperlukan
Model:
+ GPT-5, Claude, Gemini
Jatuhkan pracetak arXiv, kertas jurnal, atau bab tesis — AI menukarnya ke teks LaTeX-rasa bersih. Persamaan matematik kekal sebagai persamaan, susunatur berbilang-kolum diputar, rujukan dipelihara. Dikuasakan oleh Meta Nougat-base.

Letakkan kertas penyelidikan PDF di sini atau klik untuk muat naik

PDF sehingga 50 MB. ~300 token per halaman (math-aware).

Membaca persamaan + menggulung lajur... ~10 saat/halaman
Opsyen Lanjutan
Hasil
Token semakin habis. Dapatkan Lebih Token
Nak hasil yang lebih baik? Model premium (GPT-5, Claude, Gemini) memberikan kualiti yang lebih tinggi. Lihat Reka Bentuk

❤️ Love this tool? Share it!

Mendaftar untuk mendapatkan pautan rujukan dan memperoleh 25,000 token per rakan.

Nak lagi? Daftar percuma untuk 30K token/hari + 10K bonus
Daftar Masuk

Memproses permintaan anda...

Tarik teks + persamaan dari kertas arXiv, jurnal, dan tesis. Persamaan matematik ditukar kepada LaTeX, susunatur lajur berbilang diputar, rujukan dipelihara. Dikuasakan oleh Meta Nougat. Percuma, tiada pendaftaran.

Bagaimana untuk Guna Pengekstrak Kertas Akademik

1
Masukkan input anda

Taip teks, muat naik fail, atau jelaskan apa yang anda mahu. Tiada akaun diperlukan.

2
Klik cipta

AI kami memproses permintaan anda dalam beberapa saat menggunakan model sumber terbuka terbaik.

3
Muat turun & kongsi

Muat turun, salin, atau kongsi hasil anda. Muat turun percuma untuk kegunaan peribadi dan komersial.

Guna alat ini melalui API

Automatikkan alat ini dari kod anda sendiri. Titik akhir REST serasi OpenAI, pengesahan token-pemegang, tiada SDK tambahan diperlukan. Kos token sepadan dengan antaramuka web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Pengekstrak Kertas Akademik tool on: ..."}]}'

Pengekstrak Kertas Akademik — FAQ

Letakkan mana-mana PDF kertas akademik/kajian — preprint arXiv, kertas persidangan, artikel jurnal, bab tesis — dan AI menukarnya ke teks berformat LaTeX bersih. Persamaan matematik datang melalui sebagai LaTeX yang betul, susunatur berbilang-kolum diputar ke dalam tertib bacaan, dan rujukan + senarai rujukan dipelihara. Dibina khas untuk jenis dokumen saintifik padat pdftotext mangles.

Nougat-basis Meta — model pengkod-penyahkod visi dilatih pada jutaan halaman arXiv. Ia merawat setiap halaman PDF sebagai imej dan output Markdown + LaTeX terstruktur, yang merupakan sebab persamaan datang dengan betul walaupun mereka dihasilkan sebagai glif raster dalam sumber PDF.

Alat Docling (PDF ke Markdown) menggunakan IBM Granite-Docling — pantas, sedar susunatur, dioptimumkan untuk dokumen perniagaan umum seperti kontrak, laporan, manual. Nougat lebih perlahan tetapi jauh lebih baik pada kertas akademik kerana ia telah dilatih secara khusus pada susunatur matematik + saintifik berbilang-kolum. Guna Docling untuk dokumen perniagaan, Nougat untuk penyelidikan.

Ya — itu adalah ciri pembunuh. Matematik dalaman kembali sebagai `$...$`, persamaan dipaparkan sebagai `$$...$$`. Ia boleh membaca kedua-dua persamaan LaTeX-dihasilkan dari penyerahan arXiv DAN persamaan raster diimbas dari kertas lama. Kualiti adalah gred penerbitan untuk kebanyakan kertas.

Ya — Nougat menggulung susunatur dua lajur / tiga lajur ke dalam tertib bacaan yang betul secara automatik. Tiada lagi teks melompat di tengah-tengah ayat antara lajur. Catatan kaki diekstrak ke dalam blok nota kaki pada penghujung setiap seksyen.

Penanda rujukan `[12]` / `(Smith 2020)` kekal dalam baris. Senarai rujukan di hujung datang melalui disimpan dengan formatan tidak rosak, jadi anda boleh pipa output ke Zotero / Mendeley / penghurai rujukan tersendiri.

Kira-kira 8-15 saat per halaman pada H200 kami. Kertas persidangan 10-halaman biasa berjalan dalam ~2 minit. Kertas kaji selidik panjang (50+ halaman) mengambil masa 8-12 minit — hantar dan pergi.

300 token per halaman (lantai 600). Kertas persidangan 10 halaman = 3,000 token. Bab tesis 30 halaman = 9,000 token. Pulangan percuma seharian merangkumi kebanyakan pembacaan penyelidikan biasa.

Salurkan ke ChatGPT/Claude untuk ringkasan kertas, bina RAG peribadi di atas korpus kertas, carian semantik pustaka anda sendiri, salin persamaan secara langsung ke dalam projek LaTeX, atau baca kertas sebagai teks biasa pada telefon anda.

Ya — Nougat melakukan langkah OCR sendiri. Penerimaan arXiv digital lahir adalah terbaik (penyediaan persamaan bersih); kertas lama yang diimbas juga berfungsi tetapi ketulenan matematik turun sedikit. Untuk hasil matematik terbaik pada imbasan, imbas semula pada 300+ DPI sebelum muat naik.

Diproses segera, output teks LaTeX disimpan (24h anonim / 7d tamat tempoh pautan-kongsi-berbayar), sumber PDF dipadam segera selepas pengekstrakan. Tidak digunakan untuk latihan. /privacy/ untuk polisi penuh.

Ya — POST `fail` berbilang bahagian ke /v1/document/academic-pdf/. Kembalikan {text_url, pages, preview, tokens, share_url}. Auth pemegang (sk-free-…) memberikan 10K token percuma/bulan. /api/ mempunyai contoh curl.

Daftar percuma untuk 30,000 token

Cipta Akaun Bebas

Tiada kad kredit diperlukan

Bagaimana anda menilai alat ini?

Love this tool? Share it!