PDF ke Markdown Pengekstrak PDF PDF ke Teks Kertas Penyelidikan ke Teks Pengekstrak PDF arXiv Lebih →

Pengekstrak Kertas Akademik

Penggunaan komersial OK 380+ model Tiada tanda air Tiada pendaftaran diperlukan

Jatuhkan pracetak arXiv, kertas jurnal, atau bab tesis — AI menukarnya ke teks LaTeX-rasa bersih. Persamaan matematik kekal sebagai persamaan, susunatur berbilang-kolum diputar, rujukan dipelihara. Dikuasakan oleh Meta Nougat-base.

Tarik teks + persamaan dari kertas arXiv, jurnal, dan tesis. Persamaan matematik ditukar kepada LaTeX, susunatur lajur berbilang diputar, rujukan dipelihara. Dikuasakan oleh Meta Nougat. Percuma, tiada pendaftaran.

Bagaimana untuk Guna Pengekstrak Kertas Akademik

Masukkan input anda

Taip teks, muat naik fail, atau jelaskan apa yang anda mahu. Tiada akaun diperlukan.

Klik cipta

AI kami memproses permintaan anda dalam beberapa saat menggunakan model sumber terbuka terbaik.

Muat turun & kongsi

Muat turun, salin, atau kongsi hasil anda. Muat turun percuma untuk kegunaan peribadi dan komersial.

Guna alat ini melalui API

Automatikkan alat ini dari kod anda sendiri. Titik akhir REST serasi OpenAI, pengesahan token-pemegang, tiada SDK tambahan diperlukan. Kos token sepadan dengan antaramuka web.

Dokumentasi API Dapatkan Kekunci API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Pengekstrak Kertas Akademik tool on: ..."}]}'

Alat AI Percuma yang Serupa

PDF ke Markdown

Pengekstrak PDF

PDF ke Teks

Kertas Penyelidikan ke Teks

Pengekstrak PDF arXiv

Pengekstrak Kertas Akademik — FAQ

Letakkan mana-mana PDF kertas akademik/kajian — preprint arXiv, kertas persidangan, artikel jurnal, bab tesis — dan AI menukarnya ke teks berformat LaTeX bersih. Persamaan matematik datang melalui sebagai LaTeX yang betul, susunatur berbilang-kolum diputar ke dalam tertib bacaan, dan rujukan + senarai rujukan dipelihara. Dibina khas untuk jenis dokumen saintifik padat pdftotext mangles.

Nougat-basis Meta — model pengkod-penyahkod visi dilatih pada jutaan halaman arXiv. Ia merawat setiap halaman PDF sebagai imej dan output Markdown + LaTeX terstruktur, yang merupakan sebab persamaan datang dengan betul walaupun mereka dihasilkan sebagai glif raster dalam sumber PDF.

Alat Docling (PDF ke Markdown) menggunakan IBM Granite-Docling — pantas, sedar susunatur, dioptimumkan untuk dokumen perniagaan umum seperti kontrak, laporan, manual. Nougat lebih perlahan tetapi jauh lebih baik pada kertas akademik kerana ia telah dilatih secara khusus pada susunatur matematik + saintifik berbilang-kolum. Guna Docling untuk dokumen perniagaan, Nougat untuk penyelidikan.

Ya — itu adalah ciri pembunuh. Matematik dalaman kembali sebagai `$...$`, persamaan dipaparkan sebagai `$$...$$`. Ia boleh membaca kedua-dua persamaan LaTeX-dihasilkan dari penyerahan arXiv DAN persamaan raster diimbas dari kertas lama. Kualiti adalah gred penerbitan untuk kebanyakan kertas.

Ya — Nougat menggulung susunatur dua lajur / tiga lajur ke dalam tertib bacaan yang betul secara automatik. Tiada lagi teks melompat di tengah-tengah ayat antara lajur. Catatan kaki diekstrak ke dalam blok nota kaki pada penghujung setiap seksyen.

Penanda rujukan `[12]` / `(Smith 2020)` kekal dalam baris. Senarai rujukan di hujung datang melalui disimpan dengan formatan tidak rosak, jadi anda boleh pipa output ke Zotero / Mendeley / penghurai rujukan tersendiri.

Kira-kira 8-15 saat per halaman pada H200 kami. Kertas persidangan 10-halaman biasa berjalan dalam ~2 minit. Kertas kaji selidik panjang (50+ halaman) mengambil masa 8-12 minit — hantar dan pergi.

300 token per halaman (lantai 600). Kertas persidangan 10 halaman = 3,000 token. Bab tesis 30 halaman = 9,000 token. Pulangan percuma seharian merangkumi kebanyakan pembacaan penyelidikan biasa.

Salurkan ke ChatGPT/Claude untuk ringkasan kertas, bina RAG peribadi di atas korpus kertas, carian semantik pustaka anda sendiri, salin persamaan secara langsung ke dalam projek LaTeX, atau baca kertas sebagai teks biasa pada telefon anda.

Ya — Nougat melakukan langkah OCR sendiri. Penerimaan arXiv digital lahir adalah terbaik (penyediaan persamaan bersih); kertas lama yang diimbas juga berfungsi tetapi ketulenan matematik turun sedikit. Untuk hasil matematik terbaik pada imbasan, imbas semula pada 300+ DPI sebelum muat naik.

Diproses segera, output teks LaTeX disimpan (24h anonim / 7d tamat tempoh pautan-kongsi-berbayar), sumber PDF dipadam segera selepas pengekstrakan. Tidak digunakan untuk latihan. /privacy/ untuk polisi penuh.

Ya — POST `fail` berbilang bahagian ke /v1/document/academic-pdf/. Kembalikan {text_url, pages, preview, tokens, share_url}. Auth pemegang (sk-free-…) memberikan 10K token percuma/bulan. /api/ mempunyai contoh curl.

Daftar percuma untuk 30,000 token

Cipta Akaun Bebas

Tiada kad kredit diperlukan

Bagaimana anda menilai alat ini?

Pengekstrak Kertas Akademik

Hasil

Bagaimana untuk Guna Pengekstrak Kertas Akademik

Masukkan input anda

Klik cipta

Muat turun & kongsi

Guna alat ini melalui API

Alat AI Percuma yang Serupa

Pengekstrak Kertas Akademik — FAQ

Apa Pengekstrak Kertas Akademik?

Model mana yang dikuasakan?

Bagaimana ini berbeza daripada alat PDF ke Markdown biasa?

Adakah ia boleh menangani persamaan matematik?

Bentangan berbilang-kolum?

Bagaimana dengan rujukan dan rujukan?

Seberapa cepat?

Berapakah harganya?

Apa yang boleh saya buat dengan output?

Adakah kertas yang diimbas disokong?

Adakah PDF yang dimuat naik disimpan?

Ada API?

Dapatkan 10,000 Token Percuma

Tunggu — Dapatkan 10K Token Percuma!

Nak lagi?