Pengekstrak PDF PDF ke Teks Pengekstrak Kertas Akademik Kertas Penyelidikan ke Teks Pengekstrak PDF arXiv Lebih →

PDF ke Markdown

Q: Bagaimana ia menangani matematik / persamaan?

Kebanyakan persamaan yang dirender LaTeX datang melalui sebagai `$...$` matematik Markdown dalam baris. Untuk kertas penyelidikan dengan matematik berat, kami juga menawarkan alat akademik-paper-extract (Nougat) yang khusus diset untuk persamaan dan kutipan.

Q: Seberapa cepat?

Kira-kira 5-10 saat per halaman pada H200 kami. Laporan 30-halaman adalah ~3-5 minit. Model kecil bermakna kumpulan PDF kecil secara asasnya percuma dalam kolam harian.

Q: Berapakah harganya?

200 token per halaman, dengan lantai 500 token. Kontrak 5 halaman = 1,000 token. Laporan 30 halaman = 6,000 token. 5K pool percuma sehari merangkumi kebanyakan penggunaan biasa.

Q: Format input apa?

PDF — lahir-digital + diimbas kedua-duanya disokong. Maksimum muat naik 50 MB. Format dokumen lain (DOCX, EPUB, HTML, dll) adalah pada peta jalan; untuk sekarang muat naik-dan-tukar dengan alat penukaran pdf pertama.

Penggunaan komersial OK 380+ model Tiada tanda air Tiada pendaftaran diperlukan

Drop a PDF — AI menukarnya ke Markdown berlauk GitHub dengan pengepala, perenggan, senarai, jadual, dan blok kod semua terpelihara. Dikuasakan oleh IBM Granite-Docling-258M (Apache 2.0). Lebih pantas + bijak daripada pengekstrakan teks biasa.

Tukarkan sebarang PDF ke dalam Markdown berlauk GitHub dengan pengepala, jadual, senarai, dan blok kod yang terpelihara. Dikuasakan oleh IBM Granite-Docling. Percuma, tidak terhad, tiada pendaftaran.

Bagaimana untuk Guna PDF ke Markdown

Masukkan input anda

Taip teks, muat naik fail, atau jelaskan apa yang anda mahu. Tiada akaun diperlukan.

Klik cipta

AI kami memproses permintaan anda dalam beberapa saat menggunakan model sumber terbuka terbaik.

Muat turun & kongsi

Muat turun, salin, atau kongsi hasil anda. Muat turun percuma untuk kegunaan peribadi dan komersial.

Guna alat ini melalui API

Automatikkan alat ini dari kod anda sendiri. Titik akhir REST serasi OpenAI, pengesahan token-pemegang, tiada SDK tambahan diperlukan. Kos token sepadan dengan antaramuka web.

Dokumentasi API Dapatkan Kekunci API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF ke Markdown tool on: ..."}]}'

Alat AI Percuma yang Serupa

Pengekstrak PDF

PDF ke Teks

Pengekstrak Kertas Akademik

Kertas Penyelidikan ke Teks

Pengekstrak PDF arXiv

PDF ke Markdown — FAQ

Letakkan mana-mana PDF dan AI akan menukarnya ke Markdown berlauk GitHub yang bersih — pengepala tetap pengepala, jadual tetap jadual, senarai tetap senarai, blok kod tetap blok kod. Pergi jauh melebihi pengekstrakan teks biasa; hierarki struktur dokumen dijaga supaya anda boleh meletakkan output terus ke laman docs, paip LLM RAG, atau indeks carian.

IBM Granite-Docling-258M (Apache 2.0). Model visi-ke-urutan kecil disetkan untuk penukaran dokumen yang sedar susunatur — lebih pantas + lebih bijak daripada menjalankan model bahasa visi generik pada setiap halaman.

pdftotext adalah satu dump rata — perenggan dan jadual runtuh ke dalam dinding perkataan. Adobe Eksport ke Word memelihara susunatur tetapi menghasilkan.docx + kos ~$15/mo. Docling memelihara struktur SEMANTIK (tahap pengepala, senarai sebagai senarai, jadual sebagai jadual Markdown) dan output format LLMs dan alat dev boleh kedua-duanya menggunakan secara asli.

LlamaParse dan tidak terstruktur mempunyai aras percuma tetapi had halaman/bulan dan memerlukan kunci API. Docling-258M berjalan secara setempat pada GPU kami + adalah sepenuhnya Apache 2.0 sendiri-dihost, tiada pengukuran per-halaman, tiada kunci mendaftar masuk. Kualiti adalah bersaing dengan LlamaParse pada dokumen piawai.

Ya — jadual kembali sebagai jadual paip Markdown yang betul. Jadual berbilang-kolum / bersarang yang kompleks diratakan lebih agresif (pembatasan Markdown asas, bukan kesalahan model). Untuk ketulenan jadual sempurna, kami juga menyokong `format=html` melalui API yang melestarikan rowspan/colspan.

Granite-Docling melakukan langkah OCR sendiri — berfungsi pada PDF digital dan diimbas sama. Diimbas pada DPI yang lebih rendah (<150) kehilangan ketulenan teks; imbas semula pada 200+ DPI untuk hasil terbaik.

Kebanyakan persamaan yang dirender LaTeX datang melalui sebagai `$...$` matematik Markdown dalam baris. Untuk kertas penyelidikan dengan matematik berat, kami juga menawarkan alat akademik-paper-extract (Nougat) yang khusus diset untuk persamaan dan kutipan.

Kira-kira 5-10 saat per halaman pada H200 kami. Laporan 30-halaman adalah ~3-5 minit. Model kecil bermakna kumpulan PDF kecil secara asasnya percuma dalam kolam harian.

200 token per halaman, dengan lantai 500 token. Kontrak 5 halaman = 1,000 token. Laporan 30 halaman = 6,000 token. 5K pool percuma sehari merangkumi kebanyakan penggunaan biasa.

PDF — lahir-digital + diimbas kedua-duanya disokong. Maksimum muat naik 50 MB. Format dokumen lain (DOCX, EPUB, HTML, dll) adalah pada peta jalan; untuk sekarang muat naik-dan-tukar dengan alat penukaran pdf pertama.

Diproses segera, output Markdown disimpan (24h anonim / 7d tamat tempoh pautan-kongsi-berbayar), sumber PDF dipadam segera selepas pengekstrakan. Tidak digunakan untuk latihan. /privacy/ untuk polisi penuh.

Ya — POST `fail` berbilang bahagian ke /v1/document/pdf-to-markdown/. Kembalikan {markdown_url, halaman, pralihat, token, share_url}. Auth pemegang (sk-free-…) memberikan 10K token percuma/bulan. /api/ mempunyai contoh curl.

Daftar percuma untuk 30,000 token

Cipta Akaun Bebas

Tiada kad kredit diperlukan

Bagaimana anda menilai alat ini?

PDF ke Markdown

Hasil

Bagaimana untuk Guna PDF ke Markdown

Masukkan input anda

Klik cipta

Muat turun & kongsi

Guna alat ini melalui API

Alat AI Percuma yang Serupa

PDF ke Markdown — FAQ

Apakah itu AI PDF ke Markdown?

Model mana yang dikuasakan?

Bagaimana ia berbeza daripada eksport pdftotext / Adobe?

Bagaimana ia dibandingkan dengan LlamaParse / unstructured.io?

Adakah ia mengendalikan meja?

Bagaimana dengan PDF (imej) yang diimbas?

Bagaimana ia menangani matematik / persamaan?

Seberapa cepat?

Berapakah harganya?

Format input apa?

Adakah PDF yang dimuat naik disimpan?

Ada API?

Dapatkan 10,000 Token Percuma

Tunggu — Dapatkan 10K Token Percuma!

Nak lagi?