PDF ke Markdown

Penggunaan komersial OK 380+ model Tiada tanda air Tiada pendaftaran diperlukan
Model:
+ GPT-5, Claude, Gemini
Drop a PDF — AI menukarnya ke Markdown berlauk GitHub dengan pengepala, perenggan, senarai, jadual, dan blok kod semua terpelihara. Dikuasakan oleh IBM Granite-Docling-258M (Apache 2.0). Lebih pantas + bijak daripada pengekstrakan teks biasa.

Letakkan PDF di sini atau klik untuk muat naik

PDF sehingga 50 MB. ~200 token per halaman.

Mengekstrak Markdown yang sedar-bentangan... ~5-10 saat/halaman
Opsyen Lanjutan
Hasil
Token semakin habis. Dapatkan Lebih Token
Nak hasil yang lebih baik? Model premium (GPT-5, Claude, Gemini) memberikan kualiti yang lebih tinggi. Lihat Reka Bentuk

❤️ Love this tool? Share it!

Mendaftar untuk mendapatkan pautan rujukan dan memperoleh 25,000 token per rakan.

Nak lagi? Daftar percuma untuk 30K token/hari + 10K bonus
Daftar Masuk

Memproses permintaan anda...

Tukarkan sebarang PDF ke dalam Markdown berlauk GitHub dengan pengepala, jadual, senarai, dan blok kod yang terpelihara. Dikuasakan oleh IBM Granite-Docling. Percuma, tidak terhad, tiada pendaftaran.

Bagaimana untuk Guna PDF ke Markdown

1
Masukkan input anda

Taip teks, muat naik fail, atau jelaskan apa yang anda mahu. Tiada akaun diperlukan.

2
Klik cipta

AI kami memproses permintaan anda dalam beberapa saat menggunakan model sumber terbuka terbaik.

3
Muat turun & kongsi

Muat turun, salin, atau kongsi hasil anda. Muat turun percuma untuk kegunaan peribadi dan komersial.

Guna alat ini melalui API

Automatikkan alat ini dari kod anda sendiri. Titik akhir REST serasi OpenAI, pengesahan token-pemegang, tiada SDK tambahan diperlukan. Kos token sepadan dengan antaramuka web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF ke Markdown tool on: ..."}]}'

PDF ke Markdown — FAQ

Letakkan mana-mana PDF dan AI akan menukarnya ke Markdown berlauk GitHub yang bersih — pengepala tetap pengepala, jadual tetap jadual, senarai tetap senarai, blok kod tetap blok kod. Pergi jauh melebihi pengekstrakan teks biasa; hierarki struktur dokumen dijaga supaya anda boleh meletakkan output terus ke laman docs, paip LLM RAG, atau indeks carian.

IBM Granite-Docling-258M (Apache 2.0). Model visi-ke-urutan kecil disetkan untuk penukaran dokumen yang sedar susunatur — lebih pantas + lebih bijak daripada menjalankan model bahasa visi generik pada setiap halaman.

pdftotext adalah satu dump rata — perenggan dan jadual runtuh ke dalam dinding perkataan. Adobe Eksport ke Word memelihara susunatur tetapi menghasilkan.docx + kos ~$15/mo. Docling memelihara struktur SEMANTIK (tahap pengepala, senarai sebagai senarai, jadual sebagai jadual Markdown) dan output format LLMs dan alat dev boleh kedua-duanya menggunakan secara asli.

LlamaParse dan tidak terstruktur mempunyai aras percuma tetapi had halaman/bulan dan memerlukan kunci API. Docling-258M berjalan secara setempat pada GPU kami + adalah sepenuhnya Apache 2.0 sendiri-dihost, tiada pengukuran per-halaman, tiada kunci mendaftar masuk. Kualiti adalah bersaing dengan LlamaParse pada dokumen piawai.

Ya — jadual kembali sebagai jadual paip Markdown yang betul. Jadual berbilang-kolum / bersarang yang kompleks diratakan lebih agresif (pembatasan Markdown asas, bukan kesalahan model). Untuk ketulenan jadual sempurna, kami juga menyokong `format=html` melalui API yang melestarikan rowspan/colspan.

Granite-Docling melakukan langkah OCR sendiri — berfungsi pada PDF digital dan diimbas sama. Diimbas pada DPI yang lebih rendah (<150) kehilangan ketulenan teks; imbas semula pada 200+ DPI untuk hasil terbaik.

Kebanyakan persamaan yang dirender LaTeX datang melalui sebagai `$...$` matematik Markdown dalam baris. Untuk kertas penyelidikan dengan matematik berat, kami juga menawarkan alat akademik-paper-extract (Nougat) yang khusus diset untuk persamaan dan kutipan.

Kira-kira 5-10 saat per halaman pada H200 kami. Laporan 30-halaman adalah ~3-5 minit. Model kecil bermakna kumpulan PDF kecil secara asasnya percuma dalam kolam harian.

200 token per halaman, dengan lantai 500 token. Kontrak 5 halaman = 1,000 token. Laporan 30 halaman = 6,000 token. 5K pool percuma sehari merangkumi kebanyakan penggunaan biasa.

PDF — lahir-digital + diimbas kedua-duanya disokong. Maksimum muat naik 50 MB. Format dokumen lain (DOCX, EPUB, HTML, dll) adalah pada peta jalan; untuk sekarang muat naik-dan-tukar dengan alat penukaran pdf pertama.

Diproses segera, output Markdown disimpan (24h anonim / 7d tamat tempoh pautan-kongsi-berbayar), sumber PDF dipadam segera selepas pengekstrakan. Tidak digunakan untuk latihan. /privacy/ untuk polisi penuh.

Ya — POST `fail` berbilang bahagian ke /v1/document/pdf-to-markdown/. Kembalikan {markdown_url, halaman, pralihat, token, share_url}. Auth pemegang (sk-free-…) memberikan 10K token percuma/bulan. /api/ mempunyai contoh curl.

Daftar percuma untuk 30,000 token

Cipta Akaun Bebas

Tiada kad kredit diperlukan

Bagaimana anda menilai alat ini?

Love this tool? Share it!