PDF sang Markdown

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký
Mô hình:
+ GPT-5, Claude, Gemini
Drop a PDF — AI converts it to clean GitHub- flavored Markdown with headings, paragraphs, lists, tables, and code blocks all preserved. Powered by IBM Granite- Docling- 258M (Apache 2. 0). Nhanh hơn + thông minh hơn việc trích xuất văn bản đơn giản.

Thả PDF vào đây hoặc nhấn để tải lên

PDF lên đến 50 MB. ~200 tokens mỗi trang.

Đang trích xuất Markdown nhận biết bố cục… ~5-10 giây/ trang
Tải Markdown (.md)
Tùy chọn cao cấp
Kết quả
Tiền hết rồi. Lấy thêm biểu tượng
Muốn kết quả tốt hơn? Các mẫu cao cấp (GPT-5, Claude, Gemini) cung cấp chất lượng cao hơn. Xem kế hoạch

❤️ Love this tool? Share it!

Đăng ký để nhận được một liên kết giới thiệu và kiếm được 25.000 token cho mỗi người bạn.

Muốn thêm nữa không? Đăng ký miễn phí 30K token/ngày + 10K thưởng
Đăng ký miễn phí

Đang xử lý yêu cầu của bạn...

Chuyển đổi bất kỳ PDF nào thành Markdown có hương vị GitHub với các tiêu đề, bảng, danh sách và khối mã được bảo tồn. Được cung cấp bởi IBM Granite-Docling. Miễn phí, không giới hạn, không cần đăng ký.

Cách sử dụng PDF sang Markdown

1
Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

2
Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

3
Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF sang Markdown tool on: ..."}]}'

PDF sang Markdown — FAQ

Thả vào bất kỳ PDF nào và AI chuyển đổi nó thành Markdown có hương vị GitHub sạch — tiêu đề vẫn là tiêu đề, bảng vẫn là bảng, danh sách vẫn là danh sách, khối mã vẫn là khối mã. Vượt xa việc trích xuất văn bản đơn giản; hệ thống cấp bậc cấu trúc của tài liệu được bảo tồn để bạn có thể thả kết quả trực tiếp vào một trang docs, một ống dẫn LLM RAG, hoặc một chỉ mục tìm kiếm.

IBM Granite-Docling-258M (Apache 2.0). Tiny vision-to-sequence model fine-tuned for layout-aware document conversion — beats pdftotext + much faster + smarter than running a generic vision-language model on each page.

pdftotext là một bản thải phẳng — các đoạn văn và bảng bị sụp đổ thành một bức tường từ ngữ. Adobe Export to Word bảo tồn bố cục nhưng tạo ra.docx + chi phí ~ $ 15 / tháng. Docling bảo tồn cấu trúc SEMANTIC (mức tiêu đề, danh sách như danh sách, bảng như bảng Markdown) và xuất một định dạng LLMs và các công cụ phát triển có thể tiêu thụ bản địa.

LlamaParse và unstructured đều có các cấp miễn phí nhưng giới hạn số trang/tháng và yêu cầu một khóa API. Docling-258M chạy cục bộ trên GPU của chúng tôi + Apache 2.0 tự quản lý hoàn toàn, không tính theo trang, không đăng ký khóa. Chất lượng cạnh tranh với LlamaParse trên các tài liệu tiêu chuẩn.

Vâng — các bảng được trả về như các bảng ống Markdown chuẩn. Các bảng phức tạp nhiều cột / lồng nhau được phẳng hóa mạnh hơn (một hạn chế cơ bản của Markdown, không phải lỗi của mô hình). Để hoàn hảo về độ chính xác của bảng, chúng tôi cũng hỗ trợ `format=html` thông qua API bảo tồn rowspan/colspan.

Granite- Docling tự thực hiện bước OCR — hoạt động trên cả PDF kỹ thuật số và PDF quét. Quét ở DPI thấp (< 150) mất một số độ chính xác văn bản; quét lại ở 200+ DPI cho kết quả tốt nhất.

Hầu hết các phương trình LaTeX được hiển thị như là `$... $` toán học Markdown trong dòng. Đối với các bài báo nghiên cứu với toán học nặng, chúng tôi cũng cung cấp công cụ học thuật- bài báo- trích dẫn (Nougat) được điều chỉnh đặc biệt cho các phương trình và trích dẫn.

Khoảng 5-10 giây mỗi trang trên H200 của chúng tôi. một báo cáo 30 trang là ~ 3-5 phút. mô hình nhỏ có nghĩa là các loạt các PDF nhỏ là cơ bản miễn phí trong hồ bơi hàng ngày.

200 token mỗi trang, với 500 token dưới sàn. Một hợp đồng 5 trang = 1000 token. Một báo cáo 30 trang = 6000 token.

PDF — được hỗ trợ cả kỹ thuật số và quét. Tải lên tối đa 50 MB. Các định dạng tài liệu khác (DOCX, EPUB, HTML, v.v.) đang được lên kế hoạch; hiện tại, tải lên và chuyển đổi bằng công cụ chuyển đổi pdf trước.

Xử lý ngay lập tức, kết quả Markdown được giữ lại (24h ẩn danh / 7d có giá trị chia sẻ- liên kết hết hạn), PDF nguồn được xóa ngay sau khi trích xuất. Không bao giờ được dùng cho huấn luyện. / privacy / cho chính sách đầy đủ.

Có — POST một `file` đa phần đến /v1/document/pdf-to-markdown/. Trả lại {markdown_url, pages, preview, tokens, share_url}. Bearer auth (sk-free-…) cho 10K tokens miễn phí/tháng. /api/ có ví dụ curl.

Đăng ký miễn phí 30,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

Love this tool? Share it!