Bộ trích xuất PDF PDF sang văn bản Trình trích xuất tài liệu học thuật Giấy nghiên cứu sang văn bản Trình trích xuất PDF arXiv Nhiều hơn →

PDF sang Markdown

Q: Nó xử lý toán học / phương trình như thế nào?

Hầu hết các phương trình LaTeX được hiển thị như là `$... $` toán học Markdown trong dòng. Đối với các bài báo nghiên cứu với toán học nặng, chúng tôi cũng cung cấp công cụ học thuật- bài báo- trích dẫn (Nougat) được điều chỉnh đặc biệt cho các phương trình và trích dẫn.

Q: Nó chạy nhanh thế nào?

Khoảng 5-10 giây mỗi trang trên H200 của chúng tôi. một báo cáo 30 trang là ~ 3-5 phút. mô hình nhỏ có nghĩa là các loạt các PDF nhỏ là cơ bản miễn phí trong hồ bơi hàng ngày.

Q: Nó có giá bao nhiêu?

200 token mỗi trang, với 500 token dưới sàn. Một hợp đồng 5 trang = 1000 token. Một báo cáo 30 trang = 6000 token.

Q: Định dạng đầu vào nào?

PDF — được hỗ trợ cả kỹ thuật số và quét. Tải lên tối đa 50 MB. Các định dạng tài liệu khác (DOCX, EPUB, HTML, v.v.) đang được lên kế hoạch; hiện tại, tải lên và chuyển đổi bằng công cụ chuyển đổi pdf trước.

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký

Drop a PDF — AI converts it to clean GitHub- flavored Markdown with headings, paragraphs, lists, tables, and code blocks all preserved. Powered by IBM Granite- Docling- 258M (Apache 2. 0). Nhanh hơn + thông minh hơn việc trích xuất văn bản đơn giản.

Chuyển đổi bất kỳ PDF nào thành Markdown có hương vị GitHub với các tiêu đề, bảng, danh sách và khối mã được bảo tồn. Được cung cấp bởi IBM Granite-Docling. Miễn phí, không giới hạn, không cần đăng ký.

Cách sử dụng PDF sang Markdown

Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

Tài liệu API Lấy khóa API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF sang Markdown tool on: ..."}]}'

Công cụ AI miễn phí liên quanName

Bộ trích xuất PDF

PDF sang văn bản

Trình trích xuất tài liệu học thuật

Giấy nghiên cứu sang văn bản

Trình trích xuất PDF arXiv

PDF sang Markdown — FAQ

Thả vào bất kỳ PDF nào và AI chuyển đổi nó thành Markdown có hương vị GitHub sạch — tiêu đề vẫn là tiêu đề, bảng vẫn là bảng, danh sách vẫn là danh sách, khối mã vẫn là khối mã. Vượt xa việc trích xuất văn bản đơn giản; hệ thống cấp bậc cấu trúc của tài liệu được bảo tồn để bạn có thể thả kết quả trực tiếp vào một trang docs, một ống dẫn LLM RAG, hoặc một chỉ mục tìm kiếm.

IBM Granite-Docling-258M (Apache 2.0). Tiny vision-to-sequence model fine-tuned for layout-aware document conversion — beats pdftotext + much faster + smarter than running a generic vision-language model on each page.

pdftotext là một bản thải phẳng — các đoạn văn và bảng bị sụp đổ thành một bức tường từ ngữ. Adobe Export to Word bảo tồn bố cục nhưng tạo ra.docx + chi phí ~ $ 15 / tháng. Docling bảo tồn cấu trúc SEMANTIC (mức tiêu đề, danh sách như danh sách, bảng như bảng Markdown) và xuất một định dạng LLMs và các công cụ phát triển có thể tiêu thụ bản địa.

LlamaParse và unstructured đều có các cấp miễn phí nhưng giới hạn số trang/tháng và yêu cầu một khóa API. Docling-258M chạy cục bộ trên GPU của chúng tôi + Apache 2.0 tự quản lý hoàn toàn, không tính theo trang, không đăng ký khóa. Chất lượng cạnh tranh với LlamaParse trên các tài liệu tiêu chuẩn.

Vâng — các bảng được trả về như các bảng ống Markdown chuẩn. Các bảng phức tạp nhiều cột / lồng nhau được phẳng hóa mạnh hơn (một hạn chế cơ bản của Markdown, không phải lỗi của mô hình). Để hoàn hảo về độ chính xác của bảng, chúng tôi cũng hỗ trợ `format=html` thông qua API bảo tồn rowspan/colspan.

Granite- Docling tự thực hiện bước OCR — hoạt động trên cả PDF kỹ thuật số và PDF quét. Quét ở DPI thấp (< 150) mất một số độ chính xác văn bản; quét lại ở 200+ DPI cho kết quả tốt nhất.

Hầu hết các phương trình LaTeX được hiển thị như là `$... $` toán học Markdown trong dòng. Đối với các bài báo nghiên cứu với toán học nặng, chúng tôi cũng cung cấp công cụ học thuật- bài báo- trích dẫn (Nougat) được điều chỉnh đặc biệt cho các phương trình và trích dẫn.

Khoảng 5-10 giây mỗi trang trên H200 của chúng tôi. một báo cáo 30 trang là ~ 3-5 phút. mô hình nhỏ có nghĩa là các loạt các PDF nhỏ là cơ bản miễn phí trong hồ bơi hàng ngày.

200 token mỗi trang, với 500 token dưới sàn. Một hợp đồng 5 trang = 1000 token. Một báo cáo 30 trang = 6000 token.

PDF — được hỗ trợ cả kỹ thuật số và quét. Tải lên tối đa 50 MB. Các định dạng tài liệu khác (DOCX, EPUB, HTML, v.v.) đang được lên kế hoạch; hiện tại, tải lên và chuyển đổi bằng công cụ chuyển đổi pdf trước.

Xử lý ngay lập tức, kết quả Markdown được giữ lại (24h ẩn danh / 7d có giá trị chia sẻ- liên kết hết hạn), PDF nguồn được xóa ngay sau khi trích xuất. Không bao giờ được dùng cho huấn luyện. / privacy / cho chính sách đầy đủ.

Có — POST một `file` đa phần đến /v1/document/pdf-to-markdown/. Trả lại {markdown_url, pages, preview, tokens, share_url}. Bearer auth (sk-free-…) cho 10K tokens miễn phí/tháng. /api/ có ví dụ curl.

Đăng ký miễn phí 30,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

PDF sang Markdown

Kết quả

Cách sử dụng PDF sang Markdown

Nhập thông tin

Nhấn để tạo

Tải về và chia sẻ

Dùng công cụ này qua API

Công cụ AI miễn phí liên quanName

PDF sang Markdown — FAQ

AI PDF to Markdown là gì?

Kiểu nào dùng?

Nó khác nhau như thế nào so với pdftotext / Adobe export?

Nó so sánh như thế nào với LlamaParse / unstructured.io?

Nó có xử lý bàn không?

Còn về các file PDF quét (hình ảnh) thì sao?

Nó xử lý toán học / phương trình như thế nào?

Nó chạy nhanh thế nào?

Nó có giá bao nhiêu?

Định dạng đầu vào nào?

Có lưu các PDF tải lên không?

Có API không?

Lấy 10.000 token miễn phí

Chờ đã — Cầm 10K token miễn phí!

Muốn thêm nữa không?