PDF sang Markdown Bộ trích xuất PDF PDF sang văn bản Trình trích xuất tài liệu học thuật Giấy nghiên cứu sang văn bản Nhiều hơn →

Trình trích xuất PDF arXiv

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký

Đổi một bài báo, tạp chí, hoặc chương luận án arXiv — AI chuyển đổi nó thành văn bản LaTeX sạch. Phương trình toán học vẫn là phương trình, bố cục nhiều cột được mở ra, trích dẫn được bảo tồn. Được chạy bởi Meta Nougat- base. Name

Bỏ một bản in arXiv, lấy văn bản LaTeX sạch với mọi phương trình được hiển thị trong dòng. Xử lý bố cục nhiều cột, tham chiếu được giữ nguyên. Miễn phí, được hỗ trợ bởi AI.

Cách sử dụng Trình trích xuất PDF arXiv

Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

Tài liệu API Lấy khóa API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Trình trích xuất PDF arXiv tool on: ..."}]}'

Công cụ AI miễn phí liên quanName

PDF sang Markdown

Bộ trích xuất PDF

PDF sang văn bản

Trình trích xuất tài liệu học thuật

Giấy nghiên cứu sang văn bản

Trình trích xuất PDF arXiv — FAQ

Đưa vào một bản in sẵn arXiv và AI sẽ chuyển đổi toàn bộ bài báo thành văn bản LaTeX sạch. Phương trình sẽ trở lại như LaTeX đúng, bố cục nhiều cột được mở ra, tham chiếu nguyên vẹn. Tạo trên Meta Nougat, được huấn luyện đặc biệt trên hàng triệu trang arXiv.

Tập hợp tập huấn của Nougat là arXiv preprints — vì vậy nó hoàn toàn sáng trên gia đình bố cục IEEE / ACM / NeurIPS / ICML / arXiv. Các trình trích xuất PDF khác bị nghẽn trên toán học đa cột; cái này được thiết kế cho nó.

Tải về PDF từ arXiv (ví dụ: arxiv.org/pdf/2401.12345), tải lên đây, lấy lại một tập tin.txt đơn với toàn bộ bài báo dưới dạng văn bản LaTeX. Không cần khóa API arXiv; chúng tôi chỉ cần PDF.

Có — đó là tính năng tiêu đề. Toán học trong dòng là `$... $`, toán học hiển thị là `$$... $$`. Thậm chí các phương trình raster hóa trong các bài báo cũ cũng được hiển thị chính xác vì mô hình coi mỗi trang như một hình ảnh.

Kiểu IEEE hai cột là bảng sắp xếp arXiv phổ biến nhất và Nougat mở nó ra theo thứ tự đọc đúng mà không cần cờ cấu hình.

Có — các dấu hiệu `[12]` / `[Smith2020]` trong dòng ở lại nơi chúng thuộc về, và danh sách tham khảo đầy đủ ở cuối được trích xuất nguyên vẹn để sử dụng BibTeX / Zotero.

~8-15 giây/ trang. Một bài báo hội nghị 12 trang mất ~2-3 phút. NeurIPS-style 30+ page papers with appendixes: 8-12 min. Submit and walk away.

Hầu hết các bài báo hội nghị arXiv (8-15 trang) là 2,400-4,500 token. Tập hợp miễn phí hàng ngày bao gồm ~ 1-2 bài báo / ngày cho người dùng đăng nhập; các kế hoạch trả tiền được không giới hạn.

Đưa nó đến ChatGPT / Claude để "giải thích bài báo này", xây dựng RAG cá nhân trên các bài báo đã lưu, tìm kiếm ngữ nghĩa trong danh sách đọc, sao chép các phương trình vào dự án LaTeX của riêng bạn, hoặc đọc bài báo như văn bản đơn giản trên điện thoại của bạn.

Có — Nougat OCR nội bộ. arXiv đã được LaTeX-render trong hơn 25 năm nên hầu hết các bản in trước đều là kỹ thuật số sạch. Các bài báo được quét cũ hoạt động nhưng độ chính xác toán học giảm một chút; quét lại ở 300+ DPI cho kết quả tốt nhất.

PDF bị xóa ngay sau khi trích xuất. Lưu lượng LaTeX được giữ 24h (nặc danh) / 7 ngày (liên kết chia sẻ trả phí). Không bao giờ được dùng cho mục đích huấn luyện. PDF arXiv là CC-BY công khai, nhưng chúng tôi không lưu chúng theo bất kỳ cách nào.

Có — POST nhiều phần `file` to /v1/document/academic-pdf/. JSON response with `text_url`, `pages`, `preview`, `tokens`, `share_url`. Bearer auth (sk-free-…) gives 10K free tokens/month. /api/ for curl example.

Đăng ký miễn phí 30,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

Trình trích xuất PDF arXiv

Kết quả

Cách sử dụng Trình trích xuất PDF arXiv

Nhập thông tin

Nhấn để tạo

Tải về và chia sẻ

Dùng công cụ này qua API

Công cụ AI miễn phí liên quanName

Trình trích xuất PDF arXiv — FAQ

Tìm hiểu về arXiv PDF Extractor

Tại sao lại là arXiv?

Tôi dùng nó như thế nào?

Phương trình được đưa ra?

Trật tự đọc nhiều cột?

Bảo tồn trích dẫn?

Tốc độ?

Giá cả?

Tôi có thể làm gì với kết quả?

Có hỗ trợ scan arXiv PDF không?

Sự riêng tư?

API?

Lấy 10.000 token miễn phí

Chờ đã — Cầm 10K token miễn phí!

Muốn thêm nữa không?