Trình trích xuất PDF arXiv

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký
Mô hình:
+ GPT-5, Claude, Gemini
Đổi một bài báo, tạp chí, hoặc chương luận án arXiv — AI chuyển đổi nó thành văn bản LaTeX sạch. Phương trình toán học vẫn là phương trình, bố cục nhiều cột được mở ra, trích dẫn được bảo tồn. Được chạy bởi Meta Nougat- base. Name

Đưa tài liệu nghiên cứu PDF xuống đây hoặc nhấn để tải lên

PDF up to 50 MB. ~300 tokens per page (math-aware).

Đọc phương trình + mở cột... ~10 giây/ trang
Tùy chọn cao cấp
Kết quả
Tiền hết rồi. Lấy thêm biểu tượng
Muốn kết quả tốt hơn? Các mẫu cao cấp (GPT-5, Claude, Gemini) cung cấp chất lượng cao hơn. Xem kế hoạch

❤️ Love this tool? Share it!

Đăng ký để nhận được một liên kết giới thiệu và kiếm được 25.000 token cho mỗi người bạn.

Muốn thêm nữa không? Đăng ký miễn phí 30K token/ngày + 10K thưởng
Đăng ký miễn phí

Đang xử lý yêu cầu của bạn...

Bỏ một bản in arXiv, lấy văn bản LaTeX sạch với mọi phương trình được hiển thị trong dòng. Xử lý bố cục nhiều cột, tham chiếu được giữ nguyên. Miễn phí, được hỗ trợ bởi AI.

Cách sử dụng Trình trích xuất PDF arXiv

1
Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

2
Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

3
Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Trình trích xuất PDF arXiv tool on: ..."}]}'

Trình trích xuất PDF arXiv — FAQ

Đưa vào một bản in sẵn arXiv và AI sẽ chuyển đổi toàn bộ bài báo thành văn bản LaTeX sạch. Phương trình sẽ trở lại như LaTeX đúng, bố cục nhiều cột được mở ra, tham chiếu nguyên vẹn. Tạo trên Meta Nougat, được huấn luyện đặc biệt trên hàng triệu trang arXiv.

Tập hợp tập huấn của Nougat là arXiv preprints — vì vậy nó hoàn toàn sáng trên gia đình bố cục IEEE / ACM / NeurIPS / ICML / arXiv. Các trình trích xuất PDF khác bị nghẽn trên toán học đa cột; cái này được thiết kế cho nó.

Tải về PDF từ arXiv (ví dụ: arxiv.org/pdf/2401.12345), tải lên đây, lấy lại một tập tin.txt đơn với toàn bộ bài báo dưới dạng văn bản LaTeX. Không cần khóa API arXiv; chúng tôi chỉ cần PDF.

Có — đó là tính năng tiêu đề. Toán học trong dòng là `$... $`, toán học hiển thị là `$$... $$`. Thậm chí các phương trình raster hóa trong các bài báo cũ cũng được hiển thị chính xác vì mô hình coi mỗi trang như một hình ảnh.

Kiểu IEEE hai cột là bảng sắp xếp arXiv phổ biến nhất và Nougat mở nó ra theo thứ tự đọc đúng mà không cần cờ cấu hình.

Có — các dấu hiệu `[12]` / `[Smith2020]` trong dòng ở lại nơi chúng thuộc về, và danh sách tham khảo đầy đủ ở cuối được trích xuất nguyên vẹn để sử dụng BibTeX / Zotero.

~8-15 giây/ trang. Một bài báo hội nghị 12 trang mất ~2-3 phút. NeurIPS-style 30+ page papers with appendixes: 8-12 min. Submit and walk away.

Hầu hết các bài báo hội nghị arXiv (8-15 trang) là 2,400-4,500 token. Tập hợp miễn phí hàng ngày bao gồm ~ 1-2 bài báo / ngày cho người dùng đăng nhập; các kế hoạch trả tiền được không giới hạn.

Đưa nó đến ChatGPT / Claude để "giải thích bài báo này", xây dựng RAG cá nhân trên các bài báo đã lưu, tìm kiếm ngữ nghĩa trong danh sách đọc, sao chép các phương trình vào dự án LaTeX của riêng bạn, hoặc đọc bài báo như văn bản đơn giản trên điện thoại của bạn.

Có — Nougat OCR nội bộ. arXiv đã được LaTeX-render trong hơn 25 năm nên hầu hết các bản in trước đều là kỹ thuật số sạch. Các bài báo được quét cũ hoạt động nhưng độ chính xác toán học giảm một chút; quét lại ở 300+ DPI cho kết quả tốt nhất.

PDF bị xóa ngay sau khi trích xuất. Lưu lượng LaTeX được giữ 24h (nặc danh) / 7 ngày (liên kết chia sẻ trả phí). Không bao giờ được dùng cho mục đích huấn luyện. PDF arXiv là CC-BY công khai, nhưng chúng tôi không lưu chúng theo bất kỳ cách nào.

Có — POST nhiều phần `file` to /v1/document/academic-pdf/. JSON response with `text_url`, `pages`, `preview`, `tokens`, `share_url`. Bearer auth (sk-free-…) gives 10K free tokens/month. /api/ for curl example.

Đăng ký miễn phí 30,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

Love this tool? Share it!