arXiv PDF 提取器

商业用途OK 380+模型 无水印 不需要注册
型号 :
+ GPT-5, Claude, Gemini
丢弃 arXiv 预印、 日记纸或论文章节 —— AI 将它转换为干净的 LaTeX 保存文本 。 数学方程式作为方程式, 多列布局不响, 引用被保存 。 由 Meta Nougat 基础授权 。

在这里或单击上传, 丢弃研究纸 PDF 或点击上传

PDF 至多 50 MB. ~ 每页300 个标记( math-aware) 。

读取方程式 + 卸载列...~ 10 秒/页
高级选项
结果成果
声调越来越低 获取更多当当量
想要更好的结果吗? 模型 (GPT-5, Claude, Gemini) deliver higher quality. 查看计划

❤️ Love this tool? Share it!

< a href="/ signup/" style="color:#16A34A" > 签名 以获得查询链接, 并获得每个朋友25,000个代币的 。

还要吗? 每天免费注册30K个纪念品 + 10K 奖金
免费注册

处理您的请求...

丢弃 arXiv 预印, 获得干净的 LaTeX- flaavored 文本, 加上每个公式的内嵌。 处理多列布局, 引用保持完整 。 自由, AI 驱动 。

如何使用 arXiv PDF 提取器

1
输入

键入文本、上传文件或描述您想要的东西。不需要账户 。

2
点击生成

我们的人工智能使用最佳的开放源码模型,在秒内处理你的请求。

3
下载共享( S)

下载、复制或分享您的结果。 免费个人和商业使用 。

通过 API 使用此工具

从您自己的代码中自动启用此工具。 OpenAI 兼容的 REST 端点、 Bearer-tok 异常点、 不需要额外的 SDK 。 Token 成本符合网络界面 。

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF 提取器 tool on: ..."}]}'

arXiv PDF 提取器 — FAQ

投放 arXiv 预印, AI 将整张纸转换为干净的 LaTeX 保存文本。 方程式以正确的 LaTeX 、 多列布局未损坏、 参考文件完好无损的形式返回。 在 Meta Nougat 上建造, 专门为数百万 arxiv 页面培训 。

Nougat的训练材料是ArXiv预印本——因此它绝对闪耀在IEEE/ACM/NeurIPS/ICML/ArXiv布局上。其他PDF提取器在多栏数学上窒息;这是为它设计的。

从 arXiv 下载 PDF (例如 arxiv.org/pdf/ 2401.12345), 上传到这里, 并拿回一张以 laTeX- flaverored 文本 格式为整页的. txt 文件。 不需要 arXiv API 密钥; 我们只需要 PDF 。

是的,这是头条新闻的特征,内线数学是`$...$',显示数学是`$...$$',甚至老论文中的光栅方程式也是正确的,因为模型把每一页都当作图像。

自动处理。 两列的 IEEE 风格是最常见的 arXiv 版式, Nougat 将它解开为正常的读取顺序, 没有配置标记 。

是——`[12] /`[Smith/2020]'标记留在原处,最后完整的参考清单完好无损地提取,供下游BibTeX/Zotero使用。

12页的会议文件需要时间~2-3分钟。 NeurIPS 30+页式文件,附录:8-12分钟。 提交并离开。

300个代币文件/页,600楼。大多数奥克西夫会议文件(8-15页)为2 400-4 500个代币文件,每日免费游泳池为注册用户提供~1-2份文件/日;付费计划是无限的。

Feed it to ChatGPT / Claude for "explain this paper", build personal RAG over your saved papers, semantic-search your reading list, copy equations into your own LaTeX project, or read the paper as plain text on your phone.

是的 — 内部的 Nougat OCRs. ARXiv 已经由LaTeX 发送了25年以上,所以大多数预印都是干净的数字化的。 更老的扫描文件工作,但数学忠诚度略有下降;300+DPI重新扫描,以取得最佳效果。

提取后立即删除 PDF 。 LaTeX 输出为 24h( 匿名) / 7 天( 付费共享链接) 。 从未用于培训 。 arXiv PDF 是公共的 CC- BY, 但我们不以任何方式存储它们 。

是——POST多部分`文件/v1/document/academic-pdf/.JSON以`text_url'、`pages'、`preview'、`tokens'、`share_url'答复`file'to/v1/document/academic-pdf/.pi/api/curl 举例说,Bearer auth(无.)每月免费给10K个代币。

免费注册一万个符号

创建自由账户

无需信用卡

你会如何评分这个工具?

Love this tool? Share it!