PDF 提取器 PDF 到文本的 PDF 学术论文摘录研究论文到文字 arXiv PDF 提取器更多 →

PDF 到标记

Q: 它能处理桌子吗?

是的—— 表格作为适当的 Markdown 管道桌返回。 复杂的多栏/ 嵌套的桌子被更激烈地压平( 基本的标记下限制, 而不是模型的过错 ) 。 对于完美的表格忠诚性, 我们还支持通过保护行隔/ 双圈的 API 支持“ format=html ” 。

Q: 它如何处理数学/方程式?

大部分LaTeX-发送方程式作为内线`$...$'马克唐数学通过,对于重数学研究论文,我们还提供了专门根据方程式和引文调整的学术-纸质提取工具(Nougat)。

Q: 速度有多快?

30页的报告是~3-5分钟。小模型意味着每天的池子里基本上免费有几批小型PDF。

Q: 多少钱?

5页合同=1 000份,30页报告=6 000份,5K每日免费游泳池覆盖最常用的用途。

Q: 哪些投入格式?

PDF- 天生数字+扫描器都支持 。 最大 50 MB 上传 。 其他文档格式( DOCX、 EPUB、 HTML 等) 在路线图上; 现在先上传并转换到 pdf 转换工具 。

商业用途OK 380+模型无水印不需要注册

丢弃一个 PDF - AI 将它转换成干净的 GitHub- flavered Markdown, 带有标题、段落、列表、表格和代码块, 全部保存。 IBM Granite- Docling 258M (Apache 2. 0) 的动力。比纯文本提取更快 + 更聪明。

将任何 PDF 转换为干净的 GitHub-flavered 标记, 并保存标题、表格、列表和代码块。由 IBM Granite- Docling 驱动。自由、无限制、没有注册。

如何使用 PDF 到标记

输入

键入文本、上传文件或描述您想要的东西。不需要账户。

点击生成

我们的人工智能使用最佳的开放源码模型,在秒内处理你的请求。

下载共享( S)

下载、复制或分享您的结果。免费个人和商业使用。

通过 API 使用此工具

从您自己的代码中自动启用此工具。 OpenAI 兼容的 REST 端点、 Bearer-tok 异常点、不需要额外的 SDK 。 Token 成本符合网络界面。

API 文件获取 API 密钥

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF 到标记 tool on: ..."}]}'

PDF 到标记 — FAQ

在任何 PDF 中投放, AI 将其转换为干净的 GitHub-flavered Markdown — 标题保持标题、表格保持牌、列表保持牌名单、代码区块保持代码区块。远远超出了纯文本提取范围; 文档的结构等级被保留, 这样您就可以将输出直接降到 docs 站点、 LLM RAG 管道或搜索索引。

IBM Granite-Docling-258M(Apache 2. 0). 微小的视觉到序列模型,经过微调,用于布局-感知文档转换——比在每页上运行通用的视觉语言模型快得多,比pdftotext+快得多,比在每页上运行通用的视觉语言模型聪明得多。

pdftext 是一个平坦的垃圾堆, 段落和表格破碎成一堵单词墙。 Adobe Exporto Word 保存布局, 却产生.docx + 成本~ 15 mo 。 Docling 保存了 SEMANTIC 结构( 标题级别、列表列表、表格作为 Markdown 表格), 输出出一种格式 LLMS 和 dev 工具都可以本地使用。

LlamaParse and unstructured both have free tiers but cap pages/month and require an API key. Docling-258M runs locally on our GPU + is fully self-hosted Apache 2.0, no per-page metering, no key signup. Quality is competitive with LlamaParse on standard documents.

是的—— 表格作为适当的 Markdown 管道桌返回。复杂的多栏/ 嵌套的桌子被更激烈地压平( 基本的标记下限制, 而不是模型的过错 ) 。对于完美的表格忠诚性, 我们还支持通过保护行隔/ 双圈的 API 支持“ format=html ” 。

微粒环流使OCR 一步步本身——对生来数字和扫描的PDF都一样。在较低的DPI( < 150) 扫描时,失去一些文字准确性;在200+DPI重新扫描,以取得最佳效果。

大部分LaTeX-发送方程式作为内线`$...$'马克唐数学通过,对于重数学研究论文,我们还提供了专门根据方程式和引文调整的学术-纸质提取工具(Nougat)。

30页的报告是~3-5分钟。小模型意味着每天的池子里基本上免费有几批小型PDF。

5页合同=1 000份,30页报告=6 000份,5K每日免费游泳池覆盖最常用的用途。

PDF- 天生数字+扫描器都支持。最大 50 MB 上传。其他文档格式( DOCX、 EPUB、 HTML 等) 在路线图上; 现在先上传并转换到 pdf 转换工具。

立即处理后, 保留 Markdown 输出( 24h 匿名 / 7d 付费共享链接过期), 提取后立即删除源 PDF 。从未用于培训。 / privacy / 用于整个保单。

是 — POST 是一个多部分“ 文件” 到 / v1/ document/ pdf- to- markdown/ 。返回 {markdown_ url, 页面、预览、符号、共享_ url} 。 Beader auth (sk- free-...) 给 $10K free assesses/ month 。 / api/ 有 curl 示例。

免费注册一万个符号

创建自由账户

无需信用卡

你会如何评分这个工具?

PDF 到标记

结果成果

如何使用 PDF 到标记

输入

点击生成

下载共享( S)

通过 API 使用此工具

相关免费相关 AI 工具

PDF 到标记 — FAQ

PDF 到标记

结果成果

如何使用 PDF 到标记

输入

点击生成

下载共享( S)

通过 API 使用此工具

相关免费 相关 AI 工具

PDF 到标记 — FAQ

什么是AI PDF 到Markdown?

哪个模型赋予它力量?

它与pdftotext / Adobe 导出有何不同?

How does it compare to LlamaParse / unstructured.io?

它能处理桌子吗?

扫描(图像)PDFs怎么样?

它如何处理数学/方程式?

速度有多快?

多少钱?

哪些投入格式?

上传 PDF 存储了吗?

有API吗?

买一万个免费当当

等等,拿10K自由调音!

还要吗?

相关免费相关 AI 工具