TrOCR Base

Q: TrOCR Base是否保存表格结构或数学公式?

显示布局引擎 (GOT-OCR、 标记、 Florence-2) 返回公式的 Markdown/ HTML 表格和 LaTeX 。 纯文本引擎返回文本没有结构 - 请检查此模式的输出模式 。

Q: TrOCR Base接受什么输入格式?

PNG、JPG、WebP、HIC、BMP,加上单页和多页PDF,最多不超过50MB。 扭曲或旋转的页面在提取前会自动校正。

Q: 我能用...TrOCR Base... 来批量OCR吗?

是 -/batch/ 接受一个图像/ PDF 的文件夹。 每个提取地都位于 / account/? tab= history。 文件夹树保护使用 API 。

Q: 是否有API为 TrOCR Base?

是 — POST 您的文件到 /v1/ ocr/ 型号= "TrOCR Base" 。 返回 JSON 文本+ (如果支持) 版式+ 字级边框 。 / api/ 有完整引用 。

Q: 当I OCR 敏感文件的...TrOCR Base... 的隐私呢?

自托管模型将您的文件保存在我们的 GPU 中; 溢价通过政治部。 文件在共享窗口后被删除。 我们不培训您的投入 。

Free.ai (self-hosted) · ocr · ~300 贴现符号数符数 page

上传文档/ 图像

在此放下文件或单击以浏览文件

~300 贴现符号数符数 page

TrOCR Base 是 an OCR 模型由 Microsoft 建造的。最强的在Handwritten documents, low-resource scripts.。在Free.ai GPUs上自行托管——免费运行于您的每日代币池({tpm_signs} 每页( 每页))。在Free.ai允许的商业用途`MIT'下释放。

通过 API 使用

OpenAI- 兼容的 REST API。生成一个密钥, 并在秒内调用此模式。

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"trocr-base","prompt":"your prompt here"}'

API 文件获取 API 密钥

类似模式

GOT-OCR v2

浏览所有模型 →

常问问题

-TrOCR Base从图像和 PDFs 中提取文本。上传扫描页、截图或文件照片, 和TrOCR Base 返回文本—— 保存换行符和(在功能引擎上)表格、公式和结构。

TrOCR Base 处理几十个脚本——拉丁文、西里尔文、中日文、阿拉伯文、德瓦纳加里文等。

对清洁印刷式笔迹而言,是的;缩写和短手更难。 --TrOCR和现代变压器引擎明显优于传统的笔迹魔方。

显示布局引擎 (GOT-OCR、标记、 Florence-2) 返回公式的 Markdown/ HTML 表格和 LaTeX 。纯文本引擎返回文本没有结构 - 请检查此模式的输出模式。

-TrOCR Base在我们的GPUs上运行,从你的每日免费游泳池;5 $ 2000 现款代币。~ 每页300个。

PNG、JPG、WebP、HIC、BMP,加上单页和多页PDF,最多不超过50MB。扭曲或旋转的页面在提取前会自动校正。

纯打印页面上的字符精度一般为>98%,低频照片、严重偏斜扫描或异常字体会下降。在准确性重要时,比较/ocr/compare/ 的引擎。

是 -/batch/ 接受一个图像/ PDF 的文件夹。每个提取地都位于 / account/? tab= history。文件夹树保护使用 API 。

是 — POST 您的文件到 /v1/ ocr/ 型号= "TrOCR Base" 。返回 JSON 文本+ (如果支持) 版式+ 字级边框。 / api/ 有完整引用。

自托管模型将您的文件保存在我们的 GPU 中; 溢价通过政治部。文件在共享窗口后被删除。我们不培训您的投入。

Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.

通常情况下,每页1-5秒。布局认知引擎(表、数学)需要更长的时间。多页的 PDF 规模大致是线性。

TrOCR Base

通过 API 使用

类似模式

常问问题

-TrOCR Base是做什么的?

TrOCR Base 支持什么语言?

TrOCR Base能读字吗?

TrOCR Base是否保存表格结构或数学公式?

每页TrOCR Base$_多少钱?

TrOCR Base接受什么输入格式?

TrOCR Base 的准确度如何?

我能用...TrOCR Base... 来批量OCR吗?

是否有API为 TrOCR Base?

当I OCR 敏感文件的...TrOCR Base... 的隐私呢?

用于商业用途的TrOCR Base 输出是否安全?

TrOCR Base需要多长时间?

买一万个免费当当

等等,拿10K自由调音!

还要吗?