TrOCR Base
Free.ai (self-hosted)
·
ocr
·
~300 贴现符号数符数 page
TrOCR Base 是 an OCR 模型 由 Microsoft 建造的 。 最强的在Handwritten documents, low-resource scripts.。 在Free.ai GPUs上自行托管——免费运行于您的每日代币池({tpm_signs} 每页( 每页))。 在Free.ai允许的商业用途`MIT'下释放。
常问问题
-TrOCR Base从图像和 PDFs 中提取文本。上传扫描页、截图或文件照片, 和TrOCR Base 返回文本—— 保存换行符和(在功能引擎上)表格、公式和结构。
TrOCR Base 处理几十个脚本——拉丁文、西里尔文、中日文、阿拉伯文、德瓦纳加里文等。
对清洁印刷式笔迹而言,是的;缩写和短手更难。 --TrOCR和现代变压器引擎明显优于传统的笔迹魔方。
显示布局引擎 (GOT-OCR、 标记、 Florence-2) 返回公式的 Markdown/ HTML 表格和 LaTeX 。 纯文本引擎返回文本没有结构 - 请检查此模式的输出模式 。
-TrOCR Base在我们的GPUs上运行,从你的每日免费游泳池;5 $ 2000 现款代币。~ 每页300个。
PNG、JPG、WebP、HIC、BMP,加上单页和多页PDF,最多不超过50MB。 扭曲或旋转的页面在提取前会自动校正。
纯打印页面上的字符精度一般为>98%,低频照片、严重偏斜扫描或异常字体会下降。在准确性重要时,比较/ocr/compare/ 的引擎 。
是 -/batch/ 接受一个图像/ PDF 的文件夹。 每个提取地都位于 / account/? tab= history。 文件夹树保护使用 API 。
是 — POST 您的文件到 /v1/ ocr/ 型号= "TrOCR Base" 。 返回 JSON 文本+ (如果支持) 版式+ 字级边框 。 / api/ 有完整引用 。
自托管模型将您的文件保存在我们的 GPU 中; 溢价通过政治部。 文件在共享窗口后被删除。 我们不培训您的投入 。
Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.
通常情况下,每页1-5秒。 布局认知引擎(表、数学)需要更长的时间。多页的 PDF 规模大致是线性。