GOT-OCR v2
Free.ai
·
ocr
·
~500 贴现符号数符数 page
GOT-OCR v2是anOCR 模型。 Routed through external models — ~500 tokens 每页( 每页) (50% markup over upstream cost).
常问问题
-GOT-OCR v2从图像和 PDFs 中提取文本。上传扫描页、截图或文件照片, 和GOT-OCR v2 返回文本—— 保存换行符和(在功能引擎上)表格、公式和结构。
GOT-OCR v2 处理几十个脚本——拉丁文、西里尔文、中日文、阿拉伯文、德瓦纳加里文等。
对清洁印刷式笔迹而言,是的;缩写和短手更难。 --TrOCR和现代变压器引擎明显优于传统的笔迹魔方。
Layout-aware engines (GOT-OCR, Marker, Florence-2) return Markdown/HTML tables and LaTeX for formulas. Plain-text engines return text without structure — check this model's output mode.
-GOT-OCR v2 是一个高级 OCR 引擎。 每页大约~ 500-1 500 个标记。 1 = 75000 个标记 。
PNG、JPG、WebP、HIC、BMP,加上单页和多页PDF,最多不超过50MB。 扭曲或旋转的页面在提取前会自动校正。
纯打印页面上的字符精度一般为>98%,低频照片、严重偏斜扫描或异常字体会下降。在准确性重要时,比较/ocr/compare/ 的引擎 。
是 -/batch/ 接受一个图像/ PDF 的文件夹。 每个提取地都位于 / account/? tab= history。 文件夹树保护使用 API 。
是 — POST 您的文件到 /v1/ ocr/ 型号= "GOT-OCR v2" 。 返回 JSON 文本+ (如果支持) 版式+ 字级边框 。 / api/ 有完整引用 。
自托管模型将您的文件保存在我们的 GPU 中; 溢价通过政治部。 文件在共享窗口后被删除。 我们不培训您的投入 。
Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.
通常情况下,每页1-5秒。 布局认知引擎(表、数学)需要更长的时间。多页的 PDF 规模大致是线性。