GOT-OCR v2
Free.ai
·
ocr
·
~500 توکنها در هر page
GOT-OCR v2 is a مدل OCR. مسیریابی از طریق مدلهای خارجی — ~500 tokens در هر صفحه (۵۰٪ مارکاپ بر روی هزینههای بالادستی).
استفاده از طریق API
API REST سازگار با OpenAI. یک کلید تولید کنید و این مدل را در چند ثانیه فراخوانی کنید.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
مستندات API
دریافت کلید API
پرسشهای متداول
GOT-OCR v2 متن را از تصاویر و پیدیافها استخراج میکند. یک صفحه اسکن شده، یک تصویر صفحه نمایش یا یک عکس از یک سند را بارگذاری کنید و GOT-OCR v2 متن را با حفظ شکست خط و (در موتورهای قادر) جدولها، فرمولها و ساختار برمیگرداند.
GOT-OCR v2 دهها نویسه را پشتیبانی میکند — لاتین، سیریلیک، CJK، عربی، Devanagari و بیشتر. /ocr/ landing دارای لیست کامل زبانها برای هر موتور است.
TrOCR و موتورهای مبتنی بر ترانسفورماتور مدرن بهطور قابل توجهی بهتر از Tesseract قدیمی در نوشتن با دست هستند.
موتورهای آگاه از طرح (GOT-OCR, Marker, Florence-2) جدولهای Markdown/HTML و LaTeX را برای فرمولها برمیگردانند. موتورهای متن ساده متن بدون ساختار را برمیگردانند — حالت خروجی این مدل را بررسی کنید.
GOT-OCR v2 یک موتور OCR پرمیوم است. ~۵۰۰ تا ۱۵۰۰ توکن در هر صفحه. ۱ دلار = ۷۵۰۰۰۰ توکن.
PNG, JPG, WebP, HEIC, BMP, plus single- and multi-page PDFs up to 50 MB.
دقت کاراکتر معمولاً در صفحات چاپ شده تمیز بیشتر از ۹۸٪ است، در عکسهای با وضوح پایین، اسکنهای شدیداً انحرافی یا فونتهای غیرمعمول افت میکند.
بله — /batch/ یک پوشه از تصاویر/PDFها را میپذیرد. هر استخراجی در /account/?tab=history قرار میگیرد. برای حفظ درخت پوشه از API استفاده کنید.
بله — POST فایل خود را به /v1/ocr/ با model="GOT-OCR v2". با متن + (اگر پشتیبانی شود) طرح + جعبههای مرزی سطح کلمه JSON را برمیگرداند. /api/ دارای مرجع کامل است.
مدلهای خود میزبانی شده پرونده شما را در GPUهای ما نگه میدارند؛ پریمیوم با DPA از میان میگذرد. سندها پس از پنجره اشتراک حذف میشوند. ما ورودیهای شما را آموزش نمیدهیم.
Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.
معمولاً ۱–۵ ثانیه در هر صفحه. موتورهای آگاه از طرح (جدولها، ریاضیات) بیشتر طول میکشد.