GOT-OCR v2

Free.ai · ocr · ~500 توکنها در هر page

پرونده‌ای را اینجا بگذارید یا برای مرور کلیک کنید

~500 توکنها در هر page
در پردازنده‌های گرافیکی ما آزادانه اجرا می‌شود. ارتقا برای GOT-OCR v2 →

GOT-OCR v2 is a مدل OCR. مسیریابی از طریق مدل‌های خارجی — ~500 tokens در هر صفحه (۵۰٪ مارکاپ بر روی هزینه‌های بالادستی).

استفاده از طریق API

API REST سازگار با OpenAI. یک کلید تولید کنید و این مدل را در چند ثانیه فراخوانی کنید.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
مستندات API دریافت کلید API

پرسشهای متداول

GOT-OCR v2 متن را از تصاویر و پی‌دی‌اف‌ها استخراج می‌کند. یک صفحه اسکن شده، یک تصویر صفحه نمایش یا یک عکس از یک سند را بارگذاری کنید و GOT-OCR v2 متن را با حفظ شکست خط و (در موتورهای قادر) جدول‌ها، فرمول‌ها و ساختار برمی‌گرداند.

GOT-OCR v2 ده‌ها نویسه را پشتیبانی می‌کند — لاتین، سیریلیک، CJK، عربی، Devanagari و بیشتر. /ocr/ landing دارای لیست کامل زبان‌ها برای هر موتور است.

TrOCR و موتورهای مبتنی بر ترانسفورماتور مدرن به‌طور قابل توجهی بهتر از Tesseract قدیمی در نوشتن با دست هستند.

موتورهای آگاه از طرح (GOT-OCR, Marker, Florence-2) جدول‌های Markdown/HTML و LaTeX را برای فرمول‌ها برمی‌گردانند. موتورهای متن ساده متن بدون ساختار را برمی‌گردانند — حالت خروجی این مدل را بررسی کنید.

GOT-OCR v2 یک موتور OCR پرمیوم است. ~۵۰۰ تا ۱۵۰۰ توکن در هر صفحه. ۱ دلار = ۷۵۰۰۰۰ توکن.

PNG, JPG, WebP, HEIC, BMP, plus single- and multi-page PDFs up to 50 MB.

دقت کاراکتر معمولاً در صفحات چاپ شده تمیز بیشتر از ۹۸٪ است، در عکس‌های با وضوح پایین، اسکن‌های شدیداً انحرافی یا فونت‌های غیرمعمول افت می‌کند.

بله — /batch/ یک پوشه از تصاویر/PDFها را می‌پذیرد. هر استخراجی در /account/?tab=history قرار می‌گیرد. برای حفظ درخت پوشه از API استفاده کنید.

بله — POST فایل خود را به /v1/ocr/ با model="GOT-OCR v2". با متن + (اگر پشتیبانی شود) طرح + جعبه‌های مرزی سطح کلمه JSON را برمی‌گرداند. /api/ دارای مرجع کامل است.

مدلهای خود میزبانی شده پرونده شما را در GPUهای ما نگه می‌دارند؛ پریمیوم با DPA از میان می‌گذرد. سندها پس از پنجره اشتراک حذف می‌شوند. ما ورودی‌های شما را آموزش نمی‌دهیم.

Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.

معمولاً ۱–۵ ثانیه در هر صفحه. موتورهای آگاه از طرح (جدول‌ها، ریاضیات) بیشتر طول می‌کشد.

دوست Free.ai رو به دوستانت بگو

رتبه بندی این صفحه