GOT-OCR v2
Free.ai
·
ocr
·
~500 tags per page
GOT-OCR v2 is a Модель ОРС. Routed through external models — ~500 tokens на сторінку (50% markup over upstream cost).
Використовувати через API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Документація з API
Отримати ключ API
Часті запитання
GOT-OCR v2 _ видобуває текст з зображень і PDFs. Вивантажити скановану сторінку, знімок вікна або фотографію документа і _ _ GOT-OCR v2 _ _ повертає текст, що складається з розривів рядка і (на здібних рушіях) таблиці, формули і структуру.
GOT-OCR v2 ANY працює з десятками скриптів Latin, CJK, арабською, Devanagari тощо. У / ocr/ download є повний список мов на кожен з рушіїв.
Так, для чистого почерку у стилі друку; ручка та ручка складніші. _ TrOCR * і сучасні рушійи перетворення значно ліпші за застарілу роботу над почерком.
Layout-aware engines (GOT-OCR, Marker, Florence-2) return Markdown/HTML tables and LaTeX for formulas. Plain-text engines return text without structure — check this model's output mode.
GOT-OCR v2 is a premium OCR engine. About ~500–1,500 tokens per page. $1 = 750,000 tokens.
PNG, JPG, WebP, HEIC, BMP, плюс один- і multi- page PDFs до 50 МБ. Перекосені або повернуті сторінки буде автоматично виправлено перед видобуванням.
Точність символів типово > 98% на чистих друкованих сторінках, скидання на фотографіях з низьким вмістом, дуже скручені скановані зображення або незвичайні шрифти. Порівняйте рушії на / ocr/ compre /, якщо має значення точність.
Так, } / batch/ приймає теку зображень/ PDFs. Кожен видобуток земель у / account/? tab=ify. Для збереження теки- дерева використовуйте API.
Так, якщо ваш файл зберігається до / v1/ocr / з моделлю=" GOT-OCR v2 __." Повертає JSON з текстовою розкладкою + (якщо підтримується) розкладкою + обмежуючим словом поля. / api / має повне посилання.
Самоутверджені моделі зберігають ваш файл у GPU; внесокний прохід за допомогою DPA. Документи вилучатимуться після вікна спільного ресурсу. Ми не тренуємо ваші вхідні дані.
Так, Free.ai надає комерційне використання виділеного тексту. Вам потрібні права на документ джерела.
1–5 seconds per page typically. Layout-aware engines (tables, math) take longer. Multi-page PDFs scale roughly linearly.