GOT-OCR v2
Free.ai
·
ocr
·
~500 Символы в расчете на page
GOT-OCR v2 является {article_freahi_ph} Категория __. Routed through external models — ~500 tokens на страницу (50% markup over upstream cost).
Использование через API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Документация API
Выбрать ключ API
Часто задаваемые вопросы
GOT-OCR v2 extracts text from images and PDFs. Upload a scanned page, a screenshot, or a photo of a document and GOT-OCR v2 returns the text — preserving line breaks and (on capable engines) tables, formulas, and structure.
GOT-OCR v2 handles dozens of scripts — Latin, Cyrillic, CJK, Arabic, Devanagari, and more. The /ocr/ landing has the full language list per engine.
Да, для чистого почерка в печатном виде; сурсивы и короткая рукоятка тяжелее. TrOCR, а современные двигатели на основе трансформатора заметно лучше, чем наследие Tesseract в почерке.
Формально-показательные двигатели (GOT-OCR, Маркер, Florence-2) возвращают таблицы отметки/HTML и LaTeX для формул. Текст возврата простых текстов двигателей без структуры - проверьте выходной режим этой модели.
GOT-OCR v2 is a premium OCR engine. About ~500–1,500 tokens per page. $1 = 750,000 tokens.
PNG, JPG, WebP, HEIC, BMP, плюс одностраничные и многостраничные PDF до 50 MB. Перед извлечением свернутые или поворачиваемые страницы корректируются автоматически.
Точность символов, как правило, составляет >98% на чистых печатных страницах, опускается на низкорежимные фотографии, сильно искажается сканирование или необычные шрифты. Сравните двигатели на /ocr/compare/, когда точность важна.
Да — /batch/ принимает папку изображений/PDF. Каждая добыча приземлится в /account/?tab=историю. Для сохранения папок-три используют API.
Yes — POST your file to /v1/ocr/ with model="GOT-OCR v2". Returns JSON with text + (when supported) layout + word-level bounding boxes. /api/ has the full reference.
Самодельные модели хранят ваш файл в наших GPU; премиальные проходят через DPA. Документы удаляются после совместного окна. Мы не тренируемся на ваших входных данных.
Да — Free.ai человек предоставляет коммерческое использование извлеченного текста, и вам нужны права на исходный документ.
1-5 секунд на страницу, как правило. Формально-показательные двигатели (таблицы, математика) занимают больше времени. Многостраничные PDF масштабируют примерно линейно.