GOT-OCR v2
Free.ai
·
ocr
·
~500 бирдик page
GOT-OCR v2 - a ОЧТ модели. Сырткы моделдер аркылуу багытталган — ~500 токендери бет (50% маркировка жогорудагы баадан).
API аркылуу колдонуу
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Документация
API ачкычын алуу
Кайсы убакта суроолор берилет
GOT-OCR v2 текст из изображений и PDF-файлов извлекает. Загрузите ссканированную страницу, скриншоты или фотографию документа, и GOT-OCR v2 вернет текст — сохранив строки и (на способных двигателях) таблицы, формулы и структуру.
GOT-OCR v2 бир нече скрипттерди колдойт — латын, кирилл, CJK, араб, деванагари жана башкалар. /ocr/ Landing ар бир движоктун толук тилдер тизмесин камтыйт.
Да, если вы хотите печатать чистый стиль рукописи; курсивный и краткий варианты труднее. TrOCR и современные трансформаторы значительно лучше Tesseract.
Мастерин-билүүчү двигатели (GOT-OCR, Marker, Florence-2) Markdown/HTML таблицаларын жана формулалар үчүн LaTeX форматын кайтарат. Текст-движоктар текстти структурасыз кайтарат — бул моделдин чыгуу режимин текшериңиз.
GOT-OCR v2 - бул премиум OCR двигатель. Бир барак үчүн ~500-1,500 токен. $1 = 750,000 токен.
PNG, JPG, WebP, HEIC, BMP, ошондой эле бир же бир нече беттүү PDF файлдары 50 МБга чейин. Кыймылсыз же бурулган беттер чыгаруу алдында автоматтык түрдө оңдолот.
Символдордун тактыгы, адатта, таза басылган беттерде >98%, төмөн резолюциядагы сүрөттөрдө, өтө катаал сканерлерде же адаттагы эмес ариптерде жоголот. Эгерде тактык маанилүү болсо, анда /ocr/compare/ деген жердеги салыштыруу тутумдарын колдонуп көрүңүз.
Да — /batch/ файлдар папкасын сүрөттөр/PDF файлдары менен кабыл алат. Ар бир тартуу /account/?tab=history папкасына түшөт. Папка-дарагын сактоо үчүн API колдонулат.
Да — файлды /v1/ocr/ каталогуна POST кылыңыз, анын модели "GOT-OCR v2". JSON форматындагы текст + (колдонулганда) макет + сөз деңгээлиндеги чектөө кутучалары менен кайтарылат. /api/ файлында толук шилтеме бар.
Өзүнө-өзү кызмат көрсөтүүчү моделдер файлды биздин графикалык процессордо сактайт; премиум моделдер DPA менен өткөрүп берет. Документтер бөлүшүү терезеси ачылгандан кийин өчүрүлөт. Биз сиздин киргизүүңүздү үйрөтпөйбүз.
Да — Free.ai чыгарылган текстти коммерциялык максатта колдонууга уруксат берет. Бул үчүн сиздин документке укуктарыңыз болушу керек.
Бир барак үчүн 1-5 секунда. Мастер-схеманы эске алган двигатели (таблицалар, математика) көбүрөөк убакытты талап кылат. Бир нече барактагы PDF файлдар болжол менен линейдик масштабда болот.