GOT-OCR v2
Free.ai
·
ocr
·
~500 Токенҳо дар як page
GOT-OCR v2 аст a Намунаи OCR. Дар ин ҷо барои ифодаи 100% (100% = 100%) аз 100% (100% = 100%) истифода бурда мешавад.
Истифода аз API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Ҳуҷҷатҳои API
Гирифтани калиди API
Саволҳои пурсидашуда
GOT-OCR v2 матнро аз тасвирҳо ва файлҳои PDF бармеоварад. Саҳифаи сканшуда, скриншот ё сурати ҳуҷҷатро бор кунед ва GOT-OCR v2 матнро бармегардонад — бо нигоҳ доштани хатҳои қатъшуда ва (дар муҳаррикҳои қодир) ҷадвалҳо, формулаҳо ва сохт.
GOT-OCR v2 даҳҳо скриптҳоро идора мекунад — латиница, кириллӣ, CJK, арабӣ, деванагари ва ғайра. Рӯйхати пурраи забонҳо барои ҳар як муҳаррик дар / ocr / ҷойгир аст.
Дар ин ҷо барои навиштани дастнависҳои чопӣ, курсив ва кӯтоҳнависӣ душвортар аст. TrOCR ва муҳаррикҳои муосири асосёфта ба трансформаторҳо дар навиштани дастнависҳо назар ба Tesseract-и кӯҳна беҳтаранд.
Двигатели, чувствительные к расположению (GOT-OCR, Marker, Florence-2) возвращают таблицы Markdown/HTML и LaTeX для формул. Двигатели простого текста возвращают текст без структуры — проверьте режим вывода этого модели.
GOT-OCR v2 - ин муҳаррики OCR-и аълосифат аст. Дар бораи ~500-1,500 нишонаҳо дар як саҳифа. $1 = 750,000 нишонаҳо.
PNG, JPG, WebP, HEIC, BMP, ва PDF-ҳои як ва бисёрсаҳифа то 50 МБ. Саҳифаҳои лағжида ё даврзанида пеш аз баровардани худкор ислоҳ карда мешаванд.
Дақиқии аломатҳо одатан >98% дар саҳифаҳои чопшудаи тоза, дар суратҳои ҳалли паст, сканҳои сахт вайроншуда ё ҳарфҳои ғайриоддӣ аст. Агар дақиқӣ муҳим бошад, муҳаррикҳои муқоисаро дар /ocr/compare/ муқоиса кунед.
Бале — /batch/ папкаи тасвирҳо/PDF-ҳоро қабул мекунад. Ҳар як баровардани файл дар /account/?tab=history ҷойгир мешавад. Барои нигоҳдории дарахти папка API-ро истифода баред.
Да — POST файли худро ба /v1/ocr/ бо модел="GOT-OCR v2". JSON-ро бо матн + (агар дастгирӣ карда шавад) тарҳ + қуттиҳои маҳдудкунандаи сатҳҳои калима бармегардонад. /api/ истиноди пурра дорад.
Модельҳои худи соҳиб файли шуморо дар GPU-ҳои мо нигоҳ медоранд; Premium бо DPA мегузарад. Ҳуҷҷатҳо баъди тирезаи муштараксозии ҳуҷҷатҳо нест карда мешаванд. Мо ба воридоти шумо машқ намекунем.
Да — Free.ai разрешает коммерческое использование извлеченного текста. Вам нужны права на источник документа.
1-5 сония барои ҳар саҳифа. Двигатели, ки ба тарҳбандӣ (ҷадвалҳо, математика) диққат медиҳанд, бештар вақтро талаб мекунанд. PDF-ҳои бисёрсаҳифаӣ тақрибан ба таври хатии андозагирӣ мешаванд.