GOT-OCR v2
Free.ai
·
ocr
·
~500 tl> token bawat page
Ang GOT-OCR v2 ay isang a at Modelo ng OCR. Ang mga ito ay: 1.
> Gamitin sa pamamagitan ng API
> OpenAI-compatible REST API. Bumuo ng isang susi at tawagan ang modelong ito sa ilang segundo.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
API Dokumentasyon
> Kumuha ng API Key
Mga Madalas Itanong
Ang GOT-OCR v2 ay nag-a-extract ng teksto mula sa mga imahe at PDF. I-upload ang isang na-scan na pahina, isang screenshot, o isang larawan ng isang dokumento at ang GOT-OCR v2 ay ibabalik ang teksto — na pinapanatili ang mga break ng linya at (sa mga may kakayahang engine) mga talahanayan, formula, at istraktura.
Ang GOT-OCR v2 ay may kakayahang mag-handle ng dose-dosenang mga script — Latin, Cyrillic, CJK, Arabic, Devanagari, at iba pa. Ang /ocr/ landing ay may buong listahan ng mga wika sa bawat engine.
Ang mga ito ay: Ang mga karaniwang mga uri ng mga selula ng tao ay ang mga sumusunod: Ang mga selula ng tao ay may 122 mga kromosoma na tinatawag na mga kromosomang X at Y. Ang mga selula ng tao ay may 123 mga kromosomang X at Y. Ang mga selula ng tao ay may 123 mga kromosomang Y.
Layout-aware engine (GOT-OCR, Marker, Florence-2) bumalik Markdown / HTML mga talahanayan at LaTeX para sa mga formula. Plain-text engine bumalik teksto nang walang istraktura - suriin ang output mode ng modelong ito.
Ang GOT-OCR v2 ay isang premium na OCR engine. Tungkol sa ~500-1,500 tokens bawat pahina. $1 = 750,000 tokens.
> PNG, JPG, WebP, HEIC, BMP, pati na rin ang single-at multi-page PDF hanggang sa 50 MB. Naka-angkla o iniikot na mga pahina ay auto-corrected bago pag-alis.
> Karaniwan ang pagiging tumpak ng mga character ay >98% sa malinis na mga pahina na naka-print, bumababa sa mga larawang may mababang resolusyon, mabigat na nakasabit na mga scan, o mga hindi pangkaraniwang font.
> Oo — / batch / tumatanggap ng isang folder ng mga imahe / PDFs. Ang bawat pag-alis lupa sa / account /? tab = kasaysayan. Para sa folder-tree preservation gamitin ang API.
Ang mga ito ay: 1. ang mga salitang "Ikaw" at "Ikaw" ay may mga titik na "I" at "O" na nakasulat sa isang linya ng teksto. 2. ang mga salitang "Ikaw" at "Ikaw" ay may mga titik na "O" at "O" na nakasulat sa isang linya ng teksto.
> Self-hosted modelo panatilihin ang iyong file sa aming GPUs; premium pumasa sa pamamagitan ng isang DPA. Mga dokumento ay tinanggal pagkatapos ng share-window. Hindi namin tren sa iyong mga input.
> Oo — Free.ai grants komersyal na paggamit ng mga nakuhang teksto. Kailangan mo ng mga karapatan sa source dokumento.
1–5 segundo bawat pahina karaniwang. Layout-aware engine (talahanayan, matematika) tumagal ng mas mahaba. Multi-page PDFs scale humigit-kumulang linearly.