GOT-OCR v2
Free.ai
·
ocr
·
~500 unit synonyms for matching user input page
GOT-OCR v2 an OCR-modell. Külső modelleken keresztül vezetve ~500 tokens oldalonként (50%-os felár a upstream költség felett).
Alkalmazása API-n keresztül
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
API dokumentáció
Szerezd meg az API kulcsot
Gyakran ismételt kérdések
GOT-OCR v2 kivonat szöveg képek és PDF-ek. Feltöltése beszkennelt oldal, képernyőkép, vagy egy fénykép egy dokumentum és GOT-OCR v2 visszaadja a szöveget A szöveg megőrzése vonal törések és (kompatibilis motorok) táblázatok, képletek, szerkezet.
GOT-OCR v2 több tucat szkriptet kezel: Latin, cirill, CJK, Arabic, Devanagari, és így tovább. Az /ocr/ landolás a teljes nyelvlistával rendelkezik motoronként.
Igen a tiszta nyomtatott kézírásra; a kurzív és gyorsírás nehezebb. TrOCR és a modern transzformátor alapú motorok észrevehetően jobbak, mint a hagyományos Tesseract kézírással.
Layout-aware motorok (GOT-OCR, Marker, Florence-2) visszaküldik a Markdown/HTML táblázatokat és a LaTeX-et a képletekhez. Az egyszerű szövegű motorok szerkezet nélkül visszaküldik a szöveget, a modell kimeneti üzemmódját ellenőrzik.
GOT-OCR v2 egy prémium OCR motor. Körülbelül ~500-500 zseton / oldal. $1 = 750,000 zseton.
PNG, JPG, WebP, HEIC, BMP, plusz egy- és többoldalas PDF-ek akár 50 MB. Skewed vagy váltogatott oldalak automatikusan korrigálják a kitermelés előtt.
A karakter pontossága jellemzően >98% tiszta nyomtatott oldalakon, alacsony felbontású fényképekre, súlyosan eltorzult szkennelésre vagy szokatlan betűtípusokra esik vissza. Hasonlítsa össze a /ocr/compare/ motorokat, amikor a pontosság számít.
Igen, /batch/ elfogad egy mappát képek / PDF-ek. Minden egyes kivonat a /account/?tab=történelem. Mappa-fa megőrzéshez használja az API-t.
Igen, Post your file to /v1/ocr/ with model="GOT-OCR v2". Returns JSON with text + (when supported) layout + word-level bounding boxs. /api/ has the full reference.
Önálló modellek tartja a fájlt a GPU-k; prémium át egy DPA. Dokumentumok törölve után a megosztás-ablak. Mi nem vonat a bemenetek.
Igen, Free.ai ad kereskedelmi hasznosításra kivont szöveg. Szüksége van a forrásdokumentumhoz való jogokra.
A többoldalas PDF-skála nagyjából lineárisan halad.