GOT-OCR v2
Free.ai
·
ocr
·
~500 tocynnau y eiliad page
Mae GOT-OCR v2 yn a Model OCR. Wedi'i lwybro drwy ddelweddau allanol — ~500 tocynnau ar bob tudalen (marc 50% dros gost uwch).
Defnyddio trwy API
API REST OpenAI-cydnaws. Creu allwedd a galw'r model hwn mewn eiliad.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Dogfennaeth API
Nôl Allwedd API
Cwestiynau a Ofynnir yn Aml
Mae GOT-OCR v2 yn echdynnu testun o ddelweddau a PDFs. Lawrlwythwch dudalen arswydedig, sgrînlun, neu lun o ddogfen a bydd GOT-OCR v2 yn dychwelyd y testun — gan gadw torri llinell a (ar beirianyddion galluog) tablau, fformwlau, a strwythur.
Mae GOT-OCR v2 yn trin dociau o sgriptiau - Lladin, Cyrilig, CJK, Arabeg, Devanagari, a mwy. Mae gan y /ocr/ gyrchfan y rhestr lawn o ieithoedd ar gyfer pob peiriant.
Ie ar gyfer llofnodion arddull argraffedig glan; mae llofnodion cyrsaidd a byrrach yn anoddach. Mae TrOCR ac peiriannau modern sy'n seiliedig ar drawsnewidyddion yn well na Tesseract hen ffasiwn ar llofnodion.
Mae peiriannau sy'n ymwybodol o'r cynllun (GOT-OCR, Marker, Florence-2) yn dychwelyd tablau Markdown/HTML a LaTeX ar gyfer fformiwlau. Mae peiriannau testun plaen yn dychwelyd testun heb strwythur — gwiriwch ddull allbwn y model hwn.
Mae GOT-OCR v2 yn beiriant OCR premiwm. Amcangyfrifir bod ~500–1,500 o tocynnau ar bob tudalen. $1 = 750,000 o tocynnau.
PNG, JPG, WebP, HEIC, BMP, yn ogystal â PDFau tudalen sengl a lluosog hyd at 50 MB. Mae tudalennau wedi'u cylchdroi neu wedi'u torri yn cael eu cywiro'n awtomatig cyn eu tynnu.
Mae cywirdeb nodau fel arfer yn >98% ar dudalennau argraffedig glan, yn disgyn ar luniau cydraniad isel, arsylwadau wedi'u torri'n ddifrifol, neu wynebfathau annisgwyl. Cymharwch beiriannau ar /ocr/compare/ pan fo cywirdeb yn bwysig.
Ie — mae /batch/ yn derbyn plygell o ddelweddau/PDFs. Mae pob echdynnu yn cyrraedd /account/?tab=history. Ar gyfer cadw coeden plygellau defnyddiwch yr API.
Ie — POST eich ffeil i /v1/ocr/ gyda model="GOT-OCR v2". Dychwelyd JSON gyda testun + (pan gynhelir) cynllun + blwch cyfyngiad lefel gair. Mae gan /api/ y cyfeiriad llawn.
Modelau hunan-westeiedig yn cadw eich ffeil ar ein GPUs; premium yn mynd trwy gyda DPA. Dileuir dogfennau ar ôl y ffenestr rhannu. Ni ydym yn hyfforddi ar eich mewnbwn.
Ie — Free.ai yn rhoi defnydd masnachol o'r testun echdynedig. Mae angen hawl arnoch ar y ddogfen ffynhonnell.
1-5 eiliad y dudalen fel arfer. Mae peiriannau sy'n ymwybodol o'r cynllun (tabl, mathemateg) yn cymryd mwy o amser. Mae PDFau aml-dudalen yn graddnodi'n llai na llinell.