GOT-OCR v2
Free.ai
·
ocr
·
~500 tokens per page
GOT-OCR v2 is a Modellu OCR. Routed attraversu mudelli esterni — ~ 500 tokens per pagina (50% markup supra u costu a monte).
Usare via API
API REST compatibili OpenAI. Genera una chiave è chiama stu mudellu in uni pochi di siconni.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Documentazione
Otteni a chiave API
Dumande frequenti
GOT-OCR v2 estrae testu di immagini è PDF. Carica una pàggina scannata, una schermata o una foto di un documentu è GOT-OCR v2 ritorna u testu — preservannu i salti di riga è (in motori capaci) tavule, formule, è struttura.
GOT-OCR v2 gestisci decine di scripts — latinu, cirillicu, CJK, àrabu, Devanagari, è di più. U /ocr/ landing hà a lista completa di lingue per u motore.
Sì pi na scrittura pulita a manu, lu currispundenti e l'abbreviazioni sunnu cchiù difficili. TrOCR e li muturi moderni basati supra a trasformazioni sunnu assai megghiu ca lu Tesseract legacy pi la scrittura a manu.
Li muturi a cunniscenza di layout (GOT-OCR, Marker, Florence-2) riturnanu tavuli Markdown/HTML e LaTeX pi li formuli. Li muturi di testu chiaru riturnanu testu senza struttura — verificate lu modu di output di stu mudellu.
GOT-OCR v2 hè un mutore OCR premium. Circa ~500-1,500 tokens per pagina. $1 = 750,000 tokens.
PNG, JPG, WebP, HEIC, BMP, più PDF di una o più pagine finu à 50 MB. E pagine inclinate o girate sò auto-corrette prima di l'estrazione.
A precisioni di li carattiri è tipicamente >98% supra pagine stampati puliti, caduti supra foto a vascia risuluzzioni, scansioni severamenti distorti, o fonts inusuali. Comparate li muturi in /ocr/compare/ quannu la precisioni importa.
Sì — /batch/ accetta una cartilla di immagini/PDF. Ogni estrazzioni finisci in /account/?tab=history. Pi la priservazzioni di l'arburi di cartilli usa l'API.
Sì — POST u vostru fugliali à /v1/ocr/ cu model="GOT-OCR v2". Ritorna JSON cu testu + (quandu supportatu) layout + caselle di cunfini a livellu di parolla. /api/ hà a riferenza piena.
Li mudelli auto-ospitati mantèninu u vostru fugliali supra li nostri GPU; i mudelli premium passanu attraversu cu un DPA. I documenti sunnu canciati dopu a finestra di cunnizzioni. Noi nun ci addestramu a basa di i vostri input.
Sì — Free.ai cunzenti l'usu cummerciali di u testu estrattu. Avete bisognu di li diritti supra u documentu di sorgenti.
1-5 siconni pi pàggina, in ginirali. I motori cunsapevoli di u layout (tavuli, matimàtica) pigghianu cchiù tempu. I PDF multi-pagina si scalanu a picca a picca.