GOT-OCR v2

Free.ai · ocr · ~500 tokens per page

Lasciari un figghiu chistu o cliccari pi sfogghiari

~500 tokens per page
Funziona liberamenti supra li nostri GPU. Aggiornamentu pi GOT-OCR v2 →

GOT-OCR v2 is a Modellu OCR. Routed attraversu mudelli esterni — ~ 500 tokens per pagina (50% markup supra u costu a monte).

Usare via API

API REST compatibili OpenAI. Genera una chiave è chiama stu mudellu in uni pochi di siconni.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Documentazione Otteni a chiave API

Dumande frequenti

GOT-OCR v2 estrae testu di immagini è PDF. Carica una pàggina scannata, una schermata o una foto di un documentu è GOT-OCR v2 ritorna u testu — preservannu i salti di riga è (in motori capaci) tavule, formule, è struttura.

GOT-OCR v2 gestisci decine di scripts — latinu, cirillicu, CJK, àrabu, Devanagari, è di più. U /ocr/ landing hà a lista completa di lingue per u motore.

Sì pi na scrittura pulita a manu, lu currispundenti e l'abbreviazioni sunnu cchiù difficili. TrOCR e li muturi moderni basati supra a trasformazioni sunnu assai megghiu ca lu Tesseract legacy pi la scrittura a manu.

Li muturi a cunniscenza di layout (GOT-OCR, Marker, Florence-2) riturnanu tavuli Markdown/HTML e LaTeX pi li formuli. Li muturi di testu chiaru riturnanu testu senza struttura — verificate lu modu di output di stu mudellu.

GOT-OCR v2 hè un mutore OCR premium. Circa ~500-1,500 tokens per pagina. $1 = 750,000 tokens.

PNG, JPG, WebP, HEIC, BMP, più PDF di una o più pagine finu à 50 MB. E pagine inclinate o girate sò auto-corrette prima di l'estrazione.

A precisioni di li carattiri è tipicamente >98% supra pagine stampati puliti, caduti supra foto a vascia risuluzzioni, scansioni severamenti distorti, o fonts inusuali. Comparate li muturi in /ocr/compare/ quannu la precisioni importa.

Sì — /batch/ accetta una cartilla di immagini/PDF. Ogni estrazzioni finisci in /account/?tab=history. Pi la priservazzioni di l'arburi di cartilli usa l'API.

Sì — POST u vostru fugliali à /v1/ocr/ cu model="GOT-OCR v2". Ritorna JSON cu testu + (quandu supportatu) layout + caselle di cunfini a livellu di parolla. /api/ hà a riferenza piena.

Li mudelli auto-ospitati mantèninu u vostru fugliali supra li nostri GPU; i mudelli premium passanu attraversu cu un DPA. I documenti sunnu canciati dopu a finestra di cunnizzioni. Noi nun ci addestramu a basa di i vostri input.

Sì — Free.ai cunzenti l'usu cummerciali di u testu estrattu. Avete bisognu di li diritti supra u documentu di sorgenti.

1-5 siconni pi pàggina, in ginirali. I motori cunsapevoli di u layout (tavuli, matimàtica) pigghianu cchiù tempu. I PDF multi-pagina si scalanu a picca a picca.

Amuri Free.ai? Dì i vostri amichi!

Vota sta pàggina