GOT-OCR v2
Free.ai
·
ocr
·
~500 token per page
GOT-OCR v2 è a Modello OCR. Instradato attraverso modelli esterni Tokens 500 per pagina (con un markup del 50% rispetto al costo upstream).
Utilizzare tramite API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Documentazione API
Ottieni la chiave API
Domande frequenti
GOT-OCR v2 estrae testo da immagini e PDF. Carica una pagina scannerizzata, uno screenshot, o una foto di un documento e GOT-OCR v2 restituisce il testo che preserva le interruzioni di riga e (su motori capaci) tabelle, formule e struttura.
GOT-OCR v2 gestisce dozzine di script Latino, Cirillico, CJK, Arabo, Devanagari, e altro ancora. L'atterraggio /ocr/ ha l'elenco completo delle lingue per motore.
Sì per la calligrafia in stile stampato pulito; corsivo e shorthand sono più difficili. TrOCR e i moderni motori a base di trasformatori sono notevolmente meglio di Tesseract legacy sulla calligrafia.
Motori layout-aware (GOT-OCR, Marker, Florence-2) restituisce le tabelle Markdown/HTML e LaTeX per le formule. I motori a testo semplice restituisce il testo senza struttura Controllare la modalità di uscita di questo modello.
GOT-OCR v2 è un motore OCR premium. Circa ~500 token 1.500 per pagina. $1 = 750.000 token.
PNG, JPG, WebP, HEIC, BMP, più PDF a una pagina e più pagine fino a 50 MB. Le pagine sculacciate o ruotate sono corrette automaticamente prima dell'estrazione.
L'accuratezza dei caratteri è tipicamente >98% su pagine stampate pulite, che cadono su foto a basso valore, scansioni severamente inesigibili o caratteri insoliti. Confronta i motori su /ocr/compare/ quando l'accuratezza conta.
Sì /batch/ accetta una cartella di immagini/PDF. Ogni estrazione si trova in /account/?tab=history. Per la conservazione di cartelle-albero utilizzare l'API.
Sì POST il tuo file in /v1/ocr/ con model="GOT-OCR v2." Restituisce JSON con testo + (quando supportato) layout + word-level bounding boxes. /api/ ha il riferimento completo.
I modelli auto-ospitati mantengono il vostro file sulle nostre GPU; il premio passa attraverso con un DPA. I documenti vengono cancellati dopo la share-window. Noi non ci alleniamo sui vostri input.
Sì. Free.ai concede l'uso commerciale del testo estratto. È necessario il diritto al documento di origine.
Solitamente per ogni pagina ci vogliono più tempo. I PDF multi-pagina scalano approssimativamente in modo lineare.