GOT-OCR v2

Free.ai · ocr · ~500 token per page

Carica documento / immagine

Lasciare un file qui o fare clic per navigare

~500 token per page

E' libero sulle nostre GPU. Aggiornamento per GOT-OCR v2 →

GOT-OCR v2 è a Modello OCR. Instradato attraverso modelli esterni Tokens 500 per pagina (con un markup del 50% rispetto al costo upstream).

Utilizzare tramite API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'

Documentazione API Ottieni la chiave API

Domande frequenti

GOT-OCR v2 estrae testo da immagini e PDF. Carica una pagina scannerizzata, uno screenshot, o una foto di un documento e GOT-OCR v2 restituisce il testo che preserva le interruzioni di riga e (su motori capaci) tabelle, formule e struttura.

GOT-OCR v2 gestisce dozzine di script Latino, Cirillico, CJK, Arabo, Devanagari, e altro ancora. L'atterraggio /ocr/ ha l'elenco completo delle lingue per motore.

Sì per la calligrafia in stile stampato pulito; corsivo e shorthand sono più difficili. TrOCR e i moderni motori a base di trasformatori sono notevolmente meglio di Tesseract legacy sulla calligrafia.

Motori layout-aware (GOT-OCR, Marker, Florence-2) restituisce le tabelle Markdown/HTML e LaTeX per le formule. I motori a testo semplice restituisce il testo senza struttura Controllare la modalità di uscita di questo modello.

GOT-OCR v2 è un motore OCR premium. Circa ~500 token 1.500 per pagina. $1 = 750.000 token.

PNG, JPG, WebP, HEIC, BMP, più PDF a una pagina e più pagine fino a 50 MB. Le pagine sculacciate o ruotate sono corrette automaticamente prima dell'estrazione.

L'accuratezza dei caratteri è tipicamente >98% su pagine stampate pulite, che cadono su foto a basso valore, scansioni severamente inesigibili o caratteri insoliti. Confronta i motori su /ocr/compare/ quando l'accuratezza conta.

Sì /batch/ accetta una cartella di immagini/PDF. Ogni estrazione si trova in /account/?tab=history. Per la conservazione di cartelle-albero utilizzare l'API.

Sì POST il tuo file in /v1/ocr/ con model="GOT-OCR v2." Restituisce JSON con testo + (quando supportato) layout + word-level bounding boxes. /api/ ha il riferimento completo.

I modelli auto-ospitati mantengono il vostro file sulle nostre GPU; il premio passa attraverso con un DPA. I documenti vengono cancellati dopo la share-window. Noi non ci alleniamo sui vostri input.

Sì. Free.ai concede l'uso commerciale del testo estratto. È necessario il diritto al documento di origine.

Solitamente per ogni pagina ci vogliono più tempo. I PDF multi-pagina scalano approssimativamente in modo lineare.

GOT-OCR v2

Utilizzare tramite API

Domande frequenti

Che cosa fa GOT-OCR v2?

Quali lingue supportano GOT-OCR v2?

Puoi leggere la calligrafia?

GOT-OCR v2 conserva la struttura della tabella o le formule matematiche?

Quanto costa GOT-OCR v2 per pagina?

Quali formati di input accetta GOT-OCR v2?

Quanto è preciso il nome?

Posso batchare OCR con GOT-OCR v2?

C'è un'API per GOT-OCR v2?

E la privacy quando I OCR documenti sensibili con GOT-OCR v2?

L'uscita GOT-OCR v2 è sicura per uso commerciale?

Quanto tempo ci vuole?

Ottieni 10.000 Token gratuiti

Aspetta. Ottieni 10K Token gratis!

Ne vuoi ancora?