GOT-OCR v2

Free.ai · ocr · ~500 tokens por page

Solte aquí un ficheiro ou prema para examinar

~500 tokens por page
Corre libremente nas nosas GPU. Actualizar para GOT-OCR v2 →

GOT-OCR v2 é a Modelo de OCR. Enrutado a través de modelos externos — ~500 tokens por páxina (50% de markup sobre o custo ascendente).

Empregar a través da API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Documentación da API Obter a chave da API

Preguntas frecuentes

GOT-OCR v2 extrae texto de imaxes e PDFs. Envie unha páxina dixitalizada, unha captura de pantalla ou unha foto dun documento e GOT-OCR v2 devolve o texto, preservando os saltos de liña e (en motores compatibles) táboas, fórmulas e estrutura.

GOT-OCR v2 __ xestiona ducias de escrituras: latín, cirílico, CJK, árabe, Devanagari e máis. O destino / ocr / ten a lista completa de linguas por motor.

Si para unha escrita limpa ao estilo impreso; a cursiva e a abreviatura son máis difíciles. TrOCR e os motores modernos baseados en transformadores son notablemente mellores que o Tesseract antigo para a escrita á man.

Os motores que teñen en conta a disposición (GOT-OCR, Marker, Florence-2) devolven táboas Markdown/HTML e LaTeX para fórmulas. Os motores de texto sinxelo devolven texto sen estrutura; comprobe o modo de saída deste modelo.

GOT-OCR v2 __ é un motor OCR premium. Cerca de ~ 500- 1. 500 tokens por páxina. $1 = 750. 000 tokens.

PNG, JPG, WebP, HEIC, BMP, máis PDFs de unha ou varias páxinas de ata 50 MB. As páxinas torcidas ou rotadas son corrixidas automaticamente antes de extraer.

A precisión dos caracteres é normalmente > 98% en páxinas limpas, caendo en fotos de baixa resolución, escaneos severamente distorsionados ou fontes inusuais. Compare motores en / ocr/ compare / cando a precisión sexa importante.

Si — / batch / acepta un cartafol de imaxes/ PDFs. Cada extracción atópase en / account /? tab=history. Para a preservación da árbore de cartafoles use a API.

Si — POST o seu ficheiro a / v1/ ocr / con model=" GOT-OCR v2 ". Devolve JSON con texto + (se está soportado) disposición + caixas delimitadoras a nivel de palabra. / api / ten a referencia completa.

Os modelos auto- hospedados manteñen o seu ficheiro nas nosas GPU; os modelos premium pasan a través dun DPA. Os documentos son eliminados despois da fiestra de compartición. Non adestramos coas súas entradas.

Si, Free.ai concede o uso comercial do texto extraído. Precisa dereitos sobre o documento de orixe.

1- 5 segundos por páxina normalmente. Os motores que teñen en conta a disposición (táboas, matemáticas) tardan máis. Os PDF de varias páxinas escalan aproximadamente linearmente.

Amas Free.ai?

Cualificar esta páxina