Unlimited-OCR 3B

Free.ai (self-hosted) · ocr · ~300 tokens por page

Solte aquí un ficheiro ou prema para examinar

~300 tokens por page

Unlimited-OCR 3B é a Modelo de OCR construído por Baidu. "A mellor en Image / scan to structured Markdown, complex layouts, tables, multi-page documents.". Auto-aloxado en Free.ai GPUs — executa libremente contra o seu conxunto de tokens diarios (300 tokens por páxina). Publicado baixo a licenza MIT — uso comercial permitido en Free.ai.

Empregar a través da API

API REST compatíbel con OpenAI. Xere unha chave e chame a este modelo en segundos.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"unlimited-ocr","prompt":"your prompt here"}'
Documentación da API Obter a chave da API

Preguntas frecuentes

Unlimited-OCR 3B extrae texto de imaxes e PDFs. Envie unha páxina dixitalizada, unha captura de pantalla ou unha foto dun documento e Unlimited-OCR 3B devolve o texto, preservando os saltos de liña e (en motores compatibles) táboas, fórmulas e estrutura.

Unlimited-OCR 3B __ xestiona ducias de escrituras: latín, cirílico, CJK, árabe, Devanagari e máis. O destino / ocr / ten a lista completa de linguas por motor.

Si para unha escrita limpa ao estilo impreso; a cursiva e a abreviatura son máis difíciles. TrOCR e os motores modernos baseados en transformadores son notablemente mellores que o Tesseract antigo para a escrita á man.

Os motores que teñen en conta a disposición (GOT-OCR, Marker, Florence-2) devolven táboas Markdown/HTML e LaTeX para fórmulas. Os motores de texto sinxelo devolven texto sen estrutura; comprobe o modo de saída deste modelo.

Unlimited-OCR 3B executase nas nosas GPUs do teu banco de GPUs libres diario; $5 → 200.000 tokens pagados despois. ~300 tokens por páxina.

PNG, JPG, WebP, HEIC, BMP, máis PDFs de unha ou varias páxinas de ata 50 MB. As páxinas torcidas ou rotadas son corrixidas automaticamente antes de extraer.

A precisión dos caracteres é normalmente > 98% en páxinas limpas, caendo en fotos de baixa resolución, escaneos severamente distorsionados ou fontes inusuais. Compare motores en / ocr/ compare / cando a precisión sexa importante.

Si — / batch / acepta un cartafol de imaxes/ PDFs. Cada extracción atópase en / account /? tab=history. Para a preservación da árbore de cartafoles use a API.

Si — POST o seu ficheiro a / v1/ ocr / con model=" Unlimited-OCR 3B ". Devolve JSON con texto + (se está soportado) disposición + caixas delimitadoras a nivel de palabra. / api / ten a referencia completa.

Os modelos auto- hospedados manteñen o seu ficheiro nas nosas GPU; os modelos premium pasan a través dun DPA. Os documentos son eliminados despois da fiestra de compartición. Non adestramos coas súas entradas.

Si, Free.ai concede o uso comercial do texto extraído. Precisa dereitos sobre o documento de orixe.

1- 5 segundos por páxina normalmente. Os motores que teñen en conta a disposición (táboas, matemáticas) tardan máis. Os PDF de varias páxinas escalan aproximadamente linearmente.

Amas Free.ai?

Cualificar esta páxina