PaddleOCR-VL

Free.ai (self-hosted) · ocr · ~300 ҳар бир page

Файлни бу ерга ташланг ёки кўриш учун босинг

~300 ҳар бир page

PaddleOCR-VL an OCR модели томонидан PaddlePaddle томонидан яратилган. Fast multilingual image / scan to Markdown; tables, formulas, charts; 109 languages. да энг кучли. Free.ai GPU'ларда ўз-ўзидан жойлаштирилган — сизнинг кундалик токенларингизга қарши бепул ишлайди (300 токенлар саҳифа). Apache 2.0 остида чиқарилган — Free.ai дан коммерциявий фойдаланишга рухсат берилган.

API орқали фойдаланиш

OpenAI-га мос REST API. Алоқани яратинг ва бу моделни секундларда чақиринг.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr-vl","prompt":"your prompt here"}'
Ҳужжатлаштириш API калитини олиш

Худди шундай моделлар

Кўп бериладиган саволлар

PaddleOCR-VL тасвирлар ва PDF файллардан матнларни ажратади. Скан қилинган саҳифа, скриншот ёки ҳужжатнинг суратини юкланг ва PaddleOCR-VL матнни қайтаради — сатрлар кесишларини ва (мўлжалланган моторларда) жадваллар, формулалар ва тузилмаларни сақлаб қолади.

PaddleOCR-VL ўнлаб ёзувларни қўллай олади — латиница, кирилл, CJK, араб, деванагари ва бошқалар. /ocr/ манзили ҳар бир двигатель учун тўлиқ тиллар рўйхатини кўрсатади.

Ҳа, тоза босма услубдаги қўлёзма учун; курсив ва қисқа қўлёзма қийинроқ. TrOCR ва замонавий трансформаторга асосланган моторлар қўлёзма учун эски Tesseract'дан яхшироқ.

Лайсни-эшитадиган моторлар (GOT-OCR, Marker, Florence-2) Markdown/HTML жадвалларини ва формулалар учун LaTeX'ни қайтаради. Оддий матн моторлари структурасиз матнларни қайтаради — бу моделнинг чиқим режимини текширинг.

PaddleOCR-VL бизнинг GPUларимизда сизнинг кундалик бепул пулингиздан ишлайди; $5 → 200,000 тўлов чекидан кейин. ~300 чек ҳар бир саҳифа учун.

PNG, JPG, WebP, HEIC, BMP, шунингдек, 50 МБ гача бўлган бир саҳифали ва кўп саҳифали PDF файллар. Қизилаётган ёки бурилаётган саҳифалар ажратиб олишдан олдин автоматик равишда тўғриланади.

Ҳарфлар аниқлиги одатда тоза босилган саҳифаларда >98%, паст резолюцияли суратларда тушиш, кескин бурилган сканлар ёки ноодатий шрифтларда. /ocr/compare/ да аниқлик муҳим бўлганда, муқоиса қилиш двигателларини қўлланг.

Ҳа — /batch/ тасвирлар/PDFлар жилдини қабул қилади. Ҳар бир ажратиб олиш /account/?tab=history да жойлашади. Жилд дарахти сақлаш учун API'ни ишлатинг.

Ҳа — файлингизни /v1/ocr/га POST қилинг, модел="PaddleOCR-VL" билан. Матн + (қопланганда) кўриниш + сўз даражасидаги чегараловчи қутилар билан JSON қайтарилади. /api/ тўлиқ манбага эга.

Ўз-ўзини хост қилувчи моделлар файлингизни бизнинг GPUларда сақлайди; premium DPA билан ўтади. Ҳужжатлар ўртоқлашиш ойнаси тугаганидан кейин ўчириб ташланади. Биз сизнинг киритишларингизни ўрганмаймиз.

Ҳа — Free.ai ажратилган матннинг савдо мақсадларида фойдаланишига рухсат беради. Сизга манба ҳужжатига эгалик ҳуқуқи керак.

Ҳар бир саҳифа учун одатда 1-5 секунд. Таркибига эътибор берувчи двигателлар (жадваллар, математика) кўпроқ вақтни олади. Кўп саҳифали PDFлар деярли тўғри чизиқ бўйлаб масштабланади.

Free.aiни севасанми? Дўстларингга айт!

Бу саҳифани баҳолаш