PaddleOCR

Free.ai (self-hosted) · ocr · ~300 жетон/ секунд page

Файлды осында сүйреп апарыңыз не шолуға түртіңіз

~300 жетон/ секунд page

PaddleOCR — a ОКР үлгісі PaddlePaddle жасаған. 1995 жылы «Бесінші арна» (қаз. Free.ai ГБ-қа дейінгі графикалық процессорларда өздігінен хостталған — күнделікті токендеріңізге қарсы тегін жұмыс істейді (300 токендері бет). Released under Apache 2.0 — commercial use permitted on Free.ai.

API арқылы қолдану

OpenAI-ге сәйкесті REST API. Кілт құрып, осы модельді секундтар ішінде шақыру.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr","prompt":"your prompt here"}'
API құжаттамасы API кілтін алу

Салыстырмалы үлгілер

Жиі қойылатын сұрақтар

PaddleOCR суреттер мен PDF файлдардан мәтін шығарады. Скандалған бетті, экран суретін немесе құжаттың фотосуретін жүктеп беріңіз, PaddleOCR мәтіннің жол аяқталуын және (мүмкін тетіктерде) кестелерді, формулаларды және құрылымын сақтай отырып қайтарады.

PaddleOCR бірнеше онша жазуларды қолдайды - латын, кирил, CJK, араб, деванагари және т. б. / ocr/ дегенде әрбір тетігінің тілдер тізімі бар.

Ақиқат, таза басылған қолтаңба стилі үшін; курсив және қысқарту қиын. TrOCR және заманауи трансформатор негізіндегі тетіктер қолтаңба үшін ескі Tesseract-тан әлдеқайда жақсы.

Сәйкестікті ескеретін тетіктер (GOT-OCR, Marker, Florence-2) Markdown/HTML кестелерін және формулалар үшін LaTeX-ті қайтарады. Кәдімгі мәтін тетіктері құрылымы жоқ мәтіндерді қайтарады — осы үлгінің шығыс режімін тексеріңіз.

PaddleOCR біздің GPU-ларда күнделікті тегін жинақтан жұмыс істейді; $5 → 200,000 төлемді жетондар кейін. ~300 жетондар бетке.

PNG, JPG, WebP, HEIC, BMP, сонымен қатар бір немесе бірнеше бетті PDF файлдары 50 МБ-қа дейін. Бұрылған немесе бұрылған беттер тарқату алдында автоматты түрде түзетіледі.

Таңбалардың дәлдігі әдетте таза басылған беттерде >98%, төмен ажыратымдылықтағы фотосуреттерде, қатты бұрылған сканерлеулерде немесе ұқсас емес қаріптерде төмендейді. Дәлдігі маңызды болса /ocr/compare/ деген тетігін қолданыңыз.

Иә — /batch/ суреттер/PDF файлдар қапшығын қабылдайды. Әрбір тарқату /account/?tab=history қапшығына түседі. Бума-бұтақты сақтау үшін API-ны қолданыңыз.

Иә — файлды /v1/ocr/ дегенге POST етіп, model="PaddleOCR" деп жазыңыз. JSON мәтіні + (қолданыстағы болса) пішімі + сөз деңгейіндегі шектеулермен қайтарылады. /api/ деген толық сілтемесі бар.

Өзіңізде сақталған үлгілер файлды біздің графикалық процессорымызда сақтайды; жоғары деңгейлілер DPA арқылы өтіп кетеді. Құжаттар ортақтасу терезесінен кейін өшіріледі. Біз сіздің енгізіміңізді оқымаймыз.

Иә — Free.ai тарқатылған мәтіннің коммерциялық пайдалануына рұқсат береді. Сізге бастапқы құжатына құқықтар керек.

Бір бетке әдетте 1- 5 секунд. Сәйкестікті ескеретін тетіктер (кестелер, математика) ұзағырақ уақытты алады. Көп бетті PDF- тер шамамен сызықтық масштабта болады.

Free.ai-ды ұнатасыз ба? Достарыңызға хабарлаңыз!

Парақты бағалау