PaddleOCR-VL

Free.ai (self-hosted) · ocr · ~300 tags per page

Скинути файл сюди або клацнути, щоб переглянути

~300 tags per page

PaddleOCR-VL is a Модель ОРС побудовано PaddlePaddle. Настирливі у _ {best} for _ _. Self- host on Free.ai GPUs } безкоштовно йде проти вашого щоденного набору (300 _ на сторінку _). Випущено під Apache 2.0 * _ комерційне використання на Free.ai.

Використовувати через API

Сумісний з OpenAI API REST. Створіть ключ і звантажте цю модель у секундах.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr-vl","prompt":"your prompt here"}'
Документація з API Отримати ключ API

Часті запитання

PaddleOCR-VL _ видобуває текст з зображень і PDFs. Вивантажити скановану сторінку, знімок вікна або фотографію документа і _ _ PaddleOCR-VL _ _ повертає текст, що складається з розривів рядка і (на здібних рушіях) таблиці, формули і структуру.

PaddleOCR-VL ANY працює з десятками скриптів Latin, CJK, арабською, Devanagari тощо. У / ocr/ download є повний список мов на кожен з рушіїв.

Так, для чистого почерку у стилі друку; ручка та ручка складніші. _ TrOCR * і сучасні рушійи перетворення значно ліпші за застарілу роботу над почерком.

Layout-aware engines (GOT-OCR, Marker, Florence-2) return Markdown/HTML tables and LaTeX for formulas. Plain-text engines return text without structure — check this model's output mode.

PaddleOCR-VL _ працює на наших GPU з вашого щоденного басейну; 5 → 200 000 оплачуваних жетонів після. ~300 елементів на сторінку.

PNG, JPG, WebP, HEIC, BMP, плюс один- і multi- page PDFs до 50 МБ. Перекосені або повернуті сторінки буде автоматично виправлено перед видобуванням.

Точність символів типово > 98% на чистих друкованих сторінках, скидання на фотографіях з низьким вмістом, дуже скручені скановані зображення або незвичайні шрифти. Порівняйте рушії на / ocr/ compre /, якщо має значення точність.

Так, } / batch/ приймає теку зображень/ PDFs. Кожен видобуток земель у / account/? tab=ify. Для збереження теки- дерева використовуйте API.

Так, якщо ваш файл зберігається до / v1/ocr / з моделлю=" PaddleOCR-VL __." Повертає JSON з текстовою розкладкою + (якщо підтримується) розкладкою + обмежуючим словом поля. / api / має повне посилання.

Самоутверджені моделі зберігають ваш файл у GPU; внесокний прохід за допомогою DPA. Документи вилучатимуться після вікна спільного ресурсу. Ми не тренуємо ваші вхідні дані.

Так, Free.ai надає комерційне використання виділеного тексту. Вам потрібні права на документ джерела.

1–5 seconds per page typically. Layout-aware engines (tables, math) take longer. Multi-page PDFs scale roughly linearly.

Love this tool? Share it!

Оцінити цю сторінку