TrOCR Base
Free.ai (self-hosted)
·
ocr
·
~300 tags per page
TrOCR Base is a Модель ОРС побудовано Microsoft. Настирливі у _ {best} for _ _. Self- host on Free.ai GPUs } безкоштовно йде проти вашого щоденного набору (300 _ на сторінку _). Випущено під MIT * _ комерційне використання на Free.ai.
Використовувати через API
Сумісний з OpenAI API REST. Створіть ключ і звантажте цю модель у секундах.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"trocr-base","prompt":"your prompt here"}'
Документація з API
Отримати ключ API
Часті запитання
TrOCR Base _ видобуває текст з зображень і PDFs. Вивантажити скановану сторінку, знімок вікна або фотографію документа і _ _ TrOCR Base _ _ повертає текст, що складається з розривів рядка і (на здібних рушіях) таблиці, формули і структуру.
TrOCR Base ANY працює з десятками скриптів Latin, CJK, арабською, Devanagari тощо. У / ocr/ download є повний список мов на кожен з рушіїв.
Так, для чистого почерку у стилі друку; ручка та ручка складніші. _ TrOCR * і сучасні рушійи перетворення значно ліпші за застарілу роботу над почерком.
Layout-aware engines (GOT-OCR, Marker, Florence-2) return Markdown/HTML tables and LaTeX for formulas. Plain-text engines return text without structure — check this model's output mode.
TrOCR Base _ працює на наших GPU з вашого щоденного басейну; 5 → 200 000 оплачуваних жетонів після. ~300 елементів на сторінку.
PNG, JPG, WebP, HEIC, BMP, плюс один- і multi- page PDFs до 50 МБ. Перекосені або повернуті сторінки буде автоматично виправлено перед видобуванням.
Точність символів типово > 98% на чистих друкованих сторінках, скидання на фотографіях з низьким вмістом, дуже скручені скановані зображення або незвичайні шрифти. Порівняйте рушії на / ocr/ compre /, якщо має значення точність.
Так, } / batch/ приймає теку зображень/ PDFs. Кожен видобуток земель у / account/? tab=ify. Для збереження теки- дерева використовуйте API.
Так, якщо ваш файл зберігається до / v1/ocr / з моделлю=" TrOCR Base __." Повертає JSON з текстовою розкладкою + (якщо підтримується) розкладкою + обмежуючим словом поля. / api / має повне посилання.
Самоутверджені моделі зберігають ваш файл у GPU; внесокний прохід за допомогою DPA. Документи вилучатимуться після вікна спільного ресурсу. Ми не тренуємо ваші вхідні дані.
Так, Free.ai надає комерційне використання виділеного тексту. Вам потрібні права на документ джерела.
1–5 seconds per page typically. Layout-aware engines (tables, math) take longer. Multi-page PDFs scale roughly linearly.