GOT-OCR v2

Free.ai · ocr · ~500 жетони на page

Пуснете тук файл или кликнете, за да прегледате

~500 жетони на page
Тече безплатно на нашите ГПУ. Подновяване за GOT-OCR v2 →

GOT-OCR v2 е a Модел на ОРС. Посочена през външни модели — ~500 žeтони на страница (50% маркиране над разходите на горния поток).

Използване чрез API

Съгласен с OpenAI REST API. Генерирайте ключ и се обадете на този модел в секунди.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
API документация Вземете API ключ

Често задавани въпроси

GOT-OCR v2 извлича текста от изображения и PDF. Качете сканирана страница, снимка на екрана или снимка на документ и GOT-OCR v2 връща текста — съхранение на линиите и (на способни двигатели) таблици, формули и структура.

GOT-OCR v2 управлява десетки скриптове — латински, кирилици, CJK, арабски, Devanagari и др.

Да за чист печатен почерк; кървене и шорцеви са по-трудни. TrOCR и модерните трансформаторни двигатели са забележително по-добри от наследство Teseract на почерк.

Двигатели, които са съзнавани (GOT-OCR, Marker, Florence-2) връщане Маркдаун/HTML таблици и LaTeX за формули.

GOT-OCR v2 е първокласен ОРС двигател. Около ~500–1,500 жетона на страница. $1 = 750 000 жетона.

PNG, JPG, WebP, HEIC, BMP, плюс едностранни и многостранни PDF до 50 MB. Прескачени или въртени страници са автоматично корегирани преди екстракцията.

Характерната точност обикновено е >98% на чисти печатни страници, пада на снимки с ниско съдържание, тежко смазани скенери или необичайни шрифтове. Сравни двигатели на /okr/compare/ когато точността е важна.

Да — /batch/ приема папка от изображения/PDF. Всяка екстракция попада в /account/?tab=history. За запазване на папка-дърво използвайте API.

Да — ПОСТ файлът ви на /v1/okr/ с модел="GOT-OCR v2". Връща JSON с текст + (когато се поддържа) оформление + ръбни полета. /api/ има пълното позоваване.

Самоу домакинските модели държат файловете си на нашите GPU; премиум преминават с DPA. Документите се изтриват след акционерния прозорец. Не тренираме върху вашите входове.

Да — Free.ai отпускат търговско използване на извлечения текст. Нуждаете се от правата на източника документ.

1-5 секунди на страница обикновено. Разклад-съзнателни двигатели (таблички, математика) отнемат по-дълго. Многостранични PDF скала приблизително линейно.

Love this tool? Share it!

Оцени тази страница