GOT-OCR v2
Free.ai
·
ocr
·
~500 Токен page
GOT-OCR v2 нь a ОРС загвар юм. Гадна загваруудаар дамжуулан — ~500 tokens хуудас бүрт (50% upstream cost-аас илүү марк)
API- ээр ашиглах
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Хяналт
API түлхүүрийг авах
Заримдаа асуудаг асуултууд
GOT-OCR v2 нь зураг болон PDF-ээс текстийг гаргаж авдаг. Скан хийсэн хуудас, дэлгэцийн зураг эсвэл баримтын зураг татаж аваад GOT-OCR v2 нь текстийг - мөрний таслалыг хадгалж (хүчтэй хөдөлгүүрт) хүснэгт, формул, бүтэц зэргийг хадгалж авчирна.
GOT-OCR v2 нь олон тооны бичлэгийг дэмждэг - латин, кирилл, CJK, араб, деванагари, гэх мэт. /ocr/ хаяг нь хөдөлгүүр бүрийн бүх хэлний жагсаалтыг агуулдаг.
Тийм ээ, цэвэр хэвлэсэн гарын үсгийн хэв маяг; үсгийн хэлбэр болон товчлол нь илүү хэцүү. TrOCR болон орчин үеийн трансформатор дээр суурилсан хөдөлгүүрүүд нь гарын үсгийн хувьд хуучин Tesseract-ээс илүү сайн.
Хуудасны загварыг мэддэг хөдөлгүүрүүд (GOT-OCR, Marker, Florence-2) Markdown/HTML хүснэгтийг, формулуудад LaTeX-ийг өгдөг. Жинхэнэ текстийн хөдөлгүүрүүд бүтэцгүй текстийг өгдөг. Энэ загварын гарчгийн горимыг шалгана уу.
GOT-OCR v2 нь үнэтэй OCR хөдөлгүүр юм. Хуудас бүрт ~500-1,500 жетон. $1 = 750,000 жетон.
PNG, JPG, WebP, HEIC, BMP, 50 MB хүртэлх нэг болон олон хуудастай PDF файлууд. Хийхээс өмнө эргэх, эргэх хуудасуудыг автоматаар засдаг.
Тодорхойлолт нь цэвэр хэвлэгдсэн хуудас, бага нягтралтай зураг, маш их гажсан скан, эсвэл онцгой үсгийн хувьд >98% байдаг. Тодорхойлолт чухал бол /ocr/compare/ дээрх харьцуулалтын системийг ашиглаарай.
Тийм — /batch/ нь зураг/PDF-ийн нэг хавтсыг хүлээн авдаг. Бүх таталтууд /account/?tab=history руу ордог. Бусад хавтсыг хадгалахдаа API ашиглана уу.
Тийм — файлаа /v1/ocr/ руу POST хийж model="GOT-OCR v2" болгоно. JSON текст + (хэрэв дэмжлэгтэй бол) загвар + үгийн түвшний хязгаарлах хайрцгуудаар буцаана. /api/ нь бүрэн холбоос юм.
Өөрийн сервертэй загварууд таны файлыг бидний график процессор дээр хадгална; дээд зэрэглэлийн загварууд DPA-тай дамжуулна. Хуулийг хуваалцах цонхны дараа устгадаг. Бид таны оруулсан мэдээллийг ашигладаггүй.
Тийм ээ — Free.ai нь түүвэрлэсэн текстийг худалдааны зорилгоор ашиглах эрх олгоно. Та эх сурвалж баримт бичгийн эрхийг авах шаардлагатай.
Нэг хуудсанд 1-5 секунд. Хуудасны хэлбэрийг мэддэг програмууд (хүснэгт, математик) илүү удаан хугацаа шаарддаг. Олон хуудсан PDF файлууд ойролцоогоор шугаман хэмжээтэй байдаг.