Unlimited-OCR 3B

Free.ai (self-hosted) · ocr · ~300 Токен page

Файл татаж авах эсвэл хайх

~300 Токен page

Unlimited-OCR 3B нь a ОРС загвар-ийн Baidu-ээр бүтээсэн хэсэг юм. 1995 онд "Best of" цомог гаргажээ. Free.ai GPU дээр өөрийн хосттой — таны өдөр тутмын токен нөөц (300 токен хуудас бүрт)-ийн эсрэг үнэгүй ажиллана. MIT-ийн дор хэвлэгдсэн — Free.ai дээр худалдааны зорилгоор ашиглах зөвшөөрөлтэй.

API- ээр ашиглах

OpenAI-тай нийцтэй REST API. Алгаалгын түлхүүр үүсгэж секундэд энэ загварыг дуудна.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"unlimited-ocr","prompt":"your prompt here"}'
Хяналт API түлхүүрийг авах

Ижил төстэй загварууд

Заримдаа асуудаг асуултууд

Unlimited-OCR 3B нь зураг болон PDF-ээс текстийг гаргаж авдаг. Скан хийсэн хуудас, дэлгэцийн зураг эсвэл баримтын зураг татаж аваад Unlimited-OCR 3B нь текстийг - мөрний таслалыг хадгалж (хүчтэй хөдөлгүүрт) хүснэгт, формул, бүтэц зэргийг хадгалж авчирна.

Unlimited-OCR 3B нь олон тооны бичлэгийг дэмждэг - латин, кирилл, CJK, араб, деванагари, гэх мэт. /ocr/ хаяг нь хөдөлгүүр бүрийн бүх хэлний жагсаалтыг агуулдаг.

Тийм ээ, цэвэр хэвлэсэн гарын үсгийн хэв маяг; үсгийн хэлбэр болон товчлол нь илүү хэцүү. TrOCR болон орчин үеийн трансформатор дээр суурилсан хөдөлгүүрүүд нь гарын үсгийн хувьд хуучин Tesseract-ээс илүү сайн.

Хуудасны загварыг мэддэг хөдөлгүүрүүд (GOT-OCR, Marker, Florence-2) Markdown/HTML хүснэгтийг, формулуудад LaTeX-ийг өгдөг. Жинхэнэ текстийн хөдөлгүүрүүд бүтэцгүй текстийг өгдөг. Энэ загварын гарчгийн горимыг шалгана уу.

Unlimited-OCR 3B нь таны өдөр тутмын үнэгүй нөөцөөс бидний GPU дээр ажиллана; $5 → 200,000 төлбөртэй жетон дараа. ~300 жетон хуудас бүрт.

PNG, JPG, WebP, HEIC, BMP, 50 MB хүртэлх нэг болон олон хуудастай PDF файлууд. Хийхээс өмнө эргэх, эргэх хуудасуудыг автоматаар засдаг.

Тодорхойлолт нь цэвэр хэвлэгдсэн хуудас, бага нягтралтай зураг, маш их гажсан скан, эсвэл онцгой үсгийн хувьд >98% байдаг. Тодорхойлолт чухал бол /ocr/compare/ дээрх харьцуулалтын системийг ашиглаарай.

Тийм — /batch/ нь зураг/PDF-ийн нэг хавтсыг хүлээн авдаг. Бүх таталтууд /account/?tab=history руу ордог. Бусад хавтсыг хадгалахдаа API ашиглана уу.

Тийм — файлаа /v1/ocr/ руу POST хийж model="Unlimited-OCR 3B" болгоно. JSON текст + (хэрэв дэмжлэгтэй бол) загвар + үгийн түвшний хязгаарлах хайрцгуудаар буцаана. /api/ нь бүрэн холбоос юм.

Өөрийн сервертэй загварууд таны файлыг бидний график процессор дээр хадгална; дээд зэрэглэлийн загварууд DPA-тай дамжуулна. Хуулийг хуваалцах цонхны дараа устгадаг. Бид таны оруулсан мэдээллийг ашигладаггүй.

Тийм ээ — Free.ai нь түүвэрлэсэн текстийг худалдааны зорилгоор ашиглах эрх олгоно. Та эх сурвалж баримт бичгийн эрхийг авах шаардлагатай.

Нэг хуудсанд 1-5 секунд. Хуудасны хэлбэрийг мэддэг програмууд (хүснэгт, математик) илүү удаан хугацаа шаарддаг. Олон хуудсан PDF файлууд ойролцоогоор шугаман хэмжээтэй байдаг.

Free.ai-ыг хайрладаг уу? Найзуудаа хэлж өгөөрэй!

Энэ хуудсыг үнэл