PaddleOCR-VL

Free.ai (self-hosted) · ocr · ~300 ھەر بىرىگە توكى page

ھۆججەتلەرنى بۇ يەرگە چۈشۈرىڭىز ياكى ئىزدەش ئۈچۈن چېكىڭ

~300 ھەر بىرىگە توكى page

PaddleOCR-VL an OCR مودېلى PaddlePaddle تەرىپىدىن ياسالغان. {best} نىڭ ئەڭ كۈچلۈكى. Free.ai GPU لاردا ئۆز-ئۆزىنى باشقۇرىدۇ — كۈندىلىك توكى توپىڭىزغا قارشى ھەقسىز ئىشلەيدۇ (300 توكى ھەر بىر بەت ئۈچۈن). Apache 2.0 بويىچە ئېلان قىلىنغان — Free.ai گە تىجارەت قىلىشقا رۇخسەت قىلىنغان.

API ئارقىلىق ئىشلىتىش

OpenAI بىلەن ماس كېلىدىغان REST API. ئاچقۇچنى قۇرۇپ، بۇ مودېلىنى بىر نەچچە سېكۇنت ئىچىدە چاقىرىۋېتىدۇ.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr-vl","prompt":"your prompt here"}'
API پۈتۈكلىرى API ئاچقۇچىنى ئېلىش

ئوخشاش بولغان مودىللار

كۆپ سورالغان سوئاللار

PaddleOCR-VL سۈرەت ۋە PDF ھۆججەتلىرىدىن تېكىستنى چىقىرىۋېتىدۇ. سۈرەتكە ئېلىنغان بىر بەتنى، سۈرەتكە ئېلىنغان بىر سۈرەت ياكى پۈتۈكنىڭ سۈرىتىنى يۈكلەپ قويسىڭىز، PaddleOCR-VL تېكىستنى قايتۇرۇپ بېرىدۇ — سۈرەتنىڭ ئاخىرى ۋە (ئۇنىڭغا قابىل بولغان ئېلېكتىرونلۇق مەشغۇلات سىستېمىلىرىدا) جۈملە، فورمۇلا ۋە قۇرۇلمىسىنى ساقلاپ قالىدۇ.

PaddleOCR-VL نىڭ قوللىشىدا ئونلىغان يېزىقى بار — لاتىن، سىرېل، CJK، ئەرەب، دەۋاناغارى ۋە باشقا. /ocr/ نى قوزغاتقۇچتا ھەر بىر يېزىقى ئۈچۈن تولۇق تىل تىزىملىكى بار.

TrOCR ۋە زامانىۋىي ئۆزگەرتكۈچ ئاساسىدىكى ئېلېكتىرونلۇق مەشغۇلات سىستېمىسى قوليازما يېزىشتا Tesseract نىڭ ئالدىنقى نەشرى بىلەن سېلىشتۇرغاندا بەكرەك ياخشى.

لايىھەلەشنى تونۇيدىغان ئېلېكتىر ماشىنىلىرى (GOT-OCR، Marker، Florence-2) Markdown/HTML جۈملىلىرىنى ۋە فورمۇلا ئۈچۈن LaTeX نى قايتۇرىدۇ. ئاددىي تېكىست ئېلېكتىر ماشىنىلىرى قۇرۇلماسىز تېكىستنى قايتۇرىدۇ — بۇ مودېلنىڭ چىقىرىش ھالىتىنى تەكشۈرىدۇ.

PaddleOCR-VL بىزنىڭ GPU لىرىمىزدا كۈندىلىك ھەقسىز توپىڭىزدىن ئىشلەيدۇ؛ $5 → 200,000 تۆلەم توكى كېيىن. ~300 توكى ھەر بىر بەتكە.

PNG، JPG، WebP، HEIC، BMP، ھەمدە 50MB گە قەدەر بىر ياكى كۆپ بەتلىك PDF ھۆججەتلىرى. ئېچىلغاندىن كېيىن، بۇرۇلۇپ كەتكەن ياكى بۇرۇلۇپ كەتكەن بەتلەرنى ئۆزلۈكىدىن تۈزەيدۇ.

سىزىقلارنىڭ توغرىلىقى ئادەتتە پاكىز بېسىلغان بەتلەردە >98% بولۇپ، تۆۋەن ئېنىقلىقتىكى سۈرەتلەر، قاتتىق بۇزۇلغان سۈرەتلەر ياكى ئادەتتىن تاشقىرى خەت نۇسخىلىرىدا چۈشۈپ كېتىدۇ. توغرىلىق مۇھىم بولغاندا /ocr/compare/ دىكى تەڭشەكلەرنى سېلىشتۇرۇڭ.

ھەئە — /batch/ سۈرەت/PDF مۇندەرىجىسىنى قوبۇل قىلىدۇ. ھەر بىر چىقىرىش /account/?tab=history غا چۈشىدۇ. مۇندەرىجە دەرەخنى ساقلاش ئۈچۈن API نى ئىشلىتىڭ.

ئۇنداق — ھۆججەتنى /v1/ocr/ غا POST قىلىپ model="PaddleOCR-VL" نى قويۇڭ. JSON نى تېكىست + (يوقلۇقتا) سىزىقچە + سۆز دەرىجىلىك چەكلەش ساندۇقلىرى بىلەن قايتۇرىدۇ. /api/ نىڭ تولۇق ئىزاھاتى بار.

ئۆز-ئۆزىنى باشقۇرىدىغان مودىللار ھۆججەتنى گرافىكىلىق بىرلىكلەر ئۈستىدە ساقلايدۇ؛ يۇقىرى دەرىجىلىكلەر DPA ئارقىلىق ئۆتۈپ كېتىدۇ. پۈتۈكلەر ھەمبەھىرلەش كۆزنەكىدىن كېيىن يوقىلىدۇ. بىز سىزنىڭ كىرگۈزگەن ئۇچۇرلىرىڭىزنى تەربىيەلەمەيمىز.

ھەئە — Free.ai ئېنىقلانغان مەزمۇننى تىجارەت قىلىشقا ئىشلىتىشكە ئىجازەت بېرىدۇ. مەنبە پۈتۈكىگە ھوقۇقىڭىز بولۇشى كېرەك.

ئادەتتە ھەر بىر بەت ئۈچۈن 1-5 سېكۇنت. لايىھەلەشنى تونۇيدىغان ئېلېكتىرونلۇق پروگراممىلار (جۈملە، ماتېماتىكا) بۇ ۋاقىتنى ئۇزۇن تۇتىدۇ. كۆپ بەتلىك PDF نىڭ چوڭ-كىچىكلىكى سىزىقچە بولىدۇ.

Free.ai نى ياخشى كۆرەمسىز؟ دوستلىرىڭىزغا ئېيتىپ بېرىڭلار!

بۇ بەت