GOT-OCR v2
Free.ai
·
ocr
·
~500 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ page
GOT-OCR v2 ହେଉଛି an OCR ନମୂନା। ବାହ୍ୟ ନମୂନା ମାଧ୍ୟମରେ ପଥପ୍ରଦର୍ଶନ କରାଯାଇଛି — ~500 ଟୋକନ ପ୍ରତି ପୃଷ୍ଠା (ଉପଧାରା ଖର୍ଚ୍ଚ ଉପରେ 50% ମାର୍କଅପ)।
API ମାଧ୍ୟମରେ ବ୍ୟବହାର କରନ୍ତୁ
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
API ଦଲିଲିକରଣ
API କି ଗ୍ରହଣ କରନ୍ତୁ
ସାଧାରଣ ପ୍ରଶ୍ନ
GOT-OCR v2 ପ୍ରତିଛବି ଏବଂ PDFରୁ ପାଠ୍ୟକୁ ବାହାର କରିଥାଏ। ଗୋଟିଏ ସ୍କାନ କରାଯାଇଥିବା ପୃଷ୍ଠା, ସ୍କ୍ରିନସଟ, କିମ୍ବା ଦଲିଲର ଫଟୋକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଏବଂ GOT-OCR v2 ପାଠ୍ୟକୁ ଫେରାଇଥାଏ - ଧାଡ଼ି ବିଚ୍ଛିନ୍ନତା ଏବଂ (ସକ୍ଷମ ଇଞ୍ଜିନଗୁଡ଼ିକରେ) ସାରଣୀ, ସୂତ୍ର, ଏବଂ ଢାଞ୍ଚାକୁ ସଂରକ୍ଷଣ କରିଥାଏ।
GOT-OCR v2 ଦଶହରା ସ୍କ୍ରିପ୍ଟଗୁଡ଼ିକୁ ପରିଚାଳନା କରେ - ଲାଟିନ, ସିରିଲିକ, CJK, ଆରବୀ, ଦେବନାଗରୀ, ଏବଂ ଅଧିକ। /ocr/ ଲ୍ୟାଣ୍ଡିଂରେ ପ୍ରତି ଯନ୍ତ୍ର ପାଇଁ ସମ୍ପୂର୍ଣ୍ଣ ଭାଷା ତାଲିକା ଅଛି।
ସ୍ୱଚ୍ଛ ମୁଦ୍ରଣ-ଶୈଳୀ ହସ୍ତଲିଖନ ପାଇଁ ହଁ; କର୍ସିଭ ଏବଂ ସଂକ୍ଷିପ୍ତ ହସ୍ତଲିଖନ ଅଧିକ କଠିନ। TrOCR ଏବଂ ଆଧୁନିକ ପରିବର୍ତ୍ତକ-ଆଧାରିତ ଯନ୍ତ୍ରଗୁଡ଼ିକ ହସ୍ତଲିଖନରେ ଲିଜେଣ୍ଡରୀ ଟେସେରାକ୍ଟ ଅପେକ୍ଷା ଅଧିକ ଭଲ।
ବିନ୍ୟାସ-ସଚେତନ ଯନ୍ତ୍ର (GOT-OCR, Marker, Florence-2) Markdown/HTML ସାରଣୀ ଏବଂ ସୂତ୍ରଗୁଡ଼ିକ ପାଇଁ LaTeX ଫେରାଇଥାଏ। ସରଳ-ପାଠ୍ୟ ଯନ୍ତ୍ରଗୁଡ଼ିକ ଢାଞ୍ଚା ବିନା ପାଠ୍ୟ ଫେରାଇଥାଏ - ଏହି ନମୂନାର ନିର୍ଗମ ଅବସ୍ଥାକୁ ଯାଞ୍ଚ କରନ୍ତୁ।
GOT-OCR v2 ଗୋଟିଏ ପ୍ରୀମିୟମ୍ OCR ଯନ୍ତ୍ର। ପ୍ରତି ପୃଷ୍ଠାରେ ~500–1,500 ଟୋକନ। $1 = 750,000 ଟୋକନ।
PNG, JPG, WebP, HEIC, BMP, ଏବଂ 50 MB ପର୍ଯ୍ୟନ୍ତ ଏକକ ଏବଂ ବହୁପୃଷ୍ଠା PDFଗୁଡ଼ିକ। ଅଲଗା ହୋଇଥିବା କିମ୍ବା ଘୁରାଯାଇଥିବା ପୃଷ୍ଠାଗୁଡ଼ିକ ବାହାର କରିବା ପୂର୍ବରୁ ସ୍ୱୟଂ-ସମ୍ପାଦନ ହୋଇଥାଏ।
ଅକ୍ଷରରୂପ ସଠିକତା ସାଧାରଣତଃ ଶୂନ୍ୟ ମୁଦ୍ରଣ ପୃଷ୍ଠାଗୁଡ଼ିକରେ >98%, ନିମ୍ନ-ରିଜୋଲ୍ୟୁସନ ଫଟୋଗୁଡ଼ିକରେ ଖସିବା, ଗମ୍ଭୀର ଭାବରେ ବିକୃତ ସ୍କାନଗୁଡ଼ିକ, କିମ୍ବା ଅସାଧାରଣ ଅକ୍ଷରରୂପଗୁଡ଼ିକରେ ଅଟେ। ସଠିକତା ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ହେଲେ /ocr/compare/ ରେ ଯନ୍ତ୍ରଗୁଡ଼ିକୁ ତୁଳନା କରନ୍ତୁ।
ହଁ — /batch/ ପ୍ରତିଛବି/PDFs ର ଫୋଲଡରକୁ ଗ୍ରହଣ କରିଥାଏ। ପ୍ରତ୍ୟେକ କାଢ଼ିବା /account/?tab=history ରେ ପହଞ୍ଚିଥାଏ। ଫୋଲଡର-ବୃକ୍ଷ ସଂରକ୍ଷଣ ପାଇଁ API କୁ ବ୍ୟବହାର କରନ୍ତୁ।
ହଁ — ଆପଣଙ୍କର ଫାଇଲକୁ /v1/ocr/ ରେ MODELL="GOT-OCR v2" ସହିତ POST କରନ୍ତୁ। ପାଠ୍ୟ + (ଯଦି ସମର୍ଥିତ) ବିନ୍ୟାସ + ଶବ୍ଦ-ସ୍ତର ସୀମା ବାକ୍ସ ସହିତ JSON ଫେରାଇଥାଏ। /api/ ରେ ସମ୍ପୂର୍ଣ୍ଣ ସଂଯୋଗ ଅଛି।
ସ୍ୱୟଂ-ହୋଷ୍ଟ ମଡେଲଗୁଡ଼ିକ ଆପଣଙ୍କ ଫାଇଲକୁ ଆମର GPUs ରେ ରଖିଥାଏ; ପ୍ରିମିଆ DPA ସହିତ ଦସ୍ତାବିଜଗୁଡ଼ିକୁ ଦୂରେଇ ଦେଇଥାଏ। ଅଂଶଗ୍ରହଣ-ୱିଣ୍ଡୋ ପରେ ଦସ୍ତାବିଜଗୁଡ଼ିକୁ ଅପସାରଣ କରାଯାଏ। ଆମେ ଆପଣଙ୍କର ନିବେଶ ଉପରେ ପ୍ରଶିକ୍ଷଣ ଦେଇନଥାଉ।
ହଁ — Free.ai ବାଣିଜ୍ୟିକ ଭାବରେ ବାହାର କରାଯାଇଥିବା ପାଠ୍ୟକୁ ବ୍ୟବହାର କରିବା ପାଇଁ ଅନୁମତି ଦେଇଥାଏ। ଆପଣଙ୍କୁ ଉତ୍ସ ଦଲିଲ ପାଇଁ ଅଧିକାର ଆବଶ୍ୟକ।
ସାଧାରଣତଃ ପ୍ରତି ପୃଷ୍ଠା ପାଇଁ 1–5 ସେକଣ୍ଡ। ବିନ୍ୟାସ-ସଚେତନ ଯନ୍ତ୍ରଗୁଡ଼ିକ (ସାରଣୀ, ଗଣିତ) ଅଧିକ ସମୟ ଗ୍ରହଣ କରିଥାଏ। ବହୁ-ପୃଷ୍ଠା PDFଗୁଡ଼ିକ ପ୍ରାୟ ରେଖାଗତ ଭାବରେ ମାପନ୍ତି।