Question 1

TrOCR Base କଣ କରେ?

Accepted Answer

TrOCR Base ପ୍ରତିଛବି ଏବଂ PDFରୁ ପାଠ୍ୟକୁ ବାହାର କରିଥାଏ। ଗୋଟିଏ ସ୍କାନ କରାଯାଇଥିବା ପୃଷ୍ଠା, ସ୍କ୍ରିନସଟ, କିମ୍ବା ଦଲିଲର ଫଟୋକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଏବଂ TrOCR Base ପାଠ୍ୟକୁ ଫେରାଇଥାଏ - ଧାଡ଼ି ବିଚ୍ଛିନ୍ନତା ଏବଂ (ସକ୍ଷମ ଇଞ୍ଜିନଗୁଡ଼ିକରେ) ସାରଣୀ, ସୂତ୍ର, ଏବଂ ଢାଞ୍ଚାକୁ ସଂରକ୍ଷଣ କରିଥାଏ।

Question 2

TrOCR Base କେଉଁ ଭାଷାକୁ ସମର୍ଥନ କରେ?

Accepted Answer

TrOCR Base ଦଶହରା ସ୍କ୍ରିପ୍ଟଗୁଡ଼ିକୁ ପରିଚାଳନା କରେ - ଲାଟିନ, ସିରିଲିକ, CJK, ଆରବୀ, ଦେବନାଗରୀ, ଏବଂ ଅଧିକ। /ocr/ ଲ୍ୟାଣ୍ଡିଂରେ ପ୍ରତି ଯନ୍ତ୍ର ପାଇଁ ସମ୍ପୂର୍ଣ୍ଣ ଭାଷା ତାଲିକା ଅଛି।

Question 3

TrOCR Base ହସ୍ତଲିଖନ ପଢି ପାରିବ କି?

Accepted Answer

ସ୍ୱଚ୍ଛ ମୁଦ୍ରଣ-ଶୈଳୀ ହସ୍ତଲିଖନ ପାଇଁ ହଁ; କର୍ସିଭ ଏବଂ ସଂକ୍ଷିପ୍ତ ହସ୍ତଲିଖନ ଅଧିକ କଠିନ। TrOCR ଏବଂ ଆଧୁନିକ ପରିବର୍ତ୍ତକ-ଆଧାରିତ ଯନ୍ତ୍ରଗୁଡ଼ିକ ହସ୍ତଲିଖନରେ ଲିଜେଣ୍ଡରୀ ଟେସେରାକ୍ଟ ଅପେକ୍ଷା ଅଧିକ ଭଲ।

Question 4

TrOCR Base ସାରଣୀ ଢାଞ୍ଚା କିମ୍ବା ଗଣିତୀୟ ସୂତ୍ରକୁ ସଂରକ୍ଷଣ କରେ କି?

Accepted Answer

ବିନ୍ୟାସ-ସଚେତନ ଯନ୍ତ୍ର (GOT-OCR, Marker, Florence-2) Markdown/HTML ସାରଣୀ ଏବଂ ସୂତ୍ରଗୁଡ଼ିକ ପାଇଁ LaTeX ଫେରାଇଥାଏ। ସରଳ-ପାଠ୍ୟ ଯନ୍ତ୍ରଗୁଡ଼ିକ ଢାଞ୍ଚା ବିନା ପାଠ୍ୟ ଫେରାଇଥାଏ - ଏହି ନମୂନାର ନିର୍ଗମ ଅବସ୍ଥାକୁ ଯାଞ୍ଚ କରନ୍ତୁ।

Question 5

TrOCR Base ପ୍ରତି ପୃଷ୍ଠା କେତେ ଖର୍ଚ୍ଚ ହୋଇଥାଏ?

Accepted Answer

TrOCR Base ଆପଣଙ୍କର ଦୈନିକ ମୁକ୍ତ ପୁଲରୁ ଆମର GPUs ଉପରେ ଚଲାଇଥାଏ; $5 → 200,000 ପୈଠିତ ଟୋକନ ପରେ. ~300 ଟୋକନ ପ୍ରତି ପୃଷ୍ଠା।

Question 6

TrOCR Base କେଉଁ ନିବେଶ ଶୈଳୀଗୁଡ଼ିକୁ ଗ୍ରହଣ କରିଥାଏ?

Accepted Answer

PNG, JPG, WebP, HEIC, BMP, ଏବଂ 50 MB ପର୍ଯ୍ୟନ୍ତ ଏକକ ଏବଂ ବହୁପୃଷ୍ଠା PDFଗୁଡ଼ିକ। ଅଲଗା ହୋଇଥିବା କିମ୍ବା ଘୁରାଯାଇଥିବା ପୃଷ୍ଠାଗୁଡ଼ିକ ବାହାର କରିବା ପୂର୍ବରୁ ସ୍ୱୟଂ-ସମ୍ପାଦନ ହୋଇଥାଏ।

Question 7

TrOCR Base କେତେ ସଠିକ?

Accepted Answer

ଅକ୍ଷରରୂପ ସଠିକତା ସାଧାରଣତଃ ଶୂନ୍ୟ ମୁଦ୍ରଣ ପୃଷ୍ଠାଗୁଡ଼ିକରେ >98%, ନିମ୍ନ-ରିଜୋଲ୍ୟୁସନ ଫଟୋଗୁଡ଼ିକରେ ଖସିବା, ଗମ୍ଭୀର ଭାବରେ ବିକୃତ ସ୍କାନଗୁଡ଼ିକ, କିମ୍ବା ଅସାଧାରଣ ଅକ୍ଷରରୂପଗୁଡ଼ିକରେ ଅଟେ। ସଠିକତା ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ହେଲେ /ocr/compare/ ରେ ଯନ୍ତ୍ରଗୁଡ଼ିକୁ ତୁଳନା କରନ୍ତୁ।

Question 8

ମୁଁ TrOCR Base ସହିତ OCRକୁ ବ୍ୟାଚ କରିପାରିବି କି?

Accepted Answer

ହଁ — /batch/ ପ୍ରତିଛବି/PDFs ର ଫୋଲଡରକୁ ଗ୍ରହଣ କରିଥାଏ। ପ୍ରତ୍ୟେକ କାଢ଼ିବା /account/?tab=history ରେ ପହଞ୍ଚିଥାଏ। ଫୋଲଡର-ବୃକ୍ଷ ସଂରକ୍ଷଣ ପାଇଁ API କୁ ବ୍ୟବହାର କରନ୍ତୁ।

Question 9

TrOCR Base ପାଇଁ ଗୋଟିଏ API ଅଛି କି?

Accepted Answer

ହଁ — ଆପଣଙ୍କର ଫାଇଲକୁ /v1/ocr/ ରେ MODELL="TrOCR Base" ସହିତ POST କରନ୍ତୁ। ପାଠ୍ୟ + (ଯଦି ସମର୍ଥିତ) ବିନ୍ୟାସ + ଶବ୍ଦ-ସ୍ତର ସୀମା ବାକ୍ସ ସହିତ JSON ଫେରାଇଥାଏ। /api/ ରେ ସମ୍ପୂର୍ଣ୍ଣ ସଂଯୋଗ ଅଛି।

Question 10

TrOCR Base ସହିତ ମୁଁ OCR ସମ୍ବେଦନଶୀଳ ଦଲିଲଗୁଡ଼ିକୁ ବ୍ୟବହାର କରିବା ସମୟରେ ଗୋପନୀୟତା ବିଷୟରେ କଣ?

Accepted Answer

ସ୍ୱୟଂ-ହୋଷ୍ଟ ମଡେଲଗୁଡ଼ିକ ଆପଣଙ୍କ ଫାଇଲକୁ ଆମର GPUs ରେ ରଖିଥାଏ; ପ୍ରିମିଆ DPA ସହିତ ଦସ୍ତାବିଜଗୁଡ଼ିକୁ ଦୂରେଇ ଦେଇଥାଏ। ଅଂଶଗ୍ରହଣ-ୱିଣ୍ଡୋ ପରେ ଦସ୍ତାବିଜଗୁଡ଼ିକୁ ଅପସାରଣ କରାଯାଏ। ଆମେ ଆପଣଙ୍କର ନିବେଶ ଉପରେ ପ୍ରଶିକ୍ଷଣ ଦେଇନଥାଉ।

Question 11

TrOCR Base ନିର୍ଗମ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କି?

Accepted Answer

ହଁ — Free.ai ବାଣିଜ୍ୟିକ ଭାବରେ ବାହାର କରାଯାଇଥିବା ପାଠ୍ୟକୁ ବ୍ୟବହାର କରିବା ପାଇଁ ଅନୁମତି ଦେଇଥାଏ। ଆପଣଙ୍କୁ ଉତ୍ସ ଦଲିଲ ପାଇଁ ଅଧିକାର ଆବଶ୍ୟକ।

Question 12

TrOCR Base କେତେ ସମୟ ଯାଏଁ ଥାଏ?

Accepted Answer

ସାଧାରଣତଃ ପ୍ରତି ପୃଷ୍ଠା ପାଇଁ 1–5 ସେକଣ୍ଡ। ବିନ୍ୟାସ-ସଚେତନ ଯନ୍ତ୍ରଗୁଡ଼ିକ (ସାରଣୀ, ଗଣିତ) ଅଧିକ ସମୟ ଗ୍ରହଣ କରିଥାଏ। ବହୁ-ପୃଷ୍ଠା PDFଗୁଡ଼ିକ ପ୍ରାୟ ରେଖାଗତ ଭାବରେ ମାପନ୍ତି।

TrOCR Base

API ମାଧ୍ୟମରେ ବ୍ୟବହାର କରନ୍ତୁ

ସମାନ ଆକାର

ସାଧାରଣ ପ୍ରଶ୍ନ