TrOCR Base

Free.ai (self-hosted) · ocr · ~300 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ page

ଫାଇଲକୁ ଏଠାରେ ଛାଡିଦିଅନ୍ତୁ କିମ୍ବା ବ୍ରାଉଜ କରିବା ପାଇଁ କ୍ଲିକ କରନ୍ତୁ

~300 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ page

TrOCR Base ହେଉଛି an OCR ନମୂନା ଯାହାକି Microsoft ଦ୍ୱାରା ନିର୍ମିତ। Handwritten documents, low-resource scripts. ରେ ସବୁଠାରୁ ଶକ୍ତିଶାଳୀ । Free.ai GPUs ଉପରେ ସ୍ୱୟଂ-ହୋଷ୍ଟ — ଆପଣଙ୍କର ଦୈନିକ ଟୋକନ ପୁଲ (300 ଟୋକନ ପ୍ରତି ପୃଷ୍ଠା) ବିରୋଧରେ ମୁକ୍ତ ଭାବରେ ଚାଲୁଛି। MIT ଅନ୍ତର୍ଗତ ମୁକ୍ତ କରାଯାଇଛି — ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ଅନୁମତି Free.ai ରେ ।

API ମାଧ୍ୟମରେ ବ୍ୟବହାର କରନ୍ତୁ

OpenAI-ସଂଗତି REST API. ଗୋଟିଏ କି ସୃଷ୍ଟି କରନ୍ତୁ ଏବଂ ସେକଣ୍ଡଗୁଡ଼ିକରେ ଏହି ନମୂନାକୁ ଡକାନ୍ତୁ।

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"trocr-base","prompt":"your prompt here"}'
API ଦଲିଲିକରଣ API କି ଗ୍ରହଣ କରନ୍ତୁ

ସାଧାରଣ ପ୍ରଶ୍ନ

TrOCR Base ପ୍ରତିଛବି ଏବଂ PDFରୁ ପାଠ୍ୟକୁ ବାହାର କରିଥାଏ। ଗୋଟିଏ ସ୍କାନ କରାଯାଇଥିବା ପୃଷ୍ଠା, ସ୍କ୍ରିନସଟ, କିମ୍ବା ଦଲିଲର ଫଟୋକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଏବଂ TrOCR Base ପାଠ୍ୟକୁ ଫେରାଇଥାଏ - ଧାଡ଼ି ବିଚ୍ଛିନ୍ନତା ଏବଂ (ସକ୍ଷମ ଇଞ୍ଜିନଗୁଡ଼ିକରେ) ସାରଣୀ, ସୂତ୍ର, ଏବଂ ଢାଞ୍ଚାକୁ ସଂରକ୍ଷଣ କରିଥାଏ।

TrOCR Base ଦଶହରା ସ୍କ୍ରିପ୍ଟଗୁଡ଼ିକୁ ପରିଚାଳନା କରେ - ଲାଟିନ, ସିରିଲିକ, CJK, ଆରବୀ, ଦେବନାଗରୀ, ଏବଂ ଅଧିକ। /ocr/ ଲ୍ୟାଣ୍ଡିଂରେ ପ୍ରତି ଯନ୍ତ୍ର ପାଇଁ ସମ୍ପୂର୍ଣ୍ଣ ଭାଷା ତାଲିକା ଅଛି।

ସ୍ୱଚ୍ଛ ମୁଦ୍ରଣ-ଶୈଳୀ ହସ୍ତଲିଖନ ପାଇଁ ହଁ; କର୍ସିଭ ଏବଂ ସଂକ୍ଷିପ୍ତ ହସ୍ତଲିଖନ ଅଧିକ କଠିନ। TrOCR ଏବଂ ଆଧୁନିକ ପରିବର୍ତ୍ତକ-ଆଧାରିତ ଯନ୍ତ୍ରଗୁଡ଼ିକ ହସ୍ତଲିଖନରେ ଲିଜେଣ୍ଡରୀ ଟେସେରାକ୍ଟ ଅପେକ୍ଷା ଅଧିକ ଭଲ।

ବିନ୍ୟାସ-ସଚେତନ ଯନ୍ତ୍ର (GOT-OCR, Marker, Florence-2) Markdown/HTML ସାରଣୀ ଏବଂ ସୂତ୍ରଗୁଡ଼ିକ ପାଇଁ LaTeX ଫେରାଇଥାଏ। ସରଳ-ପାଠ୍ୟ ଯନ୍ତ୍ରଗୁଡ଼ିକ ଢାଞ୍ଚା ବିନା ପାଠ୍ୟ ଫେରାଇଥାଏ - ଏହି ନମୂନାର ନିର୍ଗମ ଅବସ୍ଥାକୁ ଯାଞ୍ଚ କରନ୍ତୁ।

TrOCR Base ଆପଣଙ୍କର ଦୈନିକ ମୁକ୍ତ ପୁଲରୁ ଆମର GPUs ଉପରେ ଚଲାଇଥାଏ; $5 → 200,000 ପୈଠିତ ଟୋକନ ପରେ. ~300 ଟୋକନ ପ୍ରତି ପୃଷ୍ଠା।

PNG, JPG, WebP, HEIC, BMP, ଏବଂ 50 MB ପର୍ଯ୍ୟନ୍ତ ଏକକ ଏବଂ ବହୁପୃଷ୍ଠା PDFଗୁଡ଼ିକ। ଅଲଗା ହୋଇଥିବା କିମ୍ବା ଘୁରାଯାଇଥିବା ପୃଷ୍ଠାଗୁଡ଼ିକ ବାହାର କରିବା ପୂର୍ବରୁ ସ୍ୱୟଂ-ସମ୍ପାଦନ ହୋଇଥାଏ।

ଅକ୍ଷରରୂପ ସଠିକତା ସାଧାରଣତଃ ଶୂନ୍ୟ ମୁଦ୍ରଣ ପୃଷ୍ଠାଗୁଡ଼ିକରେ >98%, ନିମ୍ନ-ରିଜୋଲ୍ୟୁସନ ଫଟୋଗୁଡ଼ିକରେ ଖସିବା, ଗମ୍ଭୀର ଭାବରେ ବିକୃତ ସ୍କାନଗୁଡ଼ିକ, କିମ୍ବା ଅସାଧାରଣ ଅକ୍ଷରରୂପଗୁଡ଼ିକରେ ଅଟେ। ସଠିକତା ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ହେଲେ /ocr/compare/ ରେ ଯନ୍ତ୍ରଗୁଡ଼ିକୁ ତୁଳନା କରନ୍ତୁ।

ହଁ — /batch/ ପ୍ରତିଛବି/PDFs ର ଫୋଲଡରକୁ ଗ୍ରହଣ କରିଥାଏ। ପ୍ରତ୍ୟେକ କାଢ଼ିବା /account/?tab=history ରେ ପହଞ୍ଚିଥାଏ। ଫୋଲଡର-ବୃକ୍ଷ ସଂରକ୍ଷଣ ପାଇଁ API କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ହଁ — ଆପଣଙ୍କର ଫାଇଲକୁ /v1/ocr/ ରେ MODELL="TrOCR Base" ସହିତ POST କରନ୍ତୁ। ପାଠ୍ୟ + (ଯଦି ସମର୍ଥିତ) ବିନ୍ୟାସ + ଶବ୍ଦ-ସ୍ତର ସୀମା ବାକ୍ସ ସହିତ JSON ଫେରାଇଥାଏ। /api/ ରେ ସମ୍ପୂର୍ଣ୍ଣ ସଂଯୋଗ ଅଛି।

ସ୍ୱୟଂ-ହୋଷ୍ଟ ମଡେଲଗୁଡ଼ିକ ଆପଣଙ୍କ ଫାଇଲକୁ ଆମର GPUs ରେ ରଖିଥାଏ; ପ୍ରିମିଆ DPA ସହିତ ଦସ୍ତାବିଜଗୁଡ଼ିକୁ ଦୂରେଇ ଦେଇଥାଏ। ଅଂଶଗ୍ରହଣ-ୱିଣ୍ଡୋ ପରେ ଦସ୍ତାବିଜଗୁଡ଼ିକୁ ଅପସାରଣ କରାଯାଏ। ଆମେ ଆପଣଙ୍କର ନିବେଶ ଉପରେ ପ୍ରଶିକ୍ଷଣ ଦେଇନଥାଉ।

ହଁ — Free.ai ବାଣିଜ୍ୟିକ ଭାବରେ ବାହାର କରାଯାଇଥିବା ପାଠ୍ୟକୁ ବ୍ୟବହାର କରିବା ପାଇଁ ଅନୁମତି ଦେଇଥାଏ। ଆପଣଙ୍କୁ ଉତ୍ସ ଦଲିଲ ପାଇଁ ଅଧିକାର ଆବଶ୍ୟକ।

ସାଧାରଣତଃ ପ୍ରତି ପୃଷ୍ଠା ପାଇଁ 1–5 ସେକଣ୍ଡ। ବିନ୍ୟାସ-ସଚେତନ ଯନ୍ତ୍ରଗୁଡ଼ିକ (ସାରଣୀ, ଗଣିତ) ଅଧିକ ସମୟ ଗ୍ରହଣ କରିଥାଏ। ବହୁ-ପୃଷ୍ଠା PDFଗୁଡ଼ିକ ପ୍ରାୟ ରେଖାଗତ ଭାବରେ ମାପନ୍ତି।

Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଏହି ପୃଷ୍ଠାକୁ ଆକଳନ କରନ୍ତୁ