Unlimited-OCR 3B

Free.ai (self-hosted) · ocr · ~300 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ page

ଫାଇଲକୁ ଏଠାରେ ଛାଡିଦିଅନ୍ତୁ କିମ୍ବା ବ୍ରାଉଜ କରିବା ପାଇଁ କ୍ଲିକ କରନ୍ତୁ

~300 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ page

Unlimited-OCR 3B ହେଉଛି an OCR ନମୂନା ଯାହାକି Baidu ଦ୍ୱାରା ନିର୍ମିତ। Image / scan to structured Markdown, complex layouts, tables, multi-page documents. ରେ ସବୁଠାରୁ ଶକ୍ତିଶାଳୀ । Free.ai GPUs ଉପରେ ସ୍ୱୟଂ-ହୋଷ୍ଟ — ଆପଣଙ୍କର ଦୈନିକ ଟୋକନ ପୁଲ (300 ଟୋକନ ପ୍ରତି ପୃଷ୍ଠା) ବିରୋଧରେ ମୁକ୍ତ ଭାବରେ ଚାଲୁଛି। MIT ଅନ୍ତର୍ଗତ ମୁକ୍ତ କରାଯାଇଛି — ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ଅନୁମତି Free.ai ରେ ।

API ମାଧ୍ୟମରେ ବ୍ୟବହାର କରନ୍ତୁ

OpenAI-ସଂଗତି REST API. ଗୋଟିଏ କି ସୃଷ୍ଟି କରନ୍ତୁ ଏବଂ ସେକଣ୍ଡଗୁଡ଼ିକରେ ଏହି ନମୂନାକୁ ଡକାନ୍ତୁ।

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"unlimited-ocr","prompt":"your prompt here"}'
API ଦଲିଲିକରଣ API କି ଗ୍ରହଣ କରନ୍ତୁ

ସାଧାରଣ ପ୍ରଶ୍ନ

Unlimited-OCR 3B ପ୍ରତିଛବି ଏବଂ PDFରୁ ପାଠ୍ୟକୁ ବାହାର କରିଥାଏ। ଗୋଟିଏ ସ୍କାନ କରାଯାଇଥିବା ପୃଷ୍ଠା, ସ୍କ୍ରିନସଟ, କିମ୍ବା ଦଲିଲର ଫଟୋକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଏବଂ Unlimited-OCR 3B ପାଠ୍ୟକୁ ଫେରାଇଥାଏ - ଧାଡ଼ି ବିଚ୍ଛିନ୍ନତା ଏବଂ (ସକ୍ଷମ ଇଞ୍ଜିନଗୁଡ଼ିକରେ) ସାରଣୀ, ସୂତ୍ର, ଏବଂ ଢାଞ୍ଚାକୁ ସଂରକ୍ଷଣ କରିଥାଏ।

Unlimited-OCR 3B ଦଶହରା ସ୍କ୍ରିପ୍ଟଗୁଡ଼ିକୁ ପରିଚାଳନା କରେ - ଲାଟିନ, ସିରିଲିକ, CJK, ଆରବୀ, ଦେବନାଗରୀ, ଏବଂ ଅଧିକ। /ocr/ ଲ୍ୟାଣ୍ଡିଂରେ ପ୍ରତି ଯନ୍ତ୍ର ପାଇଁ ସମ୍ପୂର୍ଣ୍ଣ ଭାଷା ତାଲିକା ଅଛି।

ସ୍ୱଚ୍ଛ ମୁଦ୍ରଣ-ଶୈଳୀ ହସ୍ତଲିଖନ ପାଇଁ ହଁ; କର୍ସିଭ ଏବଂ ସଂକ୍ଷିପ୍ତ ହସ୍ତଲିଖନ ଅଧିକ କଠିନ। TrOCR ଏବଂ ଆଧୁନିକ ପରିବର୍ତ୍ତକ-ଆଧାରିତ ଯନ୍ତ୍ରଗୁଡ଼ିକ ହସ୍ତଲିଖନରେ ଲିଜେଣ୍ଡରୀ ଟେସେରାକ୍ଟ ଅପେକ୍ଷା ଅଧିକ ଭଲ।

ବିନ୍ୟାସ-ସଚେତନ ଯନ୍ତ୍ର (GOT-OCR, Marker, Florence-2) Markdown/HTML ସାରଣୀ ଏବଂ ସୂତ୍ରଗୁଡ଼ିକ ପାଇଁ LaTeX ଫେରାଇଥାଏ। ସରଳ-ପାଠ୍ୟ ଯନ୍ତ୍ରଗୁଡ଼ିକ ଢାଞ୍ଚା ବିନା ପାଠ୍ୟ ଫେରାଇଥାଏ - ଏହି ନମୂନାର ନିର୍ଗମ ଅବସ୍ଥାକୁ ଯାଞ୍ଚ କରନ୍ତୁ।

Unlimited-OCR 3B ଆପଣଙ୍କର ଦୈନିକ ମୁକ୍ତ ପୁଲରୁ ଆମର GPUs ଉପରେ ଚଲାଇଥାଏ; $5 → 200,000 ପୈଠିତ ଟୋକନ ପରେ. ~300 ଟୋକନ ପ୍ରତି ପୃଷ୍ଠା।

PNG, JPG, WebP, HEIC, BMP, ଏବଂ 50 MB ପର୍ଯ୍ୟନ୍ତ ଏକକ ଏବଂ ବହୁପୃଷ୍ଠା PDFଗୁଡ଼ିକ। ଅଲଗା ହୋଇଥିବା କିମ୍ବା ଘୁରାଯାଇଥିବା ପୃଷ୍ଠାଗୁଡ଼ିକ ବାହାର କରିବା ପୂର୍ବରୁ ସ୍ୱୟଂ-ସମ୍ପାଦନ ହୋଇଥାଏ।

ଅକ୍ଷରରୂପ ସଠିକତା ସାଧାରଣତଃ ଶୂନ୍ୟ ମୁଦ୍ରଣ ପୃଷ୍ଠାଗୁଡ଼ିକରେ >98%, ନିମ୍ନ-ରିଜୋଲ୍ୟୁସନ ଫଟୋଗୁଡ଼ିକରେ ଖସିବା, ଗମ୍ଭୀର ଭାବରେ ବିକୃତ ସ୍କାନଗୁଡ଼ିକ, କିମ୍ବା ଅସାଧାରଣ ଅକ୍ଷରରୂପଗୁଡ଼ିକରେ ଅଟେ। ସଠିକତା ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ହେଲେ /ocr/compare/ ରେ ଯନ୍ତ୍ରଗୁଡ଼ିକୁ ତୁଳନା କରନ୍ତୁ।

ହଁ — /batch/ ପ୍ରତିଛବି/PDFs ର ଫୋଲଡରକୁ ଗ୍ରହଣ କରିଥାଏ। ପ୍ରତ୍ୟେକ କାଢ଼ିବା /account/?tab=history ରେ ପହଞ୍ଚିଥାଏ। ଫୋଲଡର-ବୃକ୍ଷ ସଂରକ୍ଷଣ ପାଇଁ API କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ହଁ — ଆପଣଙ୍କର ଫାଇଲକୁ /v1/ocr/ ରେ MODELL="Unlimited-OCR 3B" ସହିତ POST କରନ୍ତୁ। ପାଠ୍ୟ + (ଯଦି ସମର୍ଥିତ) ବିନ୍ୟାସ + ଶବ୍ଦ-ସ୍ତର ସୀମା ବାକ୍ସ ସହିତ JSON ଫେରାଇଥାଏ। /api/ ରେ ସମ୍ପୂର୍ଣ୍ଣ ସଂଯୋଗ ଅଛି।

ସ୍ୱୟଂ-ହୋଷ୍ଟ ମଡେଲଗୁଡ଼ିକ ଆପଣଙ୍କ ଫାଇଲକୁ ଆମର GPUs ରେ ରଖିଥାଏ; ପ୍ରିମିଆ DPA ସହିତ ଦସ୍ତାବିଜଗୁଡ଼ିକୁ ଦୂରେଇ ଦେଇଥାଏ। ଅଂଶଗ୍ରହଣ-ୱିଣ୍ଡୋ ପରେ ଦସ୍ତାବିଜଗୁଡ଼ିକୁ ଅପସାରଣ କରାଯାଏ। ଆମେ ଆପଣଙ୍କର ନିବେଶ ଉପରେ ପ୍ରଶିକ୍ଷଣ ଦେଇନଥାଉ।

ହଁ — Free.ai ବାଣିଜ୍ୟିକ ଭାବରେ ବାହାର କରାଯାଇଥିବା ପାଠ୍ୟକୁ ବ୍ୟବହାର କରିବା ପାଇଁ ଅନୁମତି ଦେଇଥାଏ। ଆପଣଙ୍କୁ ଉତ୍ସ ଦଲିଲ ପାଇଁ ଅଧିକାର ଆବଶ୍ୟକ।

ସାଧାରଣତଃ ପ୍ରତି ପୃଷ୍ଠା ପାଇଁ 1–5 ସେକଣ୍ଡ। ବିନ୍ୟାସ-ସଚେତନ ଯନ୍ତ୍ରଗୁଡ଼ିକ (ସାରଣୀ, ଗଣିତ) ଅଧିକ ସମୟ ଗ୍ରହଣ କରିଥାଏ। ବହୁ-ପୃଷ୍ଠା PDFଗୁଡ଼ିକ ପ୍ରାୟ ରେଖାଗତ ଭାବରେ ମାପନ୍ତି।

Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଏହି ପୃଷ୍ଠାକୁ ଆକଳନ କରନ୍ତୁ