TrOCR Base

Free.ai (self-hosted) · ocr · ~300 প্রতি page

এখানে একটি ফাইল ছেড়ে দিন অথবা ব্রাউজ করতে ক্লিক করুন

~300 প্রতি page

TrOCR Base হচ্ছে an OCR মডেল যা Microsoft দ্বারা নির্মিত। Handwritten documents, low-resource scripts.-এ সবচেয়ে শক্তিশালী। Self-hosted on Free.ai GPUs — runs free against your daily token pool (300 tokens প্রতি পৃষ্ঠা). Released under MIT — commercial use permitted on Free.ai.

API ব্যবহার করো

OpenAI-সমর্থিত REST API। এক সেকেন্ডের মধ্যে একটি কী তৈরি করুন এবং এই মডেলটি কল করুন।

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"trocr-base","prompt":"your prompt here"}'
API নথিপত্র API কী প্রাপ্ত করুন

প্রায়শই জিজ্ঞাসিত প্রশ্ন

TrOCR Base ছবি এবং PDF থেকে টেক্সট এক্সট্র্যাক্ট করে। স্ক্যান করা একটি পৃষ্ঠা, স্ক্রিনশট, অথবা নথির একটি ছবি আপলোড করুন এবং TrOCR Base টেক্সট ফিরিয়ে দেবে - লাইন ব্রেক এবং (সক্ষম ইঞ্জিন) টেবিল, সূত্র এবং গঠন সংরক্ষণ করে।

TrOCR Base ডজনখানেক স্ক্রিপ্ট পরিচালনা করে - ল্যাটিন, সিরিলিক, সিজেকে, আরবি, দেভানাগারি, এবং আরো অনেক কিছু। /ocr/ নামক স্থানে ইঞ্জিনের প্রতিটি ভাষার সম্পূর্ণ তালিকা রয়েছে।

পরিষ্কার মুদ্রণ-শৈলীর হাতের লেখার জন্য হ্যাঁ; কার্সিভ এবং শর্টহান্ড কঠিন। TrOCR এবং আধুনিক ট্রান্সফরমার-ভিত্তিক ইঞ্জিনগুলি হাতের লেখার ক্ষেত্রে লেইগেসি টেসরাক্টের চেয়ে উল্লেখযোগ্যভাবে ভাল।

বিন্যাস-সচেতন ইঞ্জিন (GOT-OCR, Marker, Florence-2) Markdown/HTML টেবিল এবং সূত্রের জন্য LaTeX ফিরিয়ে দেয়। প্লেইন-টেক্সট ইঞ্জিন গঠনবিহীন টেক্সট ফিরিয়ে দেয় - এই মডেলের আউটপুট মোড পরীক্ষা করুন।

TrOCR Base আপনার দৈনিক ফ্রি পুল থেকে আমাদের জিপিইউতে চলছে; $৫ → ২০০,০০০ টাকার টোকেন পরে। প্রতি পাতায় ~৩০০ টোকেন।

PNG, JPG, WebP, HEIC, BMP, এবং একক এবং মাল্টি-পেজ PDFs ৫০ মেগাবাইট পর্যন্ত। এক্সট্র্যাক্ট করার পূর্বে ঝুঁকিপূর্ণ বা ঘুরানো পৃষ্ঠাগুলি স্বয়ংক্রিয়ভাবে সংশোধন করা হয়।

অক্ষর সঠিকতা সাধারণত >98% পরিষ্কার মুদ্রণ পৃষ্ঠা, কম-রেজোলিউশন ছবি, গুরুতরভাবে বিকৃত স্ক্যান, অথবা অসাধারণ ফন্টে ড্রপ। সঠিকতা গুরুত্বপূর্ণ হলে /ocr/compare/ এ তুলনা ইঞ্জিন ব্যবহার করুন।

হ্যাঁ — /batch/ ছবি/PDFs এর একটি ফোল্ডার গ্রহণ করে। প্রত্যেকটি এক্সট্র্যাক্ট /account/?tab=history এ অবতরণ করে। ফোল্ডার-ট্রী সংরক্ষণের জন্য API ব্যবহার করুন।

হ্যাঁ — আপনার ফাইলটি /v1/ocr/ এ POST করুন, যার মডেল হল "TrOCR Base"। JSON ফলাফলটিতে লেখা + (সমর্থিত হলে) বিন্যাস + শব্দ-স্তরের সীমাবদ্ধতা বাক্স থাকবে। /api/-এ সম্পূর্ণ রেফারেন্স রয়েছে।

স্ব-হোস্টকৃত মডেলগুলি আপনার ফাইলগুলি আমাদের GPU-তে রাখে; প্রাইম ডিপিএ-র মাধ্যমে প্রবেশ করে। শেয়ার-উইন্ডোর পরে নথিগুলি মুছে ফেলা হয়। আমরা আপনার ইনপুটগুলিতে প্রশিক্ষণ দেই না।

Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.

সাধারণত প্রতি পৃষ্ঠা ১-৫ সেকেন্ড। বিন্যাস-সচেতন ইঞ্জিন (তালিকা, গণিত) বেশি সময় নেয়। বহু-পৃষ্ঠার PDF-এর আকার প্রায় লাইনগতভাবে পরিবর্তিত হয়।

Free.ai ভালোবাসো?

এই পাতাটি রেটিং দিন