PaddleOCR

Free.ai (self-hosted) · ocr · ~300 প্রতি page

এখানে একটি ফাইল ছেড়ে দিন অথবা ব্রাউজ করতে ক্লিক করুন

~300 প্রতি page

PaddleOCR হচ্ছে an OCR মডেল যা PaddlePaddle দ্বারা নির্মিত। Multi-language OCR, document layout extraction, receipts.-এ সবচেয়ে শক্তিশালী। Self-hosted on Free.ai GPUs — runs free against your daily token pool (300 tokens প্রতি পৃষ্ঠা). Released under Apache 2.0 — commercial use permitted on Free.ai.

API ব্যবহার করো

OpenAI-সমর্থিত REST API। এক সেকেন্ডের মধ্যে একটি কী তৈরি করুন এবং এই মডেলটি কল করুন।

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr","prompt":"your prompt here"}'
API নথিপত্র API কী প্রাপ্ত করুন

প্রায়শই জিজ্ঞাসিত প্রশ্ন

PaddleOCR ছবি এবং PDF থেকে টেক্সট এক্সট্র্যাক্ট করে। স্ক্যান করা একটি পৃষ্ঠা, স্ক্রিনশট, অথবা নথির একটি ছবি আপলোড করুন এবং PaddleOCR টেক্সট ফিরিয়ে দেবে - লাইন ব্রেক এবং (সক্ষম ইঞ্জিন) টেবিল, সূত্র এবং গঠন সংরক্ষণ করে।

PaddleOCR ডজনখানেক স্ক্রিপ্ট পরিচালনা করে - ল্যাটিন, সিরিলিক, সিজেকে, আরবি, দেভানাগারি, এবং আরো অনেক কিছু। /ocr/ নামক স্থানে ইঞ্জিনের প্রতিটি ভাষার সম্পূর্ণ তালিকা রয়েছে।

পরিষ্কার মুদ্রণ-শৈলীর হাতের লেখার জন্য হ্যাঁ; কার্সিভ এবং শর্টহান্ড কঠিন। TrOCR এবং আধুনিক ট্রান্সফরমার-ভিত্তিক ইঞ্জিনগুলি হাতের লেখার ক্ষেত্রে লেইগেসি টেসরাক্টের চেয়ে উল্লেখযোগ্যভাবে ভাল।

বিন্যাস-সচেতন ইঞ্জিন (GOT-OCR, Marker, Florence-2) Markdown/HTML টেবিল এবং সূত্রের জন্য LaTeX ফিরিয়ে দেয়। প্লেইন-টেক্সট ইঞ্জিন গঠনবিহীন টেক্সট ফিরিয়ে দেয় - এই মডেলের আউটপুট মোড পরীক্ষা করুন।

PaddleOCR আপনার দৈনিক ফ্রি পুল থেকে আমাদের জিপিইউতে চলছে; $৫ → ২০০,০০০ টাকার টোকেন পরে। প্রতি পাতায় ~৩০০ টোকেন।

PNG, JPG, WebP, HEIC, BMP, এবং একক এবং মাল্টি-পেজ PDFs ৫০ মেগাবাইট পর্যন্ত। এক্সট্র্যাক্ট করার পূর্বে ঝুঁকিপূর্ণ বা ঘুরানো পৃষ্ঠাগুলি স্বয়ংক্রিয়ভাবে সংশোধন করা হয়।

অক্ষর সঠিকতা সাধারণত >98% পরিষ্কার মুদ্রণ পৃষ্ঠা, কম-রেজোলিউশন ছবি, গুরুতরভাবে বিকৃত স্ক্যান, অথবা অসাধারণ ফন্টে ড্রপ। সঠিকতা গুরুত্বপূর্ণ হলে /ocr/compare/ এ তুলনা ইঞ্জিন ব্যবহার করুন।

হ্যাঁ — /batch/ ছবি/PDFs এর একটি ফোল্ডার গ্রহণ করে। প্রত্যেকটি এক্সট্র্যাক্ট /account/?tab=history এ অবতরণ করে। ফোল্ডার-ট্রী সংরক্ষণের জন্য API ব্যবহার করুন।

হ্যাঁ — আপনার ফাইলটি /v1/ocr/ এ POST করুন, যার মডেল হল "PaddleOCR"। JSON ফলাফলটিতে লেখা + (সমর্থিত হলে) বিন্যাস + শব্দ-স্তরের সীমাবদ্ধতা বাক্স থাকবে। /api/-এ সম্পূর্ণ রেফারেন্স রয়েছে।

স্ব-হোস্টকৃত মডেলগুলি আপনার ফাইলগুলি আমাদের GPU-তে রাখে; প্রাইম ডিপিএ-র মাধ্যমে প্রবেশ করে। শেয়ার-উইন্ডোর পরে নথিগুলি মুছে ফেলা হয়। আমরা আপনার ইনপুটগুলিতে প্রশিক্ষণ দেই না।

Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.

সাধারণত প্রতি পৃষ্ঠা ১-৫ সেকেন্ড। বিন্যাস-সচেতন ইঞ্জিন (তালিকা, গণিত) বেশি সময় নেয়। বহু-পৃষ্ঠার PDF-এর আকার প্রায় লাইনগতভাবে পরিবর্তিত হয়।

Free.ai ভালোবাসো?

এই পাতাটি রেটিং দিন