GOT-OCR v2
Free.ai
·
ocr
·
~500 প্রতি page
GOT-OCR v2 হচ্ছে an OCR মডেল। বাইরের মডেলগুলোর মাধ্যমে পথ নির্ধারণ করা হয়েছে — ~500 টোকেন প্রতি পৃষ্ঠা (আপস্ট্রিম খরচের ৫০% মার্কআপ)।
API ব্যবহার করো
OpenAI-সমর্থিত REST API। এক সেকেন্ডের মধ্যে একটি কী তৈরি করুন এবং এই মডেলটি কল করুন।
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
API নথিপত্র
API কী প্রাপ্ত করুন
প্রায়শই জিজ্ঞাসিত প্রশ্ন
GOT-OCR v2 ছবি এবং PDF থেকে টেক্সট এক্সট্র্যাক্ট করে। স্ক্যান করা একটি পৃষ্ঠা, স্ক্রিনশট, অথবা নথির একটি ছবি আপলোড করুন এবং GOT-OCR v2 টেক্সট ফিরিয়ে দেবে - লাইন ব্রেক এবং (সক্ষম ইঞ্জিন) টেবিল, সূত্র এবং গঠন সংরক্ষণ করে।
GOT-OCR v2 ডজনখানেক স্ক্রিপ্ট পরিচালনা করে - ল্যাটিন, সিরিলিক, সিজেকে, আরবি, দেভানাগারি, এবং আরো অনেক কিছু। /ocr/ নামক স্থানে ইঞ্জিনের প্রতিটি ভাষার সম্পূর্ণ তালিকা রয়েছে।
পরিষ্কার মুদ্রণ-শৈলীর হাতের লেখার জন্য হ্যাঁ; কার্সিভ এবং শর্টহান্ড কঠিন। TrOCR এবং আধুনিক ট্রান্সফরমার-ভিত্তিক ইঞ্জিনগুলি হাতের লেখার ক্ষেত্রে লেইগেসি টেসরাক্টের চেয়ে উল্লেখযোগ্যভাবে ভাল।
বিন্যাস-সচেতন ইঞ্জিন (GOT-OCR, Marker, Florence-2) Markdown/HTML টেবিল এবং সূত্রের জন্য LaTeX ফিরিয়ে দেয়। প্লেইন-টেক্সট ইঞ্জিন গঠনবিহীন টেক্সট ফিরিয়ে দেয় - এই মডেলের আউটপুট মোড পরীক্ষা করুন।
GOT-OCR v2 একটি প্রাইম ওসিআর ইঞ্জিন। প্রতিটি পৃষ্ঠায় ~৫০০-১,৫০০ টোকেন। $১ = ৭৫০,০০০ টোকেন।
PNG, JPG, WebP, HEIC, BMP, এবং একক এবং মাল্টি-পেজ PDFs ৫০ মেগাবাইট পর্যন্ত। এক্সট্র্যাক্ট করার পূর্বে ঝুঁকিপূর্ণ বা ঘুরানো পৃষ্ঠাগুলি স্বয়ংক্রিয়ভাবে সংশোধন করা হয়।
অক্ষর সঠিকতা সাধারণত >98% পরিষ্কার মুদ্রণ পৃষ্ঠা, কম-রেজোলিউশন ছবি, গুরুতরভাবে বিকৃত স্ক্যান, অথবা অসাধারণ ফন্টে ড্রপ। সঠিকতা গুরুত্বপূর্ণ হলে /ocr/compare/ এ তুলনা ইঞ্জিন ব্যবহার করুন।
হ্যাঁ — /batch/ ছবি/PDFs এর একটি ফোল্ডার গ্রহণ করে। প্রত্যেকটি এক্সট্র্যাক্ট /account/?tab=history এ অবতরণ করে। ফোল্ডার-ট্রী সংরক্ষণের জন্য API ব্যবহার করুন।
হ্যাঁ — আপনার ফাইলটি /v1/ocr/ এ POST করুন, যার মডেল হল "GOT-OCR v2"। JSON ফলাফলটিতে লেখা + (সমর্থিত হলে) বিন্যাস + শব্দ-স্তরের সীমাবদ্ধতা বাক্স থাকবে। /api/-এ সম্পূর্ণ রেফারেন্স রয়েছে।
স্ব-হোস্টকৃত মডেলগুলি আপনার ফাইলগুলি আমাদের GPU-তে রাখে; প্রাইম ডিপিএ-র মাধ্যমে প্রবেশ করে। শেয়ার-উইন্ডোর পরে নথিগুলি মুছে ফেলা হয়। আমরা আপনার ইনপুটগুলিতে প্রশিক্ষণ দেই না।
Yes — Free.ai grants commercial use of extracted text. You need rights to the source document.
সাধারণত প্রতি পৃষ্ঠা ১-৫ সেকেন্ড। বিন্যাস-সচেতন ইঞ্জিন (তালিকা, গণিত) বেশি সময় নেয়। বহু-পৃষ্ঠার PDF-এর আকার প্রায় লাইনগতভাবে পরিবর্তিত হয়।