TrOCR Base

Free.ai (self-hosted) · ocr · ~300 ٹوکنس پر page

یہاں فائلیں ڈالیں یا براؤز کرنے کے لیے کلک کریں

~300 ٹوکنس پر page

TrOCR Base an OCR ماڈل Microsoft سے بنائی گئی ہے. Handwritten documents, low-resource scripts. پر سب سے زیادہ مضبوط. Free.ai GPUs پر خود مہمان — آپ کے روزانہ ٹوکن پول کے خلاف مفت چلتا ہے (300 ٹوکن صفحہ). MIT کے تحت آزاد کیا گیا — تجارتی استعمال Free.ai پر اجازت دی گئی.

API کے ذریعے استعمال کریں

اوپن اے آئی-مطابق REST API. ایک کلید پیدا کریں اور اس ماڈل کو سیکنڈز میں بلايں

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"trocr-base","prompt":"your prompt here"}'
API دستاویزی API کلید حاصل کریں

بار بار پوچھے گئے سوالات

TrOCR Base تصویروں اور PDFs سے متن نکالا جاتا ہے. ایک سکین کیا گیا صفحہ اپ لوڈ کریں، ایک سکرین شاٹ، یا ایک دستاویزی فوٹو اور TrOCR Base متن واپس کرتا ہے - لائن بریکٹس کو محفوظ رکھتا ہے اور (قادر انجنوں پر) ٹیبل، فارمولا، اور ڈھانچے.

TrOCR Base ڈزينوں سکيپٹس کو ہینڈل کر تا هے - لاطيني ، سيريلل ، CJK ، عربي ، ديوناگري ، اور اور بھی. /ocr/ لینڈنگ پر تمام زبانوں کی فہرست پر انجن هے

صاف پرنٹ شدہ انداز کے ہاتھ نوشتہ کے ليے ہاں ؛ کرسائي اور مختصر دستي زیادہ مشکل هے ۔ TrOCR اور جديد ترانسفرميشن پر مبنی انجنيز دست نوشتہ پر ليجڈ Tesseract سے خوبي سے بہتر هے

لائيٹ اپ-آشکار انجن (GOT-OCR, Marker, Florence-2) فارمولا کے ليے Markdown/HTML ٹیبل اور LaTeX واپس کر تا هے ۔ صاف-تکسٹ انجن بغير ڈھانچے کے متن واپس کر تا هے ۔ اس ماڈل کے آؤٹ پٹ موڈ کو چکيں

TrOCR Base آپ کے روزانہ مفت پول سے ہمارے GPUs پر چلتا ہے؛ $5 → 200,000 ادا کیے گئے ٹوکن کے بعد. ~300 ٹوکن ہر صفحے پر.

PNG, JPG, WebP, HEIC, BMP, plus single- اور multi-page PDFs 50 MB تک. اسکیوڈ یا موڑے ہوئے صفحات نکالے جانے سے پہلے خودکار طور پر ٹھیک کیے جاتے ہیں.

حروف کا درستگي عام طور پر صاف پرنٹ صفحات پر >98% هے ، کم رزولوشن فوٹو پر گرنے والا ، شدید طور پر منحرف سکين ، يا غيرمعمولي فونٹس. /ocr/compare/ پر انجنينز کا موازنہ کريں جب درستگي اهم هے

ہاں - /بٹچ/ ایک فولڈر کو قبول کرتا ہے تصویروں/PDFs کا. ہر نکالی ہوئی چیز /اکااؤنٹ/؟ٹب= تاریخ میں پہنچتی ہے. فولڈر-ٹری محفوظ رکھنے کے لیے API استعمال کریں.

ہاں - آپ کی فائل کو /v1/ocr/ میں POST کریں موڈل="TrOCR Base" کے ساتھ. JSON کو متن + (جب بھی مدد کی جائے) لئائیٹ اپ + ورڈ-لیول بانڈنگ باکس کے ساتھ واپس کرتا ہے. /api/ میں مکمل حوالہ ہے.

خود مہمان ماڈل آپ کی فائل ہمارے GPUs پر رکھتے ہیں؛ پرائم DPA کے ساتھ گزرتے ہیں. دستاویز شیئر-وینڈو کے بعد حذف کی جاتی ہیں. ہم آپ کی انٹیجوں پر تربیت نہیں کرتے.

ہاں - Free.ai نکالے گئے متن کا تجارتی استعمال عطا کرتا ہے آپ کو سرچشمہ دستاویز کے حقوق کی ضرورت ہے.

ہر صفحے پر 1-5 سیکنڈ عام طور پر. لیٹِچوڈ-آشکار انجن (ٹیبل، ریاضی) زیادہ وقت لے لیتا ہے. متعدد صفحات والے PDFs تقریباً خطی طور پر پیمانہ کرتے ہیں.

Free.ai سے محبت؟ اپنے دوستوں کو بتاؤ۔

اس صفحے کو درجہ دیں