PaddleOCR-VL

Free.ai (self-hosted) · ocr · ~300 الرموز لكل page

اسقط ملفاً هنا أو انقر للتصفح

~300 الرموز لكل page

PaddleOCR-VL هو a نموذج التعرف الضوئي على الحروف الذي بنته PaddlePaddle. أفضل لاعب في Fast multilingual image / scan to Markdown; tables, formulas, charts; 109 languages.. استضافة ذاتية على Free.ai GPUs — يعمل مجانا ضد مجمع الرموز اليومية (300 tokens لكل صفحة). تم إصداره تحت Apache 2.0 — الاستخدام التجاري مسموح به على Free.ai.

الاستخدام عن طريق واجهة البرمجة

REST API متوافق مع OpenAI. تولد مفتاحاً وتدعو هذا النموذج في ثوانٍ.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr-vl","prompt":"your prompt here"}'
وثائق API احصل على مفتاح API

الأسئلة المتكررة

PaddleOCR-VL يستخرج النص من الصور وملفات PDF. قم بتحميل صفحة مسحها، أو لقطة شاشة، أو صورة لوثيقة وPaddleOCR-VL يعيد النص - مع الحفاظ على كسرات السطور (على محركات قادرة) الجداول، والصيغ، والبنية.

PaddleOCR-VL يتعامل مع عشرات من الكتابات - اللاتينية، السيريلية، CJK، العربية، ديفاناغاري، وأكثر. /ocr/ الهبوط لديه قائمة كاملة من اللغات لكل محرك.

نعم للخط النظيف المطبوع؛ الخط المائل والخط المختصر أصعب. TrOCR والمحركات الحديثة القائمة على المحولات أفضل بكثير من Tesseract القديمة على الكتابة اليدوية.

محركات التصميم (GOT-OCR, Marker, Florence-2) تعيد جداول Markdown/HTML و LaTeX للصيغ. محركات النص العادي تعيد نص بدون هيكل - تحقق من طريقة خرج هذا النموذج.

PaddleOCR-VL يعمل على وحدات المعالجة المركزية من مجمعك اليومي المجاني؛ $5 → 200,000 رموز مدفوعة بعد. ~300 رموز لكل صفحة.

PNG, JPG, WebP, HEIC, BMP, بالإضافة إلى PDFs من صفحة واحدة أو متعددة حتى 50 ميغابايت.

دقة الحروف عادة ما تكون >98% على الصفحات المطبوعة النظيفة، أو على الصور ذات الوضوح المنخفض، أو على الصور الممسوحة بشدة، أو على الخطوط غير العادية.

نعم - /batch/ يقبل مجلدا من الصور/PDFs. كل استخراج يهبط في /account/?tab=history. للحفاظ على شجرة المجلد استخدم API.

نعم — أرسل ملفك إلى /v1/ocr/ مع النموذج "PaddleOCR-VL". يعيد JSON مع النص + (عندما يكون مدعوماً) التصميم + صناديق الحد على مستوى الكلمة. /api/ لديها المرجع الكامل.

النماذج المستضافة ذاتياً تحتفظ بملفك على وحدات المعالجة الرسومية الخاصة بنا؛ ويتم نقل الوثائق من خلال DPA. ويتم حذف الوثائق بعد نافذة المشاركة. ونحن لا نتدرب على مدخلاتك.

نعم — Free.ai يمنح الاستخدام التجاري للنص المستخرج. أنت بحاجة إلى حقوق الوثيقة المصدر.

1-5 ثوان لكل صفحة عادة. محركات التصميم-مدر (الجداول، الرياضيات) يستغرق وقتا أطول.

Love this tool? Share it!

تقييم هذه الصفحة