PaddleOCR-VL

Free.ai (self-hosted) · ocr · ~300 จำนวนของชิ้นส่วนต่อหน่วย page

วางแฟ้มที่นี่ หรือคลิกเพื่อค้นหา

~300 จำนวนของชิ้นส่วนต่อหน่วย page

PaddleOCR-VL เป็น a โมเดล OCR สร้างโดย PaddlePaddle แข็งแกร่งที่สุดที่ Fast multilingual image / scan to Markdown; tables, formulas, charts; 109 languages. จัดเก็บข้อมูลด้วยตนเองบน Free.ai GPUs — ทำงานฟรีกับสระของโต๊ะประจำวันของคุณ (300 โต๊ะ ต่อหน้า) ปล่อยออกมาภายใต้ Apache 2.0 — อนุญาตให้ใช้ในเชิงพาณิชย์บน Free.ai

ใช้ผ่าน API

REST API รองรับ OpenAI สร้างกุญแจและเรียกโมเดลนี้ในไม่กี่วินาที

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr-vl","prompt":"your prompt here"}'
เอกสาร API เอากุญแจ API มา

คำถามที่ถามบ่อย

PaddleOCR-VL ดึงข้อความจากภาพและเอกสาร PDF โหลดหน้าที่สแกนแล้ว, ภาพหน้าจอ, หรือภาพถ่ายของเอกสาร และ PaddleOCR-VL จะคืนข้อความกลับมา — โดยรักษาการหยุดบรรทัด และ (บนเครื่องที่รองรับ) ตาราง, สมการ และโครงสร้าง

PaddleOCR-VL สามารถจัดการสคริปต์ได้หลายสิบสคริปต์ - ลาติน, ซีริลลิค, CJK, อาราบิก, เดวานาการี และอื่นๆ อีกมากมาย ส่วน /ocr/ จะมีรายการภาษาที่ครบถ้วนสำหรับแต่ละกลไก

ใช่สำหรับเขียนด้วยมือแบบพิมพ์เรียบร้อย แบบคิ้วและแบบสั้นๆ ยากกว่า TrOCR และเครื่องมือที่ใช้เทรนฟอร์มสมัยใหม่ ดีกว่าเทสเซราคท์แบบเก่ามากในเรื่องการเขียนด้วยมือ

กลไกที่รู้จักการจัดวางหน้า (GOT-OCR, Marker, Florence-2) จะคืนผลมาเป็นตาราง Markdown/HTML และ LaTeX สำหรับสูตร กลไกที่แสดงข้อความธรรมดาจะคืนผลมาเป็นข้อความที่ไม่มีโครงสร้าง — ตรวจสอบโหมดผลลัพธ์ของโมเดลนี้

PaddleOCR-VL ทำงานบน GPUs จากเงินที่คุณจ่ายทุกวัน $5 → 200,000 โต๊กเก็ตที่จ่ายแล้ว ~300 โต๊กเก็ตต่อหน้า

PNG, JPG, WebP, HEIC, BMP, และ PDF หน้าเดียวและหลายหน้า ขนาดสูงสุด 50 MB หน้าที่บิดหรือหมุนจะถูกแก้ไขอัตโนมัติก่อนที่จะดึงออกมา

ความแม่นยำของตัวอักษรโดยทั่วไปจะ > 98% บนหน้าที่พิมพ์สะอาด ตกลงบนภาพถ่ายความละเอียดต่ำ สแกนที่บิดเบือนมาก หรือแบบอักษรที่ไม่ปกติ ลองเปรียบเทียบเครื่องมือใน / ocr / compare / เมื่อความแม่นยำเป็นเรื่องสำคัญ

ใช่ — /batch/ รองรับโฟลเดอร์ของรูปภาพ/PDFs ทุกครั้งที่ดึงข้อมูลออกมาจะถูกเก็บไว้ใน /account/?tab=history สำหรับการเก็บรักษาต้นไม้โฟลเดอร์ ใช้ API

ใช่ — POST แฟ้มของคุณไปยัง /v1/ocr/ ด้วย model="PaddleOCR-VL" คืนค่า JSON ด้วยข้อความ + (เมื่อรองรับ) รูปแบบ + กล่องกำหนดระดับคำ /api/ มีข้อมูลอ้างอิงเต็ม

โมเดลที่ใช้ระบบตัวมันเองจะเก็บแฟ้มของคุณไว้บน GPU ของพวกเรา โมเดลที่ใช้ระบบ Premium จะใช้ DPA ในการส่งผ่านเอกสารเอกสารจะถูกลบหลังจากที่เปิดหน้าต่างการแบ่งปัน เราจะไม่ฝึกการเข้ารหัสข้อมูลที่คุณส่งเข้าไป

ใช่ — Free.ai อนุญาตให้ใช้ข้อความที่ดึงออกมาเพื่อการค้า คุณต้องมีสิทธิ์ในการใช้เอกสารต้นฉบับ

โดยปกติจะใช้เวลา 1-5 วินาทีต่อหน้า เครื่องจักรที่ใช้การจัดวางหน้า (ตาราง, คณิตศาสตร์) จะใช้เวลานานกว่า PDF หลายหน้าจะปรับขนาดเป็นเส้นตรง

Love this tool? Share it!

จัดอันดับหน้านี้