Question 1

PaddleOCR-VL ทำอะไร

Accepted Answer

PaddleOCR-VL ดึงข้อความจากภาพและเอกสาร PDF โหลดหน้าที่สแกนแล้ว, ภาพหน้าจอ, หรือภาพถ่ายของเอกสาร และ PaddleOCR-VL จะคืนข้อความกลับมา — โดยรักษาการหยุดบรรทัด และ (บนเครื่องที่รองรับ) ตาราง, สมการ และโครงสร้าง

Question 2

PaddleOCR-VL รองรับภาษาอะไร?

Accepted Answer

PaddleOCR-VL สามารถจัดการสคริปต์ได้หลายสิบสคริปต์ - ลาติน, ซีริลลิค, CJK, อาราบิก, เดวานาการี และอื่นๆ อีกมากมาย ส่วน /ocr/ จะมีรายการภาษาที่ครบถ้วนสำหรับแต่ละกลไก

Question 3

PaddleOCR-VL อ่านลายมือได้ไหม?

Accepted Answer

ใช่สำหรับเขียนด้วยมือแบบพิมพ์เรียบร้อย แบบคิ้วและแบบสั้นๆ ยากกว่า TrOCR และเครื่องมือที่ใช้เทรนฟอร์มสมัยใหม่ ดีกว่าเทสเซราคท์แบบเก่ามากในเรื่องการเขียนด้วยมือ

Question 4

PaddleOCR-VL จะเก็บโครงสร้างตารางหรือสูตรคณิตศาสตร์ไว้หรือไม่?

Accepted Answer

กลไกที่รู้จักการจัดวางหน้า (GOT-OCR, Marker, Florence-2) จะคืนผลมาเป็นตาราง Markdown/HTML และ LaTeX สำหรับสูตร กลไกที่แสดงข้อความธรรมดาจะคืนผลมาเป็นข้อความที่ไม่มีโครงสร้าง — ตรวจสอบโหมดผลลัพธ์ของโมเดลนี้

Question 5

PaddleOCR-VL ใช้เงินเท่าไหร่ต่อหน้า?

Accepted Answer

PaddleOCR-VL ทำงานบน GPUs จากเงินที่คุณจ่ายทุกวัน $5 → 200,000 โต๊กเก็ตที่จ่ายแล้ว ~300 โต๊กเก็ตต่อหน้า

Question 6

รูปแบบข้อมูลที่ PaddleOCR-VL รองรับคืออะไร?

Accepted Answer

PNG, JPG, WebP, HEIC, BMP, และ PDF หน้าเดียวและหลายหน้า ขนาดสูงสุด 50 MB หน้าที่บิดหรือหมุนจะถูกแก้ไขอัตโนมัติก่อนที่จะดึงออกมา

Question 7

ชื่อ PaddleOCR-VL ถูกต้องแค่ไหน

Accepted Answer

ความแม่นยำของตัวอักษรโดยทั่วไปจะ > 98% บนหน้าที่พิมพ์สะอาด ตกลงบนภาพถ่ายความละเอียดต่ำ สแกนที่บิดเบือนมาก หรือแบบอักษรที่ไม่ปกติ ลองเปรียบเทียบเครื่องมือใน / ocr / compare / เมื่อความแม่นยำเป็นเรื่องสำคัญ

Question 8

ฉันสามารถใช้ OCR แบบแบตได้หรือไม่?

Accepted Answer

ใช่ — /batch/ รองรับโฟลเดอร์ของรูปภาพ/PDFs ทุกครั้งที่ดึงข้อมูลออกมาจะถูกเก็บไว้ใน /account/?tab=history สำหรับการเก็บรักษาต้นไม้โฟลเดอร์ ใช้ API

Question 9

มี API สำหรับ PaddleOCR-VL หรือไม่?

Accepted Answer

ใช่ — POST แฟ้มของคุณไปยัง /v1/ocr/ ด้วย model="PaddleOCR-VL" คืนค่า JSON ด้วยข้อความ + (เมื่อรองรับ) รูปแบบ + กล่องกำหนดระดับคำ /api/ มีข้อมูลอ้างอิงเต็ม

Question 10

ความเป็นส่วนตัวเป็นยังไง ถ้าฉัน OCR เอกสารที่มีความสำคัญ ด้วย PaddleOCR-VL?

Accepted Answer

โมเดลที่ใช้ระบบตัวมันเองจะเก็บแฟ้มของคุณไว้บน GPU ของพวกเรา โมเดลที่ใช้ระบบ Premium จะใช้ DPA ในการส่งผ่านเอกสารเอกสารจะถูกลบหลังจากที่เปิดหน้าต่างการแบ่งปัน เราจะไม่ฝึกการเข้ารหัสข้อมูลที่คุณส่งเข้าไป

Question 11

ผลลัพธ์ของ PaddleOCR-VL นั้นปลอดภัยสำหรับการใช้ในเชิงพาณิชย์หรือไม่?

Accepted Answer

ใช่ — Free.ai อนุญาตให้ใช้ข้อความที่ดึงออกมาเพื่อการค้า คุณต้องมีสิทธิ์ในการใช้เอกสารต้นฉบับ

Question 12

PaddleOCR-VL ใช้เวลานานแค่ไหน

Accepted Answer

โดยปกติจะใช้เวลา 1-5 วินาทีต่อหน้า เครื่องจักรที่ใช้การจัดวางหน้า (ตาราง, คณิตศาสตร์) จะใช้เวลานานกว่า PDF หลายหน้าจะปรับขนาดเป็นเส้นตรง

PaddleOCR-VL

ใช้ผ่าน API

รุ่นที่คล้ายกัน

คำถามที่ถามบ่อย