GOT-OCR v2

Free.ai · ocr · ~500 จำนวนของชิ้นส่วนต่อหน่วย page

วางแฟ้มที่นี่ หรือคลิกเพื่อค้นหา

~500 จำนวนของชิ้นส่วนต่อหน่วย page
ทำงานฟรีบน GPU ของเรา ปรับระดับสำหรับ GOT-OCR v2 →

GOT-OCR v2 คือ a โมเดล OCR นำทางผ่านโมเดลภายนอก - ~500 โต๊กเกอร์ ต่อหน้า (50% ค่าใช้จ่ายสูงกว่าต้นทาง)

ใช้ผ่าน API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
เอกสาร API เอากุญแจ API มา

คำถามที่ถามบ่อย

GOT-OCR v2 ดึงข้อความจากภาพและเอกสาร PDF โหลดหน้าที่สแกนแล้ว, ภาพหน้าจอ, หรือภาพถ่ายของเอกสาร และ GOT-OCR v2 จะคืนข้อความกลับมา — โดยรักษาการหยุดบรรทัด และ (บนเครื่องที่รองรับ) ตาราง, สมการ และโครงสร้าง

GOT-OCR v2 สามารถจัดการสคริปต์ได้หลายสิบสคริปต์ - ลาติน, ซีริลลิค, CJK, อาราบิก, เดวานาการี และอื่นๆ อีกมากมาย ส่วน /ocr/ จะมีรายการภาษาที่ครบถ้วนสำหรับแต่ละกลไก

ใช่สำหรับเขียนด้วยมือแบบพิมพ์เรียบร้อย แบบคิ้วและแบบสั้นๆ ยากกว่า TrOCR และเครื่องมือที่ใช้เทรนฟอร์มสมัยใหม่ ดีกว่าเทสเซราคท์แบบเก่ามากในเรื่องการเขียนด้วยมือ

กลไกที่รู้จักการจัดวางหน้า (GOT-OCR, Marker, Florence-2) จะคืนผลมาเป็นตาราง Markdown/HTML และ LaTeX สำหรับสูตร กลไกที่แสดงข้อความธรรมดาจะคืนผลมาเป็นข้อความที่ไม่มีโครงสร้าง — ตรวจสอบโหมดผลลัพธ์ของโมเดลนี้

GOT-OCR v2 เป็นเครื่องมือ OCR ระดับพรีเมี่ยม ใช้ ~500–1,500 โต๊กเกอร์ต่อหน้า 1 ดอลลาร์ = 750,000 โต๊กเกอร์

PNG, JPG, WebP, HEIC, BMP, และ PDF หน้าเดียวและหลายหน้า ขนาดสูงสุด 50 MB หน้าที่บิดหรือหมุนจะถูกแก้ไขอัตโนมัติก่อนที่จะดึงออกมา

ความแม่นยำของตัวอักษรโดยทั่วไปจะ > 98% บนหน้าที่พิมพ์สะอาด ตกลงบนภาพถ่ายความละเอียดต่ำ สแกนที่บิดเบือนมาก หรือแบบอักษรที่ไม่ปกติ ลองเปรียบเทียบเครื่องมือใน / ocr / compare / เมื่อความแม่นยำเป็นเรื่องสำคัญ

ใช่ — /batch/ รองรับโฟลเดอร์ของรูปภาพ/PDFs ทุกครั้งที่ดึงข้อมูลออกมาจะถูกเก็บไว้ใน /account/?tab=history สำหรับการเก็บรักษาต้นไม้โฟลเดอร์ ใช้ API

ใช่ — POST แฟ้มของคุณไปยัง /v1/ocr/ ด้วย model="GOT-OCR v2" คืนค่า JSON ด้วยข้อความ + (เมื่อรองรับ) รูปแบบ + กล่องกำหนดระดับคำ /api/ มีข้อมูลอ้างอิงเต็ม

โมเดลที่ใช้ระบบตัวมันเองจะเก็บแฟ้มของคุณไว้บน GPU ของพวกเรา โมเดลที่ใช้ระบบ Premium จะใช้ DPA ในการส่งผ่านเอกสารเอกสารจะถูกลบหลังจากที่เปิดหน้าต่างการแบ่งปัน เราจะไม่ฝึกการเข้ารหัสข้อมูลที่คุณส่งเข้าไป

ใช่ — Free.ai อนุญาตให้ใช้ข้อความที่ดึงออกมาเพื่อการค้า คุณต้องมีสิทธิ์ในการใช้เอกสารต้นฉบับ

โดยปกติจะใช้เวลา 1-5 วินาทีต่อหน้า เครื่องจักรที่ใช้การจัดวางหน้า (ตาราง, คณิตศาสตร์) จะใช้เวลานานกว่า PDF หลายหน้าจะปรับขนาดเป็นเส้นตรง

Love this tool? Share it!

จัดอันดับหน้านี้