Question 1

BGE-M3 ทำอะไร

Accepted Answer

BGE-M3 เปลี่ยนข้อความเป็นเวกเตอร์ที่หนาแน่น (รายการของตัวเลขลอย) ที่บันทึกความหมาย ใช้สำหรับค้นหาความหมาย การจัดกลุ่ม การแนะนำ การสร้างแบบเพิ่มประสิทธิภาพการค้นหา (RAG) และงานใด ๆ ที่ "ข้อความนี้คล้ายกับข้อความนั้น" มีความสำคัญ

Question 2

ขนาดของการฝังตัว BGE-M3 คืออะไร?

Accepted Answer

ค่ามิติทั่วไปคือ 384, 768, 1024 หรือ 1536 ขึ้นอยู่กับรุ่น BGE-M3 จะส่งออกเป็น 1024-dim; OpenAI Ada จะส่งออกเป็น 1536 การตอบรับของ API จะรวมถึงมิติ ดังนั้น ฐานข้อมูลเวกเตอร์ของคุณจะเลือกดัชนีที่ถูกต้อง

Question 3

BGE-M3 ใช้หลายภาษาหรือไม่?

Accepted Answer

โมเดลการฝังแบบทันสมัย (รวมถึงตัวเลือกส่วนใหญ่บน Free.ai) ถูกฝึกให้ใช้ภาษามากกว่า 100 ภาษา การค้นหาภาษาต่างๆ ทำงานได้ — ค้นหาในภาษาอังกฤษ, ตรงกับเอกสารในภาษาสเปน

Question 4

ความยาวสูงสุดของข้อมูลที่เข้าถึงสำหรับ BGE-M3 คืออะไร?

Accepted Answer

512 ถึง 8, 192 ตัวอักษรขึ้นอยู่กับรุ่น ข้อมูลที่ยาวกว่าจะถูกตัดออก — เอกสารที่ยาวกว่าจะถูกแยกออกเป็นย่อหน้าก่อนที่จะฝังเข้าไป

Question 5

BGE-M3 มันมีราคาเท่าไหร่

Accepted Answer

BGE-M3 ทำงานบน GPU ของพวกเราเอง และเป็นหนึ่งในเครื่องมือที่ถูกที่สุด - ประมาณ ~100 โต๊กเกอร์ต่อการเรียกใช้ที่ดึงมาจากสระฟรีของคุณทุกวัน $5 = 200K โต๊กเกอร์

Question 6

ฉันสามารถใช้การฝังแบบบั๊กกับ BGE-M3 ได้หรือไม่?

Accepted Answer

ใช่ — POST รายการสตริงไปยัง /v1/embeddings/ และ BGE-M3 จะคืนกลับมาเป็นรายการเวกเตอร์ในลำดับเดียวกัน ขนาดแบตสูงสุด 2,048 ต่อคำร้อง

Question 7

BGE-M3 ทำการปรับค่าเวกเตอร์ให้เป็นปกติหรือไม่?

Accepted Answer

ปรับค่าเป็นค่าปกติ L2 โดยปริยาย - ความคล้ายคลึงของโคไซน = ผลิตผลของจุด ส่งค่า 'normalize=false' หากต้องการใช้เวกเตอร์ raw สำหรับระยะทางที่แตกต่างกัน

Question 8

ข้อมูลฐานข้อมูลเวกเตอร์ใดที่ใช้กับ BGE-M3?

Accepted Answer

ทุกอย่าง — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. BGE-M3 จะคืนค่า JSON แบบ float ธรรมดา; DB จะไม่เคยเห็นโมเดล

Question 9

มี API สำหรับ BGE-M3 หรือไม่?

Accepted Answer

ใช่ — POST to /v1/embeddings/ with model="BGE-M3". รูปแบบการตอบสนองที่เข้ากันได้กับ OpenAI, ดังนั้นไลบรารีของไคลเอนต์ที่ใช้อยู่จะทำงานโดยไม่เปลี่ยนแปลง /api/ มีอ้างอิงเต็ม

Question 10

ความเป็นส่วนตัวเป็นอย่างไรเมื่อฉันฝังข้อความที่มีความสำคัญไว้กับ BGE-M3?

Accepted Answer

โมเดลที่ใช้ตัวมันเองเก็บข้อความของคุณไว้บน GPU และทิ้งมันไปหลังจากที่โทรกลับมา Premium ผ่านผ่านด้วย DPA เราจะไม่ฝึกการเข้ารหัสของคุณ

Question 11

BGE-M3 ใช้เวลานานแค่ไหนในการโทร?

Accepted Answer

ใต้ 100 มิลลิวินาทีสำหรับข้อความสั้นบนโฮสต์ตัวเดียว 100-500 มิลลิวินาทีบนแพ็คเกจพิเศษ การเรียกใช้แบตจะปรับขนาดได้โดยตรง — 1,000 ชิ้นเสร็จใน 2-10 วินาที

Question 12

ฉันสามารถใช้ผลลัพธ์ของ BGE-M3 ในการค้าได้หรือไม่?

Accepted Answer

ใช่ Free.ai อนุมัติให้ใช้ในเชิงพาณิชย์ สร้างการค้นหาผลิตภัณฑ์ RAG ท่อระบายน้ำ ระบบแนะนำโดยไม่มีค่าใช้จ่ายต่อเวกเตอร์

BGE-M3

ใช้ผ่าน API

คำถามที่ถามบ่อย