mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 Токен call
~100 Токен call

mxbai-embed-large-v1 нь an embedding model-ийн mixedbread.ai-ээр бүтээсэн хэсэг юм. 1995 онд "Best of" цомог гаргажээ. Free.ai GPU дээр өөрийн хосттой — таны өдөр тутмын токен нөөц (100 токен дуудлага бүрт)-ийн эсрэг үнэгүй ажиллана. Apache 2.0-ийн дор хэвлэгдсэн — Free.ai дээр худалдааны зорилгоор ашиглах зөвшөөрөлтэй.

API- ээр ашиглах

OpenAI-тай нийцтэй REST API. Алгаалгын түлхүүр үүсгэж секундэд энэ загварыг дуудна.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
Хяналт API түлхүүрийг авах

Заримдаа асуудаг асуултууд

mxbai-embed-large-v1 нь текстийг утга агуулсан нягт вектор (хөлсгөлийн жагсаалт) болгон хувиргаж өгдөг. Үүнийг семантикт хайлт, багцлах, зөвлөмж, олж авахад нэмэлт үүсгэх (RAG) болон "энэ текст энэ тексттэй адилхан уу" гэсэн асуултанд хариулахын тулд ашиглана.

Жишээ нь 384, 768, 1024, эсвэл 1536 хэмжээсүүд загвараас хамаарна. BGE-M3 нь 1024-dim, OpenAI Ada нь 1536-dim-ийг гаргана. API хариулт нь хэмжээсийг агуулдаг тул векторын өгөгдлийн сан зөв индексийг сонгоно.

Шинэ үеийн нийлэгжүүлэх загварууд (Free.ai дээрх олон сонголтуудыг багтаасан) 100+ хэл дээр бэлтгэгдсэн. Хэл хоорондын олж авах ажиллагаа — Англиар хайх, Испаниар тохирох баримтууд.

512- 8192 тэмдэгт загвараас хамаарна. Хэт урт бичлэгийг тасална - өргөтгөл оруулахаасаа өмнө урт баримтыг параграф болгон хуваана.

mxbai-embed-large-v1 нь бидний өөрийн график процессор дээр ажилладаг бөгөөд хамгийн хямд хэрэгслүүдийн нэг юм. ~100 токен нь өдөр тутмын үнэгүй нөөцөөсөө өгөгддөг. $5 = 200K токен.

Тийм — /v1/embeddings/ руу мөрний жагсаалтыг POST хийж mxbai-embed-large-v1 нь ижил эрэмбэтэй векторуудын жагсаалтыг буцаана. Бүтээгдэхүүний хэмжээ нэг хүсэлтээр 2048 хүртэл.

L2- нормалчилсан нь өмнөх байдлаар — косинус адилтгал = цэг үржүүлэг. Хэрэв та өөр зайны метрикийн хувьд түүхий векторыг хүсвэл 'normalize=false' -ийг өгнө үү.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 нь JSON-ийн хөдөлгөөнт тоог эргүүлж өгдөг; DB нь загварыг хэзээ ч харахгүй.

Тийм — POST to /v1/embeddings/ with model="mxbai-embed-large-v1". OpenAI-тэй нийцтэй хариултын хэлбэр, одоогийн үйлчлүүлэгчдийн сангууд өөрчлөгдөөгүйгээр ажиллана. /api/ нь бүрэн холбоостой.

Өөрийн сервертэй загварууд таны текстийг график процессор дээр хадгалж, дуудлага ирэхэд устгана. Premium нь DPA- ээр дамжуулна. Бид таны оруулсан мэдээллийг ашиглахгүй.

100-500ms-ийн хооронд урт текстийн хувьд, 100-500ms-ийн хооронд үнэтэй текстийн хувьд. Бүтээгдэхүүний дуудлага нь ойролцоогоор 1000 хэсгийг 2-10 секундэд гүйцэтгэх боломжтой.

Тийм ээ — Free.ai нь нийлэгжилтийг худалдааны зорилгоор ашиглах эрх олгодог. Вектор бүрийн лицензийн төлбөргүйгээр хайлт, RAG хоолой, зөвлөгөөний системийг бүтээх боломжтой.

Free.ai-ыг хайрладаг уу? Найзуудаа хэлж өгөөрэй!

Энэ хуудсыг үнэл