mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 tokens per call
~100 tokens per call

mxbai-embed-large-v1 adalah an embedding model yang dibina oleh mixedbread.ai. Terkuat di Semantic search, clustering, similarity.. Dihost sendiri pada Free.ai GPU — berjalan percuma terhadap kolam token harian anda (100 tokens per panggilan). Dikeluarkan di bawah Apache 2.0 — penggunaan komersial dibenarkan pada Free.ai.

Guna melalui API

API REST serasi OpenAI. Janakan kekunci dan panggil model ini dalam beberapa saat.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
Dokumentasi API Dapatkan Kekunci API

Soalan Lazim

mxbai-embed-large-v1 menukar teks ke vektor padat (senarai apung) yang menangkap makna. Gunakannya untuk carian semantik, pengumpulan, cadangan, penjanaan penambah-pendapatan (RAG), dan sebarang tugas di mana "adakah teks ini serupa dengan teks itu" penting.

Dimensi tipikal ialah 384, 768, 1024, atau 1536 bergantung pada model. BGE-M3 mengeluarkan 1024-dim; OpenAI Ada mengeluarkan 1536. Jawapan API termasuk dimensi supaya DB vektor anda memilih indeks yang betul.

Model penempatan moden (termasuk kebanyakan pilihan pada Free.ai) dilatih pada 100+ bahasa. Pencarian lintas-bahasa berfungsi — carian dalam bahasa Inggeris, dokumen sepadan dalam bahasa Sepanyol.

512 hingga 8,192 token bergantung pada model. Input yang lebih panjang dipotong — pecahkan dokumen panjang ke dalam perenggan sebelum membenam.

mxbai-embed-large-v1 berjalan pada GPU kami sendiri dan merupakan antara alat termurah — sekitar ~100 token per panggilan ditarik dari kolam percuma harian anda. $5 = 200K token.

Ya — POST senarai rentetan ke /v1/embeddings/ dan mxbai-embed-large-v1 mengembalikan senarai vektor dalam urutan yang sama. Saiz kumpulan sehingga 2,048 per permintaan.

L2-normalkan secara default — kesamarataan kosinus = hasil titik. Serahkan `normalize=false` jika anda mahukan vektor mentah untuk metrik jarak yang berbeza.

Mana-mana — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 mengembalikan apung JSON biasa; DB tidak pernah melihat model.

Ya — POST ke /v1/embeddings/ dengan model="mxbai-embed-large-v1". Bentuk respon serasi OpenAI, jadi pustaka klien sedia ada berfungsi tanpa diubah. /api/ mempunyai rujukan penuh.

Model sendiri-hosting menyimpan teks anda pada GPU kami dan membuangnya selepas panggilan kembali. Premium lalu melalui dengan DPA. Kami tidak melatih pada input anda.

Sub-100ms untuk teks pendek pada self-hosted, 100–500ms pada premium. Panggilan berbilang skala secara linear — 1,000 keping selesai dalam 2–10 saat.

Ya — Free.ai memberi kebenaran penggunaan komersial bagi penambah. Bina carian pengeluaran, paip RAG, sistem cadangan tanpa royalti per-vektor.

Love this tool? Share it!

Nilaikan halaman ini