mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 tokens per call
~100 tokens per call

mxbai-embed-large-v1 iku an embedding model dibangun déning mixedbread.ai. Dhèwèké uga dadi anggota grup band Free_Freaks. Self-hosted on Free.ai GPUs — runs free against your daily token pool (100 tokens saben panjaluk). Released under Apache 2.0 — commercial use permitted on Free.ai.

Nggunakake liwat API

REST API kang kompatibel karo OpenAI. Janji kunci lan waca modél iki ing detik.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
Dokumen Njupuk Kunci API

Pitakon kang asring diajukake

mxbai-embed-large-v1 ngowahi teks dadi vektor kang padat (utawa dhaptar angka apung) kang bisa nyekel makna. Gunakaké kanggo panelitian semantik, clustering, rekomendasi, retrieval-augmented generation (RAG), lan tugas apa wae kang "apa teks iki padha karo teks iku" penting.

Dimènsi ingkang umum inggih punika 384, 768, 1024, utawi 1536 gumantung saking modélipun. BGE-M3 ngetokaken 1024-dim; OpenAI Ada ngetokaken 1536.

Model embedding modern (kajaba pilihan paling ing Free.ai) dilatih ing 100+ basa. Cross-basa retrieval karya - goleki ing basa Inggris, match dokumen ing basa Spanyol.

512 nganti 8,192 token gumantung marang modél. Input kang luwih dawa bakal dipotong — chunk dokumèn dawa dadi paragraf sadurunge dilebokake.

Ing taun 2009, 100% saka total produksi ing donya diprodhuksi déning pabrikan iki, lan rata-rata produksi saben taun ya iku 100.000 ton.

Ya — POST dhaptar strings menyang /v1/embeddings/ lan mxbai-embed-large-v1 mbalekaké dhaptar vektor ing urutan kang padha. Ukuran batch nganti 2,048 saben panjaluk.

L2-normalisasi déning pigura pigura - cosinus serupa = produk titik. Pasah `normalize=false` yèn sampeyan pengin vektor mentah kanggo metrik jarak sing beda.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 returns plain JSON floats; the DB never sees the model.

Tembung "A" iku tembung kang asalé saka basa Latin, lan tegesé "a" iku tegesé "a" lan "B" iku tegesé "B" lan "A" iku tegesé "A".

Model self-hosted nyimpen teks ing GPU kita lan mbusak sawise panjaluk bali. Premium liwat karo DPA. Kita ora latihan ing input sampeyan.

Ing taun 1990, 1000

Ya — Free.ai nyedhiyani panggunaan komersial ing inggraping. Ngwangun panjaluk produksi, pipa RAG, sistem rekomendasi tanpa royalti per-vektor.

Free.ai? Nyathet kanca-kancamu!

Rangking kaca iki