mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 tokens per call
~100 tokens per call

mxbai-embed-large-v1 iku an embedding model kang dibangun déning mixedbread.ai. Dhèwèké dadi anggota grup band Free_Freaks. Free.ai GPUs — dioperasikeun gratis ngalawan pool token anjeun saben dinten (100 tokens per call). Released under Apache 2.0 — commercial use permitted on Free.ai.

Nggunakake liwat API

REST API kompatibel OpenAI. Nyiptakeun kunci sarta ngajual model ieu dina detik.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
Dokumen Muat Turun Kunci API

Takon-takon sing asring diajukake

mxbai-embed-large-v1 ngarobah teks jadi vektor padat (daptar angka apung) anu ngawengku harti. Gunakeun pikeun milarian semantik, clustering, rekomendasi, retrieval-augmented generation (RAG), jeung sagala tugas dimana "nya éta teks ieu mirip jeung teks éta" penting.

Dimensi anu umum nyaéta 384, 768, 1024, atawa 1536 gumantung kana model. BGE-M3 ngahasilkeun 1024-dim; OpenAI Ada ngahasilkeun 1536. Balapan API ngawengku dimensi supados vektor DB anjeun milih indeks anu leres.

Model embedding modern (kaasup pilihan paling loba dina Free.ai) dilatih dina 100+ basa. Cross-basa karya retrieval — milarian dina basa Inggris, dokumen match dina basa Spanyol.

512 nepi ka 8,192 token gumantung kana model. Input anu leuwih panjang dipotong — chunk dokumen panjang kana paragraf saméméh ngalebetkeun.

mxbai-embed-large-v1 dijalankeun dina GPU urang sorangan sarta salah sahiji alat anu paling murah — sakitar ~100 token per panggilan ditarik tina kolam renang gratis anjeun unggal dinten. $5 = 200K token.

Ya — POST daftar string ka /v1/embeddings/ sarta mxbai-embed-large-v1 balikkeun daftar vektor dina urutan anu sami. Ukuran batch nepi ka 2,048 per panyungsi.

L2-normalisasi ku pigura — kasaimbangan kosinus = produk titik. Laksanakeun `normalize=false` lamun hoyong vektor raw pikeun metrik jarak anu béda.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 returns plain JSON floats; the DB never sees the model.

Yes — POST to /v1/embeddings/ with model="mxbai-embed-large-v1". OpenAI-compatible response shape, so existing client libraries work unchanged. /api/ has the full reference.

Model self-hosted nyimpen teks anjeun dina GPU urang sarta ngaleupaskeun éta saatos pamundut balik. Premium ngaliwatan DPA. Kami henteu latihan dina input anjeun.

Sub-100ms pikeun teks pondok dina self-hosted, 100-500ms on premium. Panggero batch skala kira-kira linearly - 1,000 chunks réngsé dina 2-10 detik.

Ya — Free.ai ngawenangkeun panggunaan komersial tina ngambekan. Nyiptakeun panyelehan produksi, pipa RAG, sistem rekomendasi tanpa royalti per-vektor.

Love Free.ai? Nyathet kanca-kancamu!

Nilai kaca iki