mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 token/s call
~100 token/s call

mxbai-embed-large-v1 an embedding model da, {provider__k} eraikia. (Gaztelaniaz) "La mejor"-en webgunea. Free.ai GPUtan auto-ostatua — zure eguneroko token pool-aren aurka doan exekutatzen da (100 tokens dei bakoitzeko). Apache 2.0 lizentziapean argitaratua — erabilera komertziala baimenduta Free.ai-n.

Erabili API bidez

OpenAI-rekin bateragarria den REST APIa. Sortu gako bat eta deitu eredu honi segundo gutxitan.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
API dokumentazioa Eskuratu API gakoa

Maiz egiten diren galderak

mxbai-embed-large-v1(e)k testua bektore dentso batean bihurtzen du (higikorrak dituen zerrenda bat), esanahia jasotzen duena. Erabili bilaketa semantikoetarako, klusterizaziorako, gomendioetarako, berreskuratze-gehitutako sorkuntzarako (RAG) eta "testu hau testu horren antzekoa da" kontuan hartzen duen edozein zereginetarako.

Dimentsio tipikoak 384, 768, 1024 edo 1536 dira, modeloaren arabera. BGE-M3k 1024-dim igortzen du; OpenAI Adak 1536 igortzen du. API erantzunak dimentsioa barne hartzen du, zure bektore DBak zuzena den indizea hautatzeko.

Kapsulatutako eredu modernoak (Free.ai-en aukera gehienak barne) 100 hizkuntza baino gehiagotan trebatuta daude. Hizkuntza-arteko berreskurapena funtzionatzen du — bilatu ingelesez, parekatu dokumentuak gaztelaniaz.

512 eta 8.192 token artean, modeloaren arabera. Sarrera luzeagoak trunkatuak izango dira — dokumentu luzeak paragrafoetan zatituko dira kapsulatu aurretik.

mxbai-embed-large-v1 gure GPUetan exekutatzen da eta tresna merkeenetako bat da — zure eguneroko biltegi libretik ateratako ~100 token dei bakoitzeko. $5 = 200K token.

Bai — POST kate-zerrenda bat /v1/embeddings/-era eta mxbai-embed-large-v1-ek ordena berean dauden bektore-zerrenda bat itzultzen du. Batch-en tamaina 2.048 izan daiteke eskaera bakoitzeko.

L2 normalizatua lehenespenez — kosinua antzekotasuna = puntuaren produktua. Pasatu `normalize=false` bektore gordina distantzia metriko desberdinetarako nahi baduzu.

Edozein — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 JSON zenbaki mugikor arruntak itzultzen ditu; DB-k ez du inoiz eredua ikusten.

Bai — POST /v1/embeddings/-ra model="mxbai-embed-large-v1" erabiliz. OpenAI-rekin bateragarria den erantzun forma, beraz, existitzen diren bezero-liburutegiak aldatu gabe funtzionatzen dute. /api/-k erreferentzia osoa du.

Auto-ostatutako modeloek zure testua gure GPUetan gordetzen dute eta baztertzen dute deiak itzultzen direnean. Premium-ek DPA-rekin pasatzen du. Ez dugu zure sarrerak entrenatzen.

100 ms baino gutxiago testu laburretarako, autoostatuta, 100-500 ms premium-en. Batch deiak gutxi gorabehera linealki eskalatzen dira — 1.000 zati 2-10 segundotan osatzen dira.

Bai — Free.ai-k kapsulazioen erabilera komertziala onartzen du. Eraiki bilaketa produkzioa, RAG hodiak, gomendio sistemak bektore bakoitzeko errentarik gabe.

Free.ai maite duzu?

Balioetsi orrialde hau