mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 token/s call

mxbai-embed-large-v1 an embedding model da, {provider__k} eraikia. (Gaztelaniaz) "La mejor"-en webgunea. Free.ai GPUtan auto-ostatua — zure eguneroko token pool-aren aurka doan exekutatzen da (100 tokens dei bakoitzeko). Apache 2.0 lizentziapean argitaratua — erabilera komertziala baimenduta Free.ai-n.

Erabili API bidez

OpenAI-rekin bateragarria den REST APIa. Sortu gako bat eta deitu eredu honi segundo gutxitan.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'

API dokumentazioa Eskuratu API gakoa

Maiz egiten diren galderak

mxbai-embed-large-v1(e)k testua bektore dentso batean bihurtzen du (higikorrak dituen zerrenda bat), esanahia jasotzen duena. Erabili bilaketa semantikoetarako, klusterizaziorako, gomendioetarako, berreskuratze-gehitutako sorkuntzarako (RAG) eta "testu hau testu horren antzekoa da" kontuan hartzen duen edozein zereginetarako.

Dimentsio tipikoak 384, 768, 1024 edo 1536 dira, modeloaren arabera. BGE-M3k 1024-dim igortzen du; OpenAI Adak 1536 igortzen du. API erantzunak dimentsioa barne hartzen du, zure bektore DBak zuzena den indizea hautatzeko.

Kapsulatutako eredu modernoak (Free.ai-en aukera gehienak barne) 100 hizkuntza baino gehiagotan trebatuta daude. Hizkuntza-arteko berreskurapena funtzionatzen du — bilatu ingelesez, parekatu dokumentuak gaztelaniaz.

512 eta 8.192 token artean, modeloaren arabera. Sarrera luzeagoak trunkatuak izango dira — dokumentu luzeak paragrafoetan zatituko dira kapsulatu aurretik.

mxbai-embed-large-v1 gure GPUetan exekutatzen da eta tresna merkeenetako bat da — zure eguneroko biltegi libretik ateratako ~100 token dei bakoitzeko. $5 = 200K token.

Bai — POST kate-zerrenda bat /v1/embeddings/-era eta mxbai-embed-large-v1-ek ordena berean dauden bektore-zerrenda bat itzultzen du. Batch-en tamaina 2.048 izan daiteke eskaera bakoitzeko.

L2 normalizatua lehenespenez — kosinua antzekotasuna = puntuaren produktua. Pasatu `normalize=false` bektore gordina distantzia metriko desberdinetarako nahi baduzu.

Edozein — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 JSON zenbaki mugikor arruntak itzultzen ditu; DB-k ez du inoiz eredua ikusten.

Bai — POST /v1/embeddings/-ra model="mxbai-embed-large-v1" erabiliz. OpenAI-rekin bateragarria den erantzun forma, beraz, existitzen diren bezero-liburutegiak aldatu gabe funtzionatzen dute. /api/-k erreferentzia osoa du.

Auto-ostatutako modeloek zure testua gure GPUetan gordetzen dute eta baztertzen dute deiak itzultzen direnean. Premium-ek DPA-rekin pasatzen du. Ez dugu zure sarrerak entrenatzen.

100 ms baino gutxiago testu laburretarako, autoostatuta, 100-500 ms premium-en. Batch deiak gutxi gorabehera linealki eskalatzen dira — 1.000 zati 2-10 segundotan osatzen dira.

Bai — Free.ai-k kapsulazioen erabilera komertziala onartzen du. Eraiki bilaketa produkzioa, RAG hodiak, gomendio sistemak bektore bakoitzeko errentarik gabe.

mxbai-embed-large-v1

Erabili API bidez

Maiz egiten diren galderak

What does mxbai-embed-large-v1 do?

Zein dimentsio dute mxbai-embed-large-v1 kapsulatzeek?

mxbai-embed-large-v1 hizkuntza anitzekoa da?

Zein da mxbai-embed-large-v1-ren sarrerako gehienezko luzera?

How much does mxbai-embed-large-v1 cost?

Batch-ean txerta dezaket mxbai-embed-large-v1-rekin?

Does mxbai-embed-large-v1 normalize the vectors?

Which vector DBs work with mxbai-embed-large-v1?

Ba al dago mxbai-embed-large-v1-ren API bat?

What about privacy when I embed sensitive text with mxbai-embed-large-v1?

How long does mxbai-embed-large-v1 take per call?

Erabili al dezaket mxbai-embed-large-v1 irteera merkataritzarako?

Lortu 10.000 doako token

Itxaron — 10.000 doako token eskuratu!

Gehiago nahi duzu?