Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 token/s call
~100 token/s call

Nomic Embed v2 an embedding model da, {provider__k} eraikia. (Gaztelaniaz) "La mejor"-en webgunea. Free.ai GPUtan auto-ostatua — zure eguneroko token pool-aren aurka doan exekutatzen da (100 tokens dei bakoitzeko). Apache 2.0 lizentziapean argitaratua — erabilera komertziala baimenduta Free.ai-n.

Erabili API bidez

OpenAI-rekin bateragarria den REST APIa. Sortu gako bat eta deitu eredu honi segundo gutxitan.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'
API dokumentazioa Eskuratu API gakoa

Maiz egiten diren galderak

Nomic Embed v2(e)k testua bektore dentso batean bihurtzen du (higikorrak dituen zerrenda bat), esanahia jasotzen duena. Erabili bilaketa semantikoetarako, klusterizaziorako, gomendioetarako, berreskuratze-gehitutako sorkuntzarako (RAG) eta "testu hau testu horren antzekoa da" kontuan hartzen duen edozein zereginetarako.

Dimentsio tipikoak 384, 768, 1024 edo 1536 dira, modeloaren arabera. BGE-M3k 1024-dim igortzen du; OpenAI Adak 1536 igortzen du. API erantzunak dimentsioa barne hartzen du, zure bektore DBak zuzena den indizea hautatzeko.

Kapsulatutako eredu modernoak (Free.ai-en aukera gehienak barne) 100 hizkuntza baino gehiagotan trebatuta daude. Hizkuntza-arteko berreskurapena funtzionatzen du — bilatu ingelesez, parekatu dokumentuak gaztelaniaz.

512 eta 8.192 token artean, modeloaren arabera. Sarrera luzeagoak trunkatuak izango dira — dokumentu luzeak paragrafoetan zatituko dira kapsulatu aurretik.

Nomic Embed v2 gure GPUetan exekutatzen da eta tresna merkeenetako bat da — zure eguneroko biltegi libretik ateratako ~100 token dei bakoitzeko. $5 = 200K token.

Bai — POST kate-zerrenda bat /v1/embeddings/-era eta Nomic Embed v2-ek ordena berean dauden bektore-zerrenda bat itzultzen du. Batch-en tamaina 2.048 izan daiteke eskaera bakoitzeko.

L2 normalizatua lehenespenez — kosinua antzekotasuna = puntuaren produktua. Pasatu `normalize=false` bektore gordina distantzia metriko desberdinetarako nahi baduzu.

Edozein — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. Nomic Embed v2 JSON zenbaki mugikor arruntak itzultzen ditu; DB-k ez du inoiz eredua ikusten.

Bai — POST /v1/embeddings/-ra model="Nomic Embed v2" erabiliz. OpenAI-rekin bateragarria den erantzun forma, beraz, existitzen diren bezero-liburutegiak aldatu gabe funtzionatzen dute. /api/-k erreferentzia osoa du.

Auto-ostatutako modeloek zure testua gure GPUetan gordetzen dute eta baztertzen dute deiak itzultzen direnean. Premium-ek DPA-rekin pasatzen du. Ez dugu zure sarrerak entrenatzen.

100 ms baino gutxiago testu laburretarako, autoostatuta, 100-500 ms premium-en. Batch deiak gutxi gorabehera linealki eskalatzen dira — 1.000 zati 2-10 segundotan osatzen dira.

Bai — Free.ai-k kapsulazioen erabilera komertziala onartzen du. Eraiki bilaketa produkzioa, RAG hodiak, gomendio sistemak bektore bakoitzeko errentarik gabe.

Free.ai maite duzu?

Balioetsi orrialde hau