Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 tokens për call
~100 tokens për call

Nomic Embed v2 është an embedding model i ndërtuar nga Nomic AI. Më i forti në Retrieval augmented generation with flexible vector sizes.. Vetë-pritur në Free.ai GPUs — funksionon pa pagesë kundër pool-it të token-it të përditshëm (100 tokens për thirrje). Licensuar nën Apache 2.0 — përdorimi komercial i lejuar në Free.ai.

Përdorimi nëpërmjet API

API REST e përshtatshme me OpenAI. Gjenerati një kyç dhe thirreni këtë model në sekonda.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'
Dokumentimi i API Merr kyçin e API

Pyetje të shpeshta

Nomic Embed v2 konverton tekstin në një vektor të dendur (një listë me vlera të lëvizshme) që kap kuptimin. Përdoret për kërkim semantik, grupim, rekomandim, gjenerimin e zgjeruar të marrjes (RAG) dhe çdo detyrë ku "është ky tekst i ngjashëm me atë tekst" ka rëndësi.

Dimensionet tipik janë 384, 768, 1024 ose 1536 në varësi të modelit. BGE-M3 jep 1024-dim; OpenAI Ada jep 1536. Përgjigja e API përfshin dimensionin kështu që vektor DB zgjedh indeksin e duhur.

Modelet e ndërtimit modern (duke përfshirë shumicën e opsioneve në Free.ai) janë trajnuar në më shumë se 100 gjuhë. Kërkimi ndërgjuhësor punon — kërko në anglisht, përputhu me dokumentet në spanjisht.

512 deri 8,192 tokens në varësi të modelit. Inputët më të gjatë shkurtohen — fragmenti i gjatë i dokumentit në paragrafë para se të përfshihet.

Nomic Embed v2 punon në GPU-të tona dhe është ndër instrumentet më të lira — rreth ~100 token për thirrje të tërhequr nga pool-i juaj i përditshëm i lirë. $5 = 200K token.

Po — POST një listë stringash në /v1/embeddings/ dhe Nomic Embed v2 kthen një listë vektorësh në të njëjtin renditje. Madhësia e lotit deri në 2,048 për kërkesë.

L2-normalizuar nga paracaktimi — ngjashmëria kosinus = prodhimi i pikës. Përdor `normalize=false` nëse dëshiron vektorë të papërpunuar për një metrikë distancë të ndryshme.

Çdo — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. Nomic Embed v2 kthen vlera të thjeshta JSON; DB nuk e sheh kurrë modelin.

Po — POST në /v1/embeddings/ me model="Nomic Embed v2". Përgjigja e përshtatshme me OpenAI, kështu që libraritë ekzistuese të klientëve punojnë pa ndryshim. /api/ ka referencën e plotë.

Modelet e vetë-hostuara e mbajnë tekstin tuaj në GPU-në tonë dhe e heqin atë pasi të kthehet thirrje. Premiumi kalon nëpërmjet një DPA. Ne nuk stërvitemi me input-in tuaj.

Sub-100ms për tekst të shkurtër në vetë-host, 100-500ms në premium. Thirrjet e grupit shkallëzohen pothuajse linearisht — 1,000 copëza kompletohen në 2-10 sekonda.

Po, Free.ai lejon përdorimin komercial të ndërtimit të kërkimit të prodhimit, RAG-it, sistemeve të rekomandimit pa pagesë për vektor.

Të pëlqen Free.ai?

Vlerësoni këtë faqe