Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 tokenuri per call
~100 tokenuri per call

_ Cel mai puternic la Retrieval augmented generation with flexible vector sizes.. Self-hosted pe Free.ai GPUs — rula gratuit împotriva poolului de token zilnic (100 tokens pe apel). Eliberat în Apache 2.0 — utilizare comercială permisă la Free.ai.

Utilizare prin API

API REST compatible cu OpenAI. Generați o cheie și sunați acest model în secunde.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'
Documentare API Obține cheie API

Întrebări frecvente

Nomic Embed v2 convertește textul într-un vector dens (o listă de plutitori) care captă sensul. Utilizați-l pentru căutare semantică, clustering, recomandare, generație de recuperare-augmentată (RAG), și orice sarcină în care "este acest text similar cu acest text" contează.

Dimensiunile tipice sunt 384, 768, 1024 sau 1536 în funcție de model. BGE-M3 emite 1024-dim; OpenAI Ada emite 1536. Răspunsul API include dimensiunea astfel încât vectorul DB alege indexul corect.

Modelele moderne de încorporare (inclusiv cele mai multe opțiuni pe Free.ai) sunt instruite pe 100 de limbi. Lucrări de recuperare în limba cross-language — căutare în limba engleză, documente de corespondență în spaniolă.

512 până la 8.192 monede în funcţie de model. Introducerile mai lungi sunt truncate — bucaţi documente lungi în paragrafe înainte de a încorpora.

Nomic Embed v2 rulează pe propriile noastre GPU și este printre instrumentele cele mai ieftine — aproximativ ~100 de jeturi pe telefon extrase din piscina dvs. gratuită zilnic. $5 = 200K jeturi.

Da — POST o listă de stringuri la /v1/einclusiv/ și Nomic Embed v2 returnează o listă de vectori în același ordin. Dimensiunea seriei până la 2.048 pe cerere.

L2-normalizat prin predefinire — similaritate cosineu = produs dot. Pass `normalize=false' dacă doriți vectorii crud pentru o metrică de distanță diferită.

Orice — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. Nomic Embed v2 returnează floaturile simple JSON; DB nu vede niciodată modelul.

Da — POST la /v1/einclude/ cu model="Nomic Embed v2". Forma de răspuns compatibile cu OpenAI, astfel încât bibliotecile client existente funcționează nemodificat. /api/ are referință completă.

Modelele auto-gazdă păstrează textul pe GPU-urile noastre și aruncă-l după returnările de apel. Premium trece prin cu un DPA. Noi nu antrenăm pe intrarea dumneavoastră.

Sub-100ms pentru text scurt pe auto-găzduit, 100–500ms pe premium. Scala de serie apeluri aproximativ linear - 1000 bucați complet în 2–10 secunde.

Da — Free.ai acordă utilizarea comercială a încorporărilor. Căutare de producție, conducte RAG, sisteme de recomandare fără redevență per-vector.

Love this tool? Share it!

Ratați această pagină