Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 token per call
~100 token per call

Nomic Embed v2 è a Modello di inserimento built by Nomic AI. Il piu' forte degli Retrieval augmented generation with flexible vector sizes.. Self-hosted on Free.ai GPU Il token è libero contro il tuo token pool giornaliero (100 tokens per chiamata). Rilasciata sotto licenza Apache 2.0 per uso commerciale consentito su Free.ai.

Utilizzare tramite API

API OpenAI-compatibile REST. Generare una chiave e chiamare questo modello in pochi secondi.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'
Documentazione API Ottieni la chiave API

Domande frequenti

Nomic Embed v2 converte il testo in un vettore denso (un elenco di galleggianti) che cattura il significato. Usalo per la ricerca semantica, il cluster, la raccomandazione, la generazione aumentata di recupero (RAG), e qualsiasi attività in cui "questo testo è simile a quel testo" conta.

Le dimensioni tipiche sono 384, 768, 1024, o 1536 a seconda del modello. BGE-M3 emette 1024-dim; OpenAI Ada emette 1536. La risposta API include la dimensione in modo che il vettore DB scelga l'indice giusto.

Moderni modelli di integrazione (inclusa la maggior parte delle opzioni su Free.ai) sono addestrati su oltre 100 lingue. Lavori di recupero di lingua trasversale ricerca molto in inglese, documenti di corrispondenza in spagnolo.

512 a 8.192 gettoni a seconda del modello. Ingressi più lunghi sono troncati documenti lunghi pezzi in paragrafi prima di incorporare.

Nomic Embed v2 viene eseguito sulla nostra GPU ed è tra gli strumenti più economici Nomic Embed v2 circa ~100 gettoni per chiamata estratti dal vostro piscina gratuita quotidiana. $5 = 200K gettoni.

Sì POST un elenco di stringhe a /v1/embeddings/ e Nomic Embed v2 restituisce un elenco di vettori nello stesso ordine. Dimensione del lotto fino a 2.048 per richiesta.

L2-normalizzato per default dalla somiglianza del coseno di un punto = prodotto. Passo da normalizzare=falsamente se si vogliono vettori grezzi per una metrica di distanza diversa.

Qualsiasi Pinecone, Weaviate, Qdrant, Chroma, pgvector, FASS, LanceDB. Nomic Embed v2 restituisce semplici carri JSON; il DB non vede mai il modello.

Sì POST a /v1/embeddings/ con model="Nomic Embed v2." Forma di risposta compatibile con OpenAI, quindi le librerie client esistenti funzionano inalterate. /api/ ha il riferimento completo.

I modelli auto-ospitati mantengono il testo sulle nostre GPU e lo scartano dopo il ritorno della chiamata. Passaggio Premium con un DPA. Non ci alleniamo sui vostri input.

Sotto-100ms per il testo corto su auto-hosted, 100 mrad 500ms sul premio. Le chiamate in batch scalano approssimativamente lineare 1.000 pezzi completi in 2 mrad10 secondi.

Si Free.ai concede l'uso commerciale di imbeddings. Ricerca di produzione di costruire, pipeline RAG, sistemi di raccomandazione senza royalty per-vettore.

Love this tool? Share it!

Valuta questa pagina