Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 Torneiras por call
~100 Torneiras por call

_ Mais forte em Retrieval augmented generation with flexible vector sizes.. Self-hosted on Free.ai GPUs — corre livre contra a sua piscina cotidiana de tokens (100 tokens por chamada). Libertado em Apache 2.0 — utilização comercial permitida em Free.ai.

Utilizar através da API

API REST compatível com o OpenAI. Gere uma chave e chame este modelo em segundos.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'
Documentação da API Obter a chave da API

Perguntas Frequentes

Nomic Embed v2 converte o texto em um vetor denso (uma lista de flutuantes) que capta o significado. Use-o para pesquisa semântica, agrupamento, recomendação, geração de recuperação-atenuada (RAG), e qualquer tarefa em que "é este texto semelhante a esse texto" importa.

As dimensões típicas são 384, 768, 1024 ou 1536, dependendo do modelo. BGE-M3 emite 1024-dim; OpenAI Ada emite 1536. A resposta API inclui a dimensão para que seu vetor DB escolhe o índice certo.

Modelos de incorporação modernos (incluindo a maioria das opções em Free.ai) são treinados em mais de 100 idiomas. Trabalhos de recuperação de idiomas cruzados — pesquisa em inglês, documentos de correspondência em espanhol.

512 a 8.192 fichas dependendo do modelo. Inputs mais longos são truncados — pedaços de documentos longos em parágrafos antes de incrustar.

Nomic Embed v2 funciona em nosso próprio GPU e está entre as ferramentas mais baratas — cerca de ~100 fichas por chamada extraídas da sua piscina gratuita diária. $5 = fichas de 200K.

Sim — POST uma lista de cordas para /v1/einclusões/ e Nomic Embed v2 devolve uma lista de vetores na mesma ordem. Tamanho de lote até 2.048 por pedido.

L2-normalizado por padrão — semelhança de cosseno = produto dot. Passe `normalize=false' se você quer vetores crus para uma métrica de distância diferente.

Qualquer — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. Nomic Embed v2 retorna floats simples JSON; o DB nunca vê o modelo.

Sim — POST to /v1/einclusões/ com modelo="Nomic Embed v2". Forma de resposta compatível com o OpenAI, por isso as bibliotecas de clientes existentes funcionam inalteradas. /api/ tem a referência completa.

Os modelos auto-hostados mantêm o seu texto em nossas GPUs e descartam-no após os retornos de chamada. Premium passa com um DPA. Nós não treinamos em suas entradas.

Sub-100ms para texto curto em auto-hosted, 100-500ms em premium. Escala de chamadas de lote aproximadamente linearmente — 1.000 pedaços completos em 2-10 segundos.

Sim — Free.ai concede o uso comercial de encaixes. Construir a busca de produção, oleodutos RAG, sistemas de recomendação sem royalty por vector.

Love this tool? Share it!

Avaliar esta página