Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 tokens per call

Nomic Embed v2 es a modelo de incrustación construido por Nomic AI. Más fuerte en Retrieval augmented generation with flexible vector sizes.. Auto-alojado en Free.ai GPUs — funciona gratis contra su piscina diaria de tokens (100 tokens por llamada). Liberado bajo Apache 2.0 — uso comercial permitido el Free.ai.

Uso a través de API

API REST compatible con OpenAI. Genera una clave y llama a este modelo en segundos.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'

Documentación API Obtener clave de API

Preguntas frecuentes

Nomic Embed v2 convierte el texto en un vector denso (una lista de flotadores) que captura el significado. Úselo para búsqueda semántica, agrupamiento, recomendación, generación aumentada de recuperación (RAG), y cualquier tarea en la que "es este texto similar a ese texto" importa.

Las dimensiones típicas son 384, 768, 1024, o 1536 dependiendo del modelo. BGE-M3 emite 1024-dim; OpenAI Ada emite 1536. La respuesta API incluye la dimensión para que su vector DB elija el índice correcto.

Los modelos modernos de incrustación (incluyendo la mayoría de las opciones en Free.ai) están entrenados en más de 100 idiomas.

512 tokens a 8.192 dependiendo del modelo. Las entradas más largas son truncadas — trocear documentos largos en párrafos antes de incrustarlos.

Nomic Embed v2 se ejecuta en nuestras propias GPUs y se encuentra entre las herramientas más baratas — cerca de ~100 tokens por llamada extraídos de su grupo diario gratuito. $5 = 200K tokens.

Sí — Enviar una lista de cadenas a /v1/embeddings/ y Nomic Embed v2 devuelve una lista de vectores en el mismo orden. Tamaño del lote hasta 2,048 por solicitud.

L2-normalizado por defecto — coseno similar = producto punto. Pase `normalizar=falso` si desea vectores en bruto para una métrica de distancia diferente.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. Nomic Embed v2 devuelve flotadores JSON planos; el DB nunca ve el modelo.

Sí — POST to /v1/embeddings/ with model="Nomic Embed v2". Forma de respuesta compatible con OpenAI, por lo que las bibliotecas cliente existentes funcionan sin cambios. /api/ tiene la referencia completa.

Los modelos auto-anfitriones guardan su texto en nuestras GPUs y lo descartan después de que la llamada regrese. Pase Premium con un DPA. No entrenamos en sus entradas.

Sub-100ms para texto corto en auto-anfitrión, 100–500ms en prima. Escala de llamadas por lotes aproximadamente linealmente — 1.000 pedazos completos en 2–10 segundos.

Sí — Free.ai concede uso comercial de incrustaciones. Construir búsqueda de producción, tuberías RAG, sistemas de recomendación sin regalías per-vector.

Nomic Embed v2

Uso a través de API

Preguntas frecuentes

¿Qué hace Nomic Embed v2?

¿Qué dimensión son Nomic Embed v2 embeddings?

¿Es Nomic Embed v2 multilingüe?

¿Cuál es la longitud máxima de entrada para Nomic Embed v2?

¿Cuánto cuesta Nomic Embed v2?

¿Puedo incrustar por lotes con Nomic Embed v2?

¿ normaliza Nomic Embed v2 los vectores?

¿Qué vectores DBs funcionan con Nomic Embed v2?

¿Hay una API para Nomic Embed v2?

¿Qué hay de la privacidad cuando incrusto texto sensible con Nomic Embed v2?

¿Cuánto tiempo toma Nomic Embed v2 por llamada?

¿Puedo utilizar la salida Nomic Embed v2 comercialmente?

Obtener 10.000 tokens gratis

Espere... ¡Obtenga 10 mil tokens gratis!

¿Quieres más?