mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 tokens per call

mxbai-embed-large-v1 es a modelo de incrustación construido por mixedbread.ai. Más fuerte en Semantic search, clustering, similarity.. Auto-alojado en Free.ai GPUs — funciona gratis contra su piscina diaria de tokens (100 tokens por llamada). Liberado bajo Apache 2.0 — uso comercial permitido el Free.ai.

Uso a través de API

API REST compatible con OpenAI. Genera una clave y llama a este modelo en segundos.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'

Documentación API Obtener clave de API

Preguntas frecuentes

mxbai-embed-large-v1 convierte el texto en un vector denso (una lista de flotadores) que captura el significado. Úselo para búsqueda semántica, agrupamiento, recomendación, generación aumentada de recuperación (RAG), y cualquier tarea en la que "es este texto similar a ese texto" importa.

Las dimensiones típicas son 384, 768, 1024, o 1536 dependiendo del modelo. BGE-M3 emite 1024-dim; OpenAI Ada emite 1536. La respuesta API incluye la dimensión para que su vector DB elija el índice correcto.

Los modelos modernos de incrustación (incluyendo la mayoría de las opciones en Free.ai) están entrenados en más de 100 idiomas.

512 tokens a 8.192 dependiendo del modelo. Las entradas más largas son truncadas — trocear documentos largos en párrafos antes de incrustarlos.

mxbai-embed-large-v1 se ejecuta en nuestras propias GPUs y se encuentra entre las herramientas más baratas — cerca de ~100 tokens por llamada extraídos de su grupo diario gratuito. $5 = 200K tokens.

Sí — Enviar una lista de cadenas a /v1/embeddings/ y mxbai-embed-large-v1 devuelve una lista de vectores en el mismo orden. Tamaño del lote hasta 2,048 por solicitud.

L2-normalizado por defecto — coseno similar = producto punto. Pase `normalizar=falso` si desea vectores en bruto para una métrica de distancia diferente.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 devuelve flotadores JSON planos; el DB nunca ve el modelo.

Sí — POST to /v1/embeddings/ with model="mxbai-embed-large-v1". Forma de respuesta compatible con OpenAI, por lo que las bibliotecas cliente existentes funcionan sin cambios. /api/ tiene la referencia completa.

Los modelos auto-anfitriones guardan su texto en nuestras GPUs y lo descartan después de que la llamada regrese. Pase Premium con un DPA. No entrenamos en sus entradas.

Sub-100ms para texto corto en auto-anfitrión, 100–500ms en prima. Escala de llamadas por lotes aproximadamente linealmente — 1.000 pedazos completos en 2–10 segundos.

Sí — Free.ai concede uso comercial de incrustaciones. Construir búsqueda de producción, tuberías RAG, sistemas de recomendación sin regalías per-vector.

mxbai-embed-large-v1

Uso a través de API

Preguntas frecuentes

¿Qué hace mxbai-embed-large-v1?

¿Qué dimensión son mxbai-embed-large-v1 embeddings?

¿Es mxbai-embed-large-v1 multilingüe?

¿Cuál es la longitud máxima de entrada para mxbai-embed-large-v1?

¿Cuánto cuesta mxbai-embed-large-v1?

¿Puedo incrustar por lotes con mxbai-embed-large-v1?

¿ normaliza mxbai-embed-large-v1 los vectores?

¿Qué vectores DBs funcionan con mxbai-embed-large-v1?

¿Hay una API para mxbai-embed-large-v1?

¿Qué hay de la privacidad cuando incrusto texto sensible con mxbai-embed-large-v1?

¿Cuánto tiempo toma mxbai-embed-large-v1 por llamada?

¿Puedo utilizar la salida mxbai-embed-large-v1 comercialmente?

Obtener 10.000 tokens gratis

Espere... ¡Obtenga 10 mil tokens gratis!

¿Quieres más?