mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 tokens per call
~100 tokens per call

mxbai-embed-large-v1 es a modelo de incrustación construido por mixedbread.ai. Más fuerte en Semantic search, clustering, similarity.. Auto-alojado en Free.ai GPUs — funciona gratis contra su piscina diaria de tokens (100 tokens por llamada). Liberado bajo Apache 2.0 — uso comercial permitido el Free.ai.

Uso a través de API

API REST compatible con OpenAI. Genera una clave y llama a este modelo en segundos.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
Documentación API Obtener clave de API

Preguntas frecuentes

mxbai-embed-large-v1 convierte el texto en un vector denso (una lista de flotadores) que captura el significado. Úselo para búsqueda semántica, agrupamiento, recomendación, generación aumentada de recuperación (RAG), y cualquier tarea en la que "es este texto similar a ese texto" importa.

Las dimensiones típicas son 384, 768, 1024, o 1536 dependiendo del modelo. BGE-M3 emite 1024-dim; OpenAI Ada emite 1536. La respuesta API incluye la dimensión para que su vector DB elija el índice correcto.

Los modelos modernos de incrustación (incluyendo la mayoría de las opciones en Free.ai) están entrenados en más de 100 idiomas.

512 tokens a 8.192 dependiendo del modelo. Las entradas más largas son truncadas — trocear documentos largos en párrafos antes de incrustarlos.

mxbai-embed-large-v1 se ejecuta en nuestras propias GPUs y se encuentra entre las herramientas más baratas — cerca de ~100 tokens por llamada extraídos de su grupo diario gratuito. $5 = 200K tokens.

Sí — Enviar una lista de cadenas a /v1/embeddings/ y mxbai-embed-large-v1 devuelve una lista de vectores en el mismo orden. Tamaño del lote hasta 2,048 por solicitud.

L2-normalizado por defecto — coseno similar = producto punto. Pase `normalizar=falso` si desea vectores en bruto para una métrica de distancia diferente.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 devuelve flotadores JSON planos; el DB nunca ve el modelo.

Sí — POST to /v1/embeddings/ with model="mxbai-embed-large-v1". Forma de respuesta compatible con OpenAI, por lo que las bibliotecas cliente existentes funcionan sin cambios. /api/ tiene la referencia completa.

Los modelos auto-anfitriones guardan su texto en nuestras GPUs y lo descartan después de que la llamada regrese. Pase Premium con un DPA. No entrenamos en sus entradas.

Sub-100ms para texto corto en auto-anfitrión, 100–500ms en prima. Escala de llamadas por lotes aproximadamente linealmente — 1.000 pedazos completos en 2–10 segundos.

Sí — Free.ai concede uso comercial de incrustaciones. Construir búsqueda de producción, tuberías RAG, sistemas de recomendación sin regalías per-vector.

Love this tool? Share it!

Calificar esta página