mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 tokens por call
~100 tokens por call

mxbai-embed-large-v1 é an embedding model construído por mixedbread.ai. "A mellor en Semantic search, clustering, similarity.". Auto-aloxado en Free.ai GPUs — executa libremente contra o seu conxunto de tokens diarios (100 tokens por chamada). Publicado baixo a licenza Apache 2.0 — uso comercial permitido en Free.ai.

Empregar a través da API

API REST compatíbel con OpenAI. Xere unha chave e chame a este modelo en segundos.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
Documentación da API Obter a chave da API

Preguntas frecuentes

mxbai-embed-large-v1 __ converte o texto nun vector denso (unha lista de números flutuantes) que captura o significado. Úsao para procuras semánticas, agrupamento, recomendacións, xeración aumentada de recuperación (RAG) e calquera tarefa onde « é este texto semellante a ese texto » sexa importante.

As dimensións típicas son 384, 768, 1024 ou 1536 dependendo do modelo. BGE-M3 emite 1024- dim; OpenAI Ada emite 1536. A resposta da API inclúe a dimensión para que a súa base de datos de vectores escolla o índice correcto.

Os modelos de incrustación modernos (incluíndo a maioría das opcións no Free.ai) están adestrados en máis de 100 linguas. Funciona a recuperación entre linguas: procura en inglés, coincide con documentos en español.

512 a 8. 192 tokens dependendo do modelo. As entradas máis longas son truncadas - fragmenta os documentos longos en parágrafos antes de incorporalos.

mxbai-embed-large-v1 executase nas nosas propias GPU e está entre as ferramentas máis baratas — arredor de ~100 tokens por chamada extraídos da súa reserva diaria libre. $5 = 200K tokens.

Si — POST unha lista de cadeas a / v1/ embeddings / e mxbai-embed-large-v1 __ devolve unha lista de vectores na mesma orde. Tamaño do lote de ata 2. 048 por petición.

Normalizado en L2 por omisión — similitude cosinus = produto de puntos. Pase « normalize=false » se quere vectores brutos para unha métrica de distancia diferente.

Calquera — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 __ devolve valores flutuantes JSON; a base de datos nunca ve o modelo.

Si — POST a / v1/ embeddings / con model=" mxbai-embed-large-v1 ". Forma de resposta compatíbel con OpenAI, polo que as bibliotecas cliente existentes funcionan sen cambios. / api / ten a referencia completa.

Os modelos auto- hospedados manteñen o seu texto nas nosas GPU e descartáno despois de que a chamada regrese. Premium pasa a través dun DPA. Non adestramos coas súas entradas.

Menos de 100ms para texto curto en auto- hospedado, 100- 500ms en premium. As chamadas por lotes escalan aproximadamente linearmente — 1000 fragmentos completados en 2- 10 segundos.

Si, Free.ai concede o uso comercial das incorporacións. Construír procuras de produción, canalizacións RAG, sistemas de recomendación sen royalties por vector.

Amas Free.ai?

Cualificar esta páxina