mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 jetons par call
~100 jetons par call

mxbai-embed-large-v1 est a modèle d'intégration construit par mixedbread.ai. Plus fort à {meilleur_pour}. Self-hosted sur Free.ai GPUs — fonctionne gratuitement contre votre pool de jetons journaliers (100 jetons par appel). Libéré sous Apache 2.0 — utilisation commerciale autorisée sur Free.ai.

Utiliser via l'API

API REST compatible OpenAI. Générez une clé et appelez ce modèle en quelques secondes.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
Documentation de l'API Obtenir la clé API

Foire aux questions

mxbai-embed-large-v1 convertit le texte en un vecteur dense (une liste de flotteurs) qui capture le sens. Utilisez-le pour la recherche sémantique, le regroupement, la recommandation, la génération augmentée de récupération (RAG), et toute tâche où "est ce texte similaire à ce texte" importe.

Les dimensions typiques sont 384, 768, 1024 ou 1536 selon le modèle. BGE-M3 émet 1024-dim; OpenAI Ada émet 1536. La réponse API inclut la dimension pour que votre vecteur DB choisisse le bon index.

Les modèles modernes d'intégration (y compris la plupart des options sur Free.ai) sont formés sur plus de 100 langues.

512 à 8 192 jetons selon le modèle. Les entrées plus longues sont tronquées — des documents longs en morceaux dans les paragraphes avant l'intégration.

mxbai-embed-large-v1 fonctionne sur nos propres GPU et est parmi les outils les moins chers — environ ~100 jetons par appel tiré de votre piscine gratuite quotidienne. $ 5 = 200K jetons.

Oui — POST une liste de chaînes à /v1/embeddings/ et mxbai-embed-large-v1 retourne une liste de vecteurs dans le même ordre. Taille du lot jusqu'à 2 048 par requête.

L2-normalisé par défaut — similarité cosine = produit point. Passez `normalize=false` si vous voulez des vecteurs bruts pour une métrique de distance différente.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 retourne les flotteurs simples JSON; la DB ne voit jamais le modèle.

Oui — POST to /v1/embeddings/ with model="mxbai-embed-large-v1". Forme de réponse compatible OpenAI, de sorte que les bibliothèques clientes existantes fonctionnent sans changement. /api/ a la référence complète.

Les modèles auto-organisés gardent votre texte sur nos GPU et le rejettent après le retour de l'appel. Premium passe avec un DPA. Nous ne formons pas vos entrées.

Sous-100ms pour texte court sur auto-hosted, 100-500ms sur premium. Les appels par lots s'échellent à peu près linéairement — 1 000 morceaux terminés en 2-10 secondes.

Oui — Free.ai accorde l'utilisation commerciale des emboîtements. Recherche de la production de construction, pipelines RAG, systèmes de recommandation sans redevances par vecteur.

Love this tool? Share it!

Noter cette page