Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 jetons par call
~100 jetons par call

Nomic Embed v2 est a modèle d'intégration construit par Nomic AI. Plus fort à {meilleur_pour}. Self-hosted sur Free.ai GPUs — fonctionne gratuitement contre votre pool de jetons journaliers (100 jetons par appel). Libéré sous Apache 2.0 — utilisation commerciale autorisée sur Free.ai.

Utiliser via l'API

API REST compatible OpenAI. Générez une clé et appelez ce modèle en quelques secondes.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'
Documentation de l'API Obtenir la clé API

Foire aux questions

Nomic Embed v2 convertit le texte en un vecteur dense (une liste de flotteurs) qui capture le sens. Utilisez-le pour la recherche sémantique, le regroupement, la recommandation, la génération augmentée de récupération (RAG), et toute tâche où "est ce texte similaire à ce texte" importe.

Les dimensions typiques sont 384, 768, 1024 ou 1536 selon le modèle. BGE-M3 émet 1024-dim; OpenAI Ada émet 1536. La réponse API inclut la dimension pour que votre vecteur DB choisisse le bon index.

Les modèles modernes d'intégration (y compris la plupart des options sur Free.ai) sont formés sur plus de 100 langues.

512 à 8 192 jetons selon le modèle. Les entrées plus longues sont tronquées — des documents longs en morceaux dans les paragraphes avant l'intégration.

Nomic Embed v2 fonctionne sur nos propres GPU et est parmi les outils les moins chers — environ ~100 jetons par appel tiré de votre piscine gratuite quotidienne. $ 5 = 200K jetons.

Oui — POST une liste de chaînes à /v1/embeddings/ et Nomic Embed v2 retourne une liste de vecteurs dans le même ordre. Taille du lot jusqu'à 2 048 par requête.

L2-normalisé par défaut — similarité cosine = produit point. Passez `normalize=false` si vous voulez des vecteurs bruts pour une métrique de distance différente.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. Nomic Embed v2 retourne les flotteurs simples JSON; la DB ne voit jamais le modèle.

Oui — POST to /v1/embeddings/ with model="Nomic Embed v2". Forme de réponse compatible OpenAI, de sorte que les bibliothèques clientes existantes fonctionnent sans changement. /api/ a la référence complète.

Les modèles auto-organisés gardent votre texte sur nos GPU et le rejettent après le retour de l'appel. Premium passe avec un DPA. Nous ne formons pas vos entrées.

Sous-100ms pour texte court sur auto-hosted, 100-500ms sur premium. Les appels par lots s'échellent à peu près linéairement — 1 000 morceaux terminés en 2-10 secondes.

Oui — Free.ai accorde l'utilisation commerciale des emboîtements. Recherche de la production de construction, pipelines RAG, systèmes de recommandation sans redevances par vecteur.

Love this tool? Share it!

Noter cette page