mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 Token je call
~100 Token je call

_ Am stärksten bei Semantic search, clustering, similarity.. Selbstgehostet auf Free.ai GPUs — läuft kostenlos gegen Ihren täglichen Tokenpool ({tpm__tokens} pro Anruf). Veröffentlicht unter Apache 2.0 — kommerzielle Nutzung erlaubt auf Free.ai.

Verwendung über API

OpenAI-kompatible REST API. Generieren Sie einen Schlüssel und rufen Sie dieses Modell in Sekundenschnelle auf.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
API-Dokumentation API-Schlüssel abrufen

Häufig gestellte Fragen

mxbai-embed-large-v1 wandelt Text in einen dichten Vektor (eine Liste von Schwimmern), der Bedeutung erfasst. Verwenden Sie ihn für semantische Suche, Clustering, Empfehlung, retrieval-augmented Generation (RAG) und jede Aufgabe, bei der "dieser Text ähnlich diesem Text" zählt.

Typische Abmessungen sind je nach Modell 384, 768, 1024 oder 1536. BGE-M3 emittiert 1024-dim; OpenAI Ada emittiert 1536. Die API-Antwort enthält die Dimension, so dass Ihr Vektor DB den richtigen Index wählt.

Moderne Einbettungsmodelle (inklusive der meisten Optionen auf Free.ai) werden auf 100+ Sprachen geschult. Cross-language retrieval works – Suche in Englisch, Match-Dokumente in Spanisch.

512 bis 8,192 Tokens je nach Modell. Längere Eingaben werden abgeschnitten – lange Dokumente vor dem Einbetten in Absätze spalten.

mxbai-embed-large-v1 läuft auf unseren eigenen GPUs und gehört zu den billigsten Tools — ca. ~100 Token pro Anruf aus Ihrem täglichen kostenlosen Pool gezogen. $5 = 200K Token.

Ja — POST eine Liste der Zeichenfolgen zu /v1/embedddings/ und mxbai-embed-large-v1 gibt eine Liste der Vektoren in der gleichen Reihenfolge zurück. Stapelgröße bis zu 2.048 pro Anfrage.

L2-normalisiert standardmäßig — cosine similarity = dot product. Pass `normalize=false` wenn Sie Rohvektoren für eine andere Distanzmetrik wünschen.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 gibt einfache JSON-Floans zurück; die DB sieht das Modell nie.

Ja — POST auf /v1/embeddings/ mit model="mxbai-embed-large-v1". OpenAI-kompatible Antwortform, so dass bestehende Client-Bibliotheken unverändert funktionieren. /api/ hat die vollständige Referenz.

Selbst gehostete Modelle behalten Ihren Text auf unseren GPUs und verwerfen ihn nach dem Anruf zurück. Premium-Durchlauf mit einem DPA. Wir trainieren nicht auf Ihren Eingängen.

Sub-100ms für Kurztext auf selbst gehosteten, 100–500ms auf Premium. Batch-Aufrufe skalieren grob linear – 1.000 Brocken sind in 2–10 Sekunden komplett.

Ja — Free.ai gewährt kommerzielle Nutzung von Einbettungen. Bauen Sie Produktionssuche, RAG-Pipelines, Empfehlungssysteme ohne Pro-Vektor-Lizenzgebühren.

Love this tool? Share it!

Bewerten Sie diese Seite