mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 tokens per call
~100 tokens per call

mxbai-embed-large-v1 is an embedding model built by mixedbread.ai. U più forti à Semantic search, clustering, similarity.. Auto-ospitatu in Free.ai GPU - corre gratuitamente contr'à u vostru pool di token giornalieru (100 tokens per chiamata). Rilasciatu sottu Apache 2.0 — usu cummerciale permessu in Free.ai.

Usare via API

API REST compatibili OpenAI. Genera una chiave è chiama stu mudellu in uni pochi di siconni.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
Documentazione Otteni a chiave API

Dumande frequenti

mxbai-embed-large-v1 cunverti u testu in un vettori densu (una lista di valuri flottanti) ca cattura u significatu. Usallu pi ricerca simàntica, clustering, raccomandazioni, generazioni arricchita di ritruvatu (RAG), e ogni attività unni "chistu testu è simili a chistu testu" importa.

Diminsioni tipichi sò 384, 768, 1024, o 1536 a sicunna di u mudellu. BGE-M3 emetti 1024-dim; OpenAI Ada emette 1536. A risposta API include a dimensione cusì u vostru DB vettoriale sceglie l'indici giustu.

I mudelli di embedding moderni (cumpresi a maiò parte di l'opzioni in Free.ai) sò addestrati in più di 100 lingue.

512 à 8,192 tokens secondu u mudellu. L'inputs cchiù longhi sò truncati — chunk longhi documenti in paragrafi prima di incorporazione.

mxbai-embed-large-v1 corre nantu à i nostri propri GPU è hè trà i strumenti più economici - circa ~ 100 tokens per chiamata disegnata da u vostru pool gratuitu quotidianu. $ 5 = 200K tokens.

Sì — POST una lista di stringhe à /v1/embeddings/ e mxbai-embed-large-v1 riturnerà una lista di vettori in u listessu ordine. Dimensioni di batch finu à 2,048 per richiesta.

L2-normalized per default — cosenu similarity = dot product. Pass `normalize=false` si vogghiu vectori crudi pi na distanzi metrica diversa.

Qualsiasi — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 riturnà i valori JSON; a DB nun vidi mai u mudellu.

Sì — POST à /v1/embeddings/ cù model="mxbai-embed-large-v1". Forma di risposta cumpatibbili OpenAI, cusì e libbriche client esistenti funzionanu senza cambiamenti. /api/ hà a riferenza completa.

I mudelli auto-ospitati mantenenu u vostru testu in i nostri GPU è u scartanu dopu u ritornu di a chiamata. Premium passa attraversu cù un DPA. Non ci addestramu nantu à i vostri input.

Sub-100ms per testu curtu in auto-ospitatu, 100-500ms in premium.Chiamate in batch scalanu à pocu pressu linearmente - 1,000 pezzi completati in 2-10 secondi.

Sì — Free.ai cunzenti l'usu cummerciali di l'incorporazioni. Costruisce ricerca di produzzione, pipelines RAG, sistemi di raccomandazioni senza royalties per-vetturi.

Amuri Free.ai? Dì i vostri amichi!

Vota sta pàggina