mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 Ցուցադրել call
~100 Ցուցադրել call

mxbai-embed-large-v1 is a ներկառուցված մոդել built by mixedbread.ai. Ֆրանսիայի ազգային հավաքականի կազմում Ֆրանսիայի առաջնությունում (ֆր.՝ Ligue 1). Free.ai GPU-ների վրա ինքնուրույն տեղադրված — աշխատում է անվճար ձեր օրական token pool-ի դեմ (100 tokens զանգի համար). Free.ai-ի տակ թողարկված է Apache 2.0 — առևտրային օգտագործման թույլտվություն.

Օգտագործել API- ի միջոցով

OpenAI-ի հետ համընկնող REST API-ն է։ Գործարկեք կոդը և մի քանի վայրկյանում զանգահարեք այս մոդելին։

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
API փաստաթղթավորում Գրանցվել API կոդով

Հաճախակի տրվող հարցեր

mxbai-embed-large-v1-ը փոխակերպում է տեքստը հաստ վեկտորի (հոսող թվերի ցուցակ), որը գրավում է իմաստը։ Կիրառեք այն սեմատիկ որոնման, խմբավորման, խորհուրդների, վերցման-բարձրացրած սերմանման (RAG) և ցանկացած այլ գործողության համար, որտեղ «արդյոք այս տեքստն նման է այդ տեքստին» կարևոր է։

Տիպիկ չափերը 384, 768, 1024 կամ 1536 են՝ կախված մոդելից։ BGE-M3-ը թողարկում է 1024-dim; OpenAI Ada-ն թողարկում է 1536։ API-ի պատասխանը ներառում է չափը, որպեսզի ձեր վեկտորային DB-ն ընտրի ճիշտ ինդեքսը։

Համակարգչային ներբեռնման մոդելները (ներառյալ Free.ai-ի ռեժիմների մեծամասնությունը) սովորեցված են 100+ լեզուների համար։ Կրկնլեզու վերցման աշխատանքները՝ որոնում անգլերենով, փաստաթղթերի համեմատում իսպաներենով։

512-ից 8,192 տոկոս՝ կախված մոդելից։ Ավելի երկար մուտքագրումները կտրվում են՝ երկար փաստաթղթերը ներառելուց առաջ բաժանելով կետեր։

mxbai-embed-large-v1-ը աշխատում է մեր սեփական GPU-ների վրա և ամենաէժան գործիքներից է՝ մոտավորապես ~100 տոկոս յուրաքանչյուր զանգի համար, որը տրվում է ձեր օրական անվճար ռեսուրսներից։ $5 = 200K տոկոս։

Այո — POST անել /v1/embeddings/ ցուցակի ստորագրությունները և mxbai-embed-large-v1-ը վերադարձնում է նույն կարգով վեկտորների ցուցակը։ Օրինակ՝ յուրաքանչյուր խնդրանքի համար խումբը կարող է ունենալ մինչև 2048 ստորագրություն։

Լռելյայն L2-նորմալացված է — կոսինի նմանությունը = կետային արտադրանքը։ Տեղադրեք `normalize=false`, եթե ցանկանում եք սկզբնական վեկտորները տարբեր հեռավորության մետրիկայի համար։

Յուրաքանչյուր — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 returns plain JSON floats; the DB never sees the model.

1999-ին թողարկվել է «The 100 Best Albums of All Time» ալբոմը, որը վաճառվել է 1 միլիոն օրինակով։ 2001 թվականին թողարկվել է «The 100 Best Albums of All Time» ալբոմը, որը վաճառվել է 1 միլիոն օրինակով։

Իրենց վրա աշխատող մոդելները պահում են ձեր տեքստերը մեր GPU- ներում և թողնում են դրանք, երբ զանգը վերադառնում է։ Premium- ը DPA- ով անցնում է։ Մենք չենք սովորում ձեր մուտքագրումներից։

100-500 մս/սմ-ից քիչ՝ կարճ տեքստի համար, եթե սերվերը տեղադրված է սեփական համակարգչում։ Բեթային զանգերը մոտավորապես գծային են՝ 1000 հատվածները կատարվում են 2-10 վայրկյանում։

Այո — Free.ai-ը թույլ է տալիս ներդրումների առևտրային օգտագործումը։ Ծրագրի որոնում, RAG ջրատարներ, խորհուրդների համակարգեր՝ առանց վեկտորային արտոնագրի։

Սիրում ես Free.ai-ը, ասա ընկերներիդ։

Առաջարկել այս էջը