mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 ටොකන call
~100 ටොකන call

mxbai-embed-large-v1 යනු an embedding ආකෘතිය විසින් mixedbread.ai විසින් ඉදිකරන ලද embedding ආකෘතිය වේ. ෆ්‍රෙඩී Free.ai GPUs මත ස්වයං-සත්කාරක - ඔබේ දෛනික ටොකන් පූල් එරෙහිව නිදහස් ධාවනය (100 ටොකන් ඇමතුමකට). Apache 2.0 යටතේ නිදහස් කරන ලදී — වාණිජමය භාවිතය සඳහා Free.ai මත අවසර ලබා දී ඇත.

API හරහා භාවිත කරන්න

OpenAI අනුකූල REST API. යතුරක් ජනනය කර තත්පර කිහිපයකින් මෙම ආකෘතිය ඇමතීමට.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
API ලේඛන API යතුර ලබාගන්න

නිතර අසන ප්රශ්න

mxbai-embed-large-v1 අර්ථය අල්ලා ඝන දෛශිකයක් (පිහිටුම් ලැයිස්තුව) බවට පෙළ පරිවර්තනය කරයි. අර්ථ සෙවුම් සඳහා එය භාවිතා, clustering, නිර්දේශය, ලබා ගැනීම-වැඩි ජනපද (RAG), හා "මේ පෙළ එම පෙළ සමාන" කාරණා ඕනෑම කාර්යයක්.

සාමාන්ය මාන 384, 768, 1024, හෝ ආකෘතිය මත රඳා 1536 වේ. BGE-M3 1024-dim නිකුත්; OpenAI Ada 1536 නිකුත්. API ප්රතිචාරය ඔබේ දෛශිකය ඩීබී හරි දර්ශකය තෝරා ඒ නිසා මාන ඇතුළත් වේ.

නූතන embedding ආකෘති (Free.ai මත බොහෝ විකල්ප ඇතුළු) 100+ භාෂා පුහුණු කර ඇත. හරස්-භාෂා ලබා ගැනීමේ වැඩ - ඉංග්රීසි සෙවුම්, ස්පාඤ්ඤයේ ලේඛන ගැලපෙන.

512 සිට 8,192 ආකෘතිය මත රඳා ටොකන්. දිගු ආදාන කපා ඇත - embedding පෙර ඡේද බවට දිගු ලේඛන කොටසක්.

mxbai-embed-large-v1 අපගේ ම GPUs මත ධාවනය වන අතර ලාභම මෙවලම් අතර වේ - ~ 100 ගැන ඔබේ දෛනික නිදහස් පූල් සිට ඇඳී ඇමතුමක් සඳහා ටොකන්. $5 = 200K ටොකන්.

ඔව් - / v1 / embeddings / හා mxbai-embed-large-v1 __ එම නියෝගය යටතේ දෛශික ලැයිස්තුවක් ආපසු / v1 / embeddings / හා mxbai-embed-large-v1 __ strings ලැයිස්තුවක් පල. ඉල්ලීමකට අනුව 2,048 දක්වා කණ්ඩායම් ප්රමාණයට.

පෙරනිමියෙන් L2-සාමාන්යකරණය - cosine සමානත්වය = තිත නිෂ්පාදනය. ඔබ වෙනස් දුර මෙට්රික් සඳහා අමු දෛශික අවශ්ය නම් `සාමාන්යකරණය = බොරු` සමත්.

ඕනෑම — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 සරල JSON පිහිනන ආපසු; DB ආකෘතිය දැක නැහැ.

ඔව් — POST to /v1/embeddings/ with model="mxbai-embed-large-v1". OpenAI-සමකල හැකි ප්‍රතිචාර හැඩය, එසේ පවතින සේවාදායක පුස්තකාල වැඩ වෙනස් නොවේ. /api/ සම්පූර්ණ උපුටා දැක්වීම ඇත.

ස්වයං-සත්කාරක ආකෘති අපගේ GPUs මත ඔබේ පෙළ තබා හා ඇමතුම ආපසු පසුව එය ඉවත්. ප් රමිති DPA සමග හරහා යන්න. අපි ඔබේ ආදාන පුහුණු නැහැ.

ස්වයං-සත්කාරක කෙටි පෙළ සඳහා Sub-100ms, වාරික මත 100-500ms. කණ්ඩායම් ඇමතුම් දළ වශයෙන් රේඛීයව පරිමාණය - 1,000 තත්පර 2-10 තුළ සම්පූර්ණ චුක්.

ඔව් - Free.ai embeddings වාණිජ භාවිතය ප්රදානය. නිෂ්පාදන සෙවුම්, RAG නල මාර්ග, කිසිදු ප්රති-වෙක්ෂය රාජ්ය නොවන නිර්දේශ පද්ධති ගොඩනැගීමට.

Free.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

මෙම පිටුව අගය කරන්න