mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 贴现符号数符数 call
~100 贴现符号数符数 call

mxbai-embed-large-v1 是 a 嵌入模型 由 mixedbread.ai 建造的 。 最强的在Semantic search, clustering, similarity.。 在Free.ai GPUs上自行托管——免费运行于您的每日代币池({tpm_signs} 每呼数)。 在Free.ai允许的商业用途`Apache 2.0'下释放。

通过 API 使用

OpenAI- 兼容的 REST API。 生成一个密钥, 并在秒内调用此模式 。

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
API 文件 获取 API 密钥

常问问题

mxbai-embed-large-v1 将文字转换成能捕捉含义的密度矢量(浮点列表) 。 用于语义搜索、 聚合、 建议、 检索增强的生成( RAG), 以及任何“ 文本与该文本相似” 的任务 。

典型尺寸为384、768、1024或1536,视模型而定。BGE-M3 发射量为1024-dim; OpenAI Ada 发射量为1536。 API 反应包含尺寸, 使您的矢量 DB 选择正确的索引 。

现代嵌入模型(包括Free.ai语言的大多数选项)接受了100+语言培训,跨语言检索工作——用英文搜索,用西班牙文匹配文件。

512至8,192个符号取决于模型。较长的输入被缩短,在嵌入前将长的文档块放入段落中。

-mxbai-embed-large-v1在我们的GPUs上运行,是最廉价的工具之一——从每日免费游泳池抽取的每通电话约100个标记。 5美元=200K标记。

是 - POST 的字符串列表 / v1/ embeddings/ 和 mxbai-embed-large-v1 返回以相同顺序排列的矢量列表。 批量大小为2 048 个请求。

默认情况下,L2-正规化-余相近性=点产物。如果您想要不同距离的生矢量,则通过“正统化=false”。

任何 - 松酮、 Weavate、 Qdrant、 Chroma、 pgvetor、 FASIS、 LanceDB. `mxbai-embed-large-v1 返回普通 JSON 浮标; DB 从未看到该模型 。

是- POST 到/v1/embedings/ with model= "mxbai-embed-large-v1"。 OpenAI 兼容的反应形状,因此现有客户图书馆的工作没有变化。

自行托管的模型将您的文本保存在我们的 GPU 上, 并在调用返回后丢弃它 。 优先通过 DPA 。 我们不训练您的投入 。

自动托管的短文本的子100米,加价100至500米。批次呼叫规模大致是线性 — 1,000块在2至10秒内完成。

Yes — Free.ai grants commercial use of embeddings. Build production search, RAG pipelines, recommendation systems with no per-vector royalty.

Love this tool? Share it!

本页利率