Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 1個あたりのトークン数 call
~100 1個あたりのトークン数 call

Nomic Embed v2はa 埋め込みモデルであり,Nomic AIが作成したものです。 『フリーザ』の最強の敵。 Free.ai GPU でセルフホストされ、毎日のトークンプール(100トークン、1回の通話で)に対してフリーで動作します。 Apache 2.0でリリース — Free.aiで商用利用が許可されている。

API を使う

OpenAI 互換の REST API。鍵を生成し、数秒でこのモデルを呼び出す。

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'
APIドキュメント API キーを取得

よくある質問

Nomic Embed v2は、意味を捕捉する高密度ベクトル (浮動小数点数のリスト) にテキストを変換します。意味論的検索、クラスタリング、推奨、検索増幅生成 (RAG) など、「このテキストがそのテキストに似ているか」が重要な任意のタスクに使用できます。

BGE-M3は 1024-dimを出力します。OpenAI Adaは 1536を出力します。API応答には次元が含まれますので、ベクター DB は正しいインデックスを選択します。

現代の埋め込みモデル(Free.aiのほとんどのオプションを含む)は100以上の言語で訓練されています。言語間検索が可能である。英語で検索し、スペイン語で文書をマッチさせます。

モデルによっては 512 から 8,192 のトークンまで。長い入力は削除されます。長い文書は埋め込む前に段落に分割されます。

Nomic Embed v2は私たちのGPU上で動作し、最も安価なツールの一つである。 毎日のフリープールからコール当たり約100トークンを引く。$5 = 200Kトークン。

はい — /v1/embeddings/ に文字列のリストを POST し、Nomic Embed v2 は同じ順序でベクトルのリストを返します。一つの要求につき最大 2,048 のバッチサイズです。

標準では L2 正規化 — 余弦類似度 = 点積です。異なる距離計量のための原始ベクトルを求める場合は 'normalize=false' を渡します。

Nomic Embed v2 は、JSON の浮動小数点数を返します。DB はモデルを見ることはありません。

はい — /v1/embeddings/ に POST すると、 model="Nomic Embed v2" が生成されます。 OpenAI 互換の応答形式で、既存のクライアントライブラリは変更なしで動作します。 /api/ には完全なリファレンスが含まれています。

自己ホストモデルは、テキストをGPUに保存し、コールが戻った後に削除します。 プレミアムは、DPAを通して通過します。 入力を訓練しません。

短いテキストの場合、セルフホストでは100ms以下、プライムでは100-500ms。バッチコールは大体線形にスケールする。1,000チャンクは2-10秒で完了する。

Free.aiは埋め込みの商用利用を認める プロダクション検索、RAGパイプライン、ベクトルごとのロイヤリティなしの推奨システムを作成する

Love this tool? Share it!

このページを評価