Nomic Embed v2
Free.ai (self-hosted)
·
embeddings
·
~100 1個あたりのトークン数 call
Nomic Embed v2はa 埋め込みモデルであり,Nomic AIが作成したものです。 『フリーザ』の最強の敵。 Free.ai GPU でセルフホストされ、毎日のトークンプール(100トークン、1回の通話で)に対してフリーで動作します。 Apache 2.0でリリース — Free.aiで商用利用が許可されている。
よくある質問
Nomic Embed v2は、意味を捕捉する高密度ベクトル (浮動小数点数のリスト) にテキストを変換します。意味論的検索、クラスタリング、推奨、検索増幅生成 (RAG) など、「このテキストがそのテキストに似ているか」が重要な任意のタスクに使用できます。
BGE-M3は 1024-dimを出力します。OpenAI Adaは 1536を出力します。API応答には次元が含まれますので、ベクター DB は正しいインデックスを選択します。
現代の埋め込みモデル(Free.aiのほとんどのオプションを含む)は100以上の言語で訓練されています。言語間検索が可能である。英語で検索し、スペイン語で文書をマッチさせます。
モデルによっては 512 から 8,192 のトークンまで。長い入力は削除されます。長い文書は埋め込む前に段落に分割されます。
Nomic Embed v2は私たちのGPU上で動作し、最も安価なツールの一つである。 毎日のフリープールからコール当たり約100トークンを引く。$5 = 200Kトークン。
はい — /v1/embeddings/ に文字列のリストを POST し、Nomic Embed v2 は同じ順序でベクトルのリストを返します。一つの要求につき最大 2,048 のバッチサイズです。
標準では L2 正規化 — 余弦類似度 = 点積です。異なる距離計量のための原始ベクトルを求める場合は 'normalize=false' を渡します。
Nomic Embed v2 は、JSON の浮動小数点数を返します。DB はモデルを見ることはありません。
はい — /v1/embeddings/ に POST すると、 model="Nomic Embed v2" が生成されます。 OpenAI 互換の応答形式で、既存のクライアントライブラリは変更なしで動作します。 /api/ には完全なリファレンスが含まれています。
自己ホストモデルは、テキストをGPUに保存し、コールが戻った後に削除します。 プレミアムは、DPAを通して通過します。 入力を訓練しません。
短いテキストの場合、セルフホストでは100ms以下、プライムでは100-500ms。バッチコールは大体線形にスケールする。1,000チャンクは2-10秒で完了する。
Free.aiは埋め込みの商用利用を認める プロダクション検索、RAGパイプライン、ベクトルごとのロイヤリティなしの推奨システムを作成する