Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ call
~100 ପ୍ରତି ଟୋକନଗୁଡ଼ିକ call

Nomic Embed v2 ହେଉଛି an embedding ନମୂନା ଯାହାକି Nomic AI ଦ୍ୱାରା ନିର୍ମିତ। Retrieval augmented generation with flexible vector sizes. ରେ ସବୁଠାରୁ ଶକ୍ତିଶାଳୀ । Free.ai GPUs ଉପରେ ସ୍ୱୟଂ-ହୋଷ୍ଟ — ଆପଣଙ୍କର ଦୈନିକ ଟୋକନ ପୁଲ (100 ଟୋକନ ପ୍ରତି କଲ) ବିରୋଧରେ ମୁକ୍ତ ଭାବରେ ଚାଲୁଛି। Apache 2.0 ଅନ୍ତର୍ଗତ ମୁକ୍ତ କରାଯାଇଛି — ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ଅନୁମତି Free.ai ରେ ।

API ମାଧ୍ୟମରେ ବ୍ୟବହାର କରନ୍ତୁ

OpenAI-ସଂଗତି REST API. ଗୋଟିଏ କି ସୃଷ୍ଟି କରନ୍ତୁ ଏବଂ ସେକଣ୍ଡଗୁଡ଼ିକରେ ଏହି ନମୂନାକୁ ଡକାନ୍ତୁ।

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'
API ଦଲିଲିକରଣ API କି ଗ୍ରହଣ କରନ୍ତୁ

ସାଧାରଣ ପ୍ରଶ୍ନ

Nomic Embed v2 ପାଠ୍ୟକୁ ଏକ ଘନ ଭେକ୍ଟରରେ ପରିବର୍ତ୍ତନ କରେ (ଉଲଟାଗୁଡିକର ଗୋଟିଏ ତାଲିକା) ଯାହାକି ଅର୍ଥକୁ ଗ୍ରହଣ କରିଥାଏ। ଏହାକୁ ଅର୍ଥାତ୍ମକ ସନ୍ଧାନ, ଗ୍ରୁପିଂ, ସୁପାରିଶ, ପୁନଃଗ୍ରହଣ-ବଢ଼ାଯାଇଥିବା ଉତ୍ପାଦନ (RAG), ଏବଂ ଯେକୌଣସି କାର୍ଯ୍ୟ ପାଇଁ ବ୍ୟବହାର କରନ୍ତୁ ଯେଉଁଠି "ଏହି ପାଠ୍ୟ ସେହି ପାଠ୍ୟ ସହିତ ସମାନ ଅଟେ" ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ।

ଆକାର 384, 768, 1024, କିମ୍ବା 1536 ଆକାର ଆ

ଆଧୁନିକ ସନ୍ନିବେଶ ନମୂନାଗୁଡ଼ିକ (Free.ai ରେ ଅଧିକାଂଶ ବିକଳ୍ପଗୁଡ଼ିକ ସମେତ) 100+ ଭାଷାରେ ପ୍ରଶିକ୍ଷଣପ୍ରାପ୍ତ। କ୍ରସ-ଭାଷା ପୁନଃଗ୍ରହଣ କାର୍ଯ୍ୟଗୁଡ଼ିକ - ଇଂରାଜୀରେ ସନ୍ଧାନ, ସ୍ପେନିସରେ ଦଲିଲଗୁଡ଼ିକୁ ମେଳଖାଉଛି।

512 ରୁ 8,192 ଟୋକନଗୁଡ଼ିକ ଆକାର ଉପରେ ନିର୍ଭର କରିଥାଏ। ଲମ୍ବା ନିବେଶଗୁଡ଼ିକ କଟାଯାଇଥାଏ - ସନ୍ନିବେଶ କରିବା ପୂର୍ବରୁ ଲମ୍ବା ଦଲିଲଗୁଡ଼ିକୁ ଅନୁଚ୍ଛେଦଗୁଡ଼ିକରେ କାଟିଦିଅନ୍ତୁ।

Nomic Embed v2 ଆମର ନିଜ GPUs ଉପରେ ଚାଲୁଛି ଏବଂ ସବୁଠାରୁ ସସ୍ତା ସାଧନ ମଧ୍ୟରେ ରହିଛି - ~100 ଟୋକନ ପ୍ରତି କଲ ଆପଣଙ୍କର ଦୈନିକ ମୁକ୍ତ ପୁଲରୁ ଆଣିଛି। $5 = 200K ଟୋକନ।

ହଁ — /v1/embeddings/ କୁ ଗୋଟିଏ ଶବ୍ଦମାଳା ତାଲିକା POST କରନ୍ତୁ ଏବଂ Nomic Embed v2 ଗୋଟିଏ ସମାନ ଧାଡ଼ିରେ ଭେକ୍ଟର ତାଲିକାକୁ ଫେରାଇଥାଏ। ପ୍ରତି ଅନୁରୋଧରେ ବ୍ୟାଚ ଆକାର 2,048 ପର୍ଯ୍ୟନ୍ତ।

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଭାବରେ L2-ସାମାନ୍ୟକୃତ — କୋସାଇନ ସମାନତା = ବିନ୍ଦୁ ଉତ୍ପାଦନ। ଯଦି ଆପଣ ଭିନ୍ନ ଦୂରତା ମିଟର ପାଇଁ କାର୍ବ ଭେକଟର ଚାହୁଁଛନ୍ତି ତେବେ 'ସାମାନ୍ୟକରଣ=କୂଟ'କୁ ପାସ କରନ୍ତୁ।

ଯେକୌଣସି — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. Nomic Embed v2 ସରଳ JSON ଚଳକକୁ ଫେରାଇଥାଏ; DB କେବେବି ନମୂନାକୁ ଦେଖିନଥାଏ।

ହଁ — /v1/embeddings/ କୁ POST କରନ୍ତୁ ମଡେଲ="Nomic Embed v2" ସହିତ। OpenAI-ସଂଗତିପୂର୍ଣ୍ଣ ଉତ୍ତର ଆକାର, ତେଣୁ ବର୍ତ୍ତମାନ ଗ୍ରାହକ ଲାଇବ୍ରେରୀଗୁଡ଼ିକ ଅଦଳବଦଳ ହୋଇନଥାଏ। /api/ ରେ ସମ୍ପୂର୍ଣ୍ଣ ସଂଯୋଗ ଅଛି।

ସ୍ୱୟଂ-ହୋଷ୍ଟ ମଡେଲଗୁଡ଼ିକ ଆମର GPUs ରେ ଆପଣଙ୍କର ପାଠ୍ୟକୁ ରଖିଥାଏ ଏବଂ କଲ ଫେରିବା ପରେ ଏହାକୁ ପରିତ୍ୟାଗ କରିଥାଏ। ପ୍ରୀମିୟମ DPA ସହିତ ଦୂରକୁ ଗତି କରିଥାଏ। ଆମେ ଆପଣଙ୍କର ନିବେଶ ଉପରେ ପ୍ରଶିକ୍ଷଣ ଦେଇନଥାଉ।

ସ୍ୱୟଂ-ହୋଷ୍ଟରେ ସଂକ୍ଷିପ୍ତ ପାଠ୍ୟ ପାଇଁ ଅଧି-100ms, ପ୍ରିମିଆରେ 100-500ms। ବ୍ୟାଚ କଲଗୁଡ଼ିକ ପ୍ରାୟ ରେଖାଗତ ଭାବରେ ମାପନ୍ତି - 1,000 ଚୁକ୍ସ2-10 ସେକେଣ୍ଡରେ ସମ୍ପୂର୍ଣ୍ଣ ହୋଇଥାଏ।

ହଁ – Free.ai ଅନ୍ତର୍ଭୁକ୍ତ ବାଣିଜ୍ୟିକ ଉପଯୋଗକୁ ଅନୁମତି ଦେଇଥାଏ । ନିର୍ମାଣ ସନ୍ଧାନ, ଆରଏଜି ପାଇପଲାଇନ, ସୁପାରିଶ ବ୍ୟବସ୍ଥା ପ୍ରତି ଭେକ୍ଟର ରୟାଲଟି ବିନା ନିର୍ମାଣ କରନ୍ତୁ ।

Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଏହି ପୃଷ୍ଠାକୁ ଆକଳନ କରନ୍ତୁ