Nomic Embed v2

Free.ai (self-hosted) · embeddings · ~100 tocynnau y eiliad call
~100 tocynnau y eiliad call

Nomic Embed v2 yw a model mewnadeiladu a adeiladwyd gan Nomic AI. Mwyaf gryf ar Retrieval augmented generation with flexible vector sizes.. Hunan-gartrefedig ar Free.ai GPUs — rhedeg yn rhad ac am ddim yn erbyn eich pool tocynnau bob dydd (100 tokens ar gyfer pob galwad). Rhyddhawyd o dan Apache 2.0 — caniateir defnydd masnachol ar Free.ai.

Defnyddio trwy API

API REST OpenAI-cydnaws. Creu allwedd a galw'r model hwn mewn eiliad.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"nomic-embed-v2","prompt":"your prompt here"}'
Dogfennaeth API Nôl Allwedd API

Cwestiynau a Ofynnir yn Aml

Mae Nomic Embed v2 yn trosi testun i fector dwys (rhestr o arloeswyr) sy'n dal ystyr. Defnyddiwch ef ar gyfer chwilio ystyriol, clwstio, argymhellion, creu wedi ei wella gan adfer (RAG), a phob tasg lle mae "a yw'r testun hwn yn debyg i'r testun hwnnw" yn bwysig.

Mae dimensiynau arferol yn 384, 768, 1024, neu 1536 yn dibynnu ar y model. Mae BGE-M3 yn anfon 1024-dim; mae OpenAI Ada yn anfon 1536. Mae'r ymateb API yn cynnwys y dimensiwn fel bod eich DB fector yn dewis y mynegai cywir.

Mae modelau mewnadeiladu modern (gan gynnwys y rhan fwyaf o ddewisiadau ar Free.ai) wedi eu hyfforddi ar gyfer 100+ o ieithoedd. Gwaith adfer rhwng ieithoedd — chwilio yn Saesneg, cydweddu dogfennau yn Sbaeneg.

512 i 8,192 o tocynnau yn dibynnu ar y model. Trosir mewnbwn hirach - rhannu dogfennau hir i baragraffau cyn eu mewnosod.

Mae Nomic Embed v2 yn rhedeg ar ein GPUs ein hunain ac mae'n un o'r offer mwyaf fforddiadwy - tua ~100 tocyn am bob galwad a ddarperir o'ch cronfa rhad ac am ddim bob dydd. $5 = 200K o tocynnau.

Ie — POST rhestr o linynnau i /v1/embeddings/ a dychwelyd Nomic Embed v2 rhestr o feicwyr yn yr un trefn. Maint y batch hyd at 2,048 am bob cais.

L2-normaleiddio yn rhagosodedig — tebygrwydd cosinus = cynhyrchiad dot. Rhowch `normalize=false` os ydych am fectorau crai ar gyfer mesurfa pellter wahanol.

Unrhyw - Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. Mae Nomic Embed v2 yn dychwelyd arnawf JSON plaen; ni welwyd y model erioed gan y DB.

Ie — POST i /v1/embeddings/ gyda model="Nomic Embed v2". Siâp ymateb OpenAI-cydnaws, felly mae llyfrgelloedd cleientiaid sy'n bodoli'n gweithio heb newid. Mae gan /api/ y cyfeiriad llawn.

Modelau hunan-westeiedig yn cadw eich testun ar ein GPUs a'i daflu ar ôl i'r galwad ddychwelyd. Premium yn mynd drwy gyda DPA. Ni ddysgwn ar eich mewnbwn.

Dan 100ms ar gyfer testun byr ar hunan-westeio, 100-500ms ar premiwm. Mae galwadau batch yn graddio'n gylchol - 1,000 o ddarnau'n cwblhau mewn 2-10 eiliad.

Ie — Mae Free.ai yn rhoi defnydd masnachol o fewnosodiadau. Adeiladu chwilio cynhyrchu, pibellau RAG, systemau argymhellion heb unrhyw ffioedd am bob fector.

Hoffwch Free.ai? Meddwl am eich ffrindiau!

Graddio'r dudalen hon