mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 குறிகள் call
~100 குறிகள் call

mxbai-embed-large-v1 is a உட்பொதிந்த மாதிரி built by mixedbread.ai. Semantic search, clustering, similarity. இல் மிகவும் வலிமையானது. Free.ai GPUs களில் தனியாக நிறுவப்பட்டது — உங்கள் தினசரி டாக்கன் பல்லுடன் (100 டாக்கன்கள் அழைப்பு) இலவசமாக இயங்குகிறது. Apache 2.0 கீழ் வெளியிடப்பட்டது — வணிக பயன்பாட்டிற்கு Free.ai இல் அனுமதிக்கப்பட்டது.

API மூலம் பயன்படுத்து

OpenAI-க்கு ஏற்ற REST API. ஒரு விசை உருவாக்கவும் இந்த மாதிரியை நொடிகளில் அழைக்கவும்.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
API ஆவணமாக்கல் API விசை பெறு

அடிக்கடி கேட்கப்படும் கேள்விகள்

mxbai-embed-large-v1 உரை ஒரு நெருக்கமான வெக்டராக மாற்றுகிறது (மிதக்கும் பட்டியலாக) அர்த்தத்தை அடைகிறது. இதை பொருள் தேடலுக்கு, குழுவாக்கலுக்கு, பரிந்துரைக்க, மீட்பு- அதிகரித்த உருவாக்கத்திற்கு (RAG) பயன்படுத்தவும், "இந்த உரை அந்த உரை போலவே உள்ளது" என்று எந்த வேலையும் முக்கியமானது.

பொதுவான அளவுகள் 384, 768, 1024, அல்லது 1536 மாதிரியைப் பொறுத்து. BGE-M3 1024-dim வெளியிடுகிறது; OpenAI Ada 1536 வெளியிடுகிறது. API பதில் அளவை உள்ளடக்கியது, எனவே உங்கள் வெக்டர் DB சரியான சுட்டுவரிசைகளை தேர்ந்தெடுக்கும்.

நவீன உட்பொதிந்த மாதிரிகள் (Free.ai ல் பெரும்பாலான விருப்பங்கள் உள்ளடக்கியது) 100+ மொழிகளில் பயிற்சி அளிக்கப்படுகிறது. மொழிகள் மீளுருவாக்கம் வேலை செய்கிறது — ஆங்கிலத்தில் தேடு, ஸ்பானிஷ் ஆவணங்களை பொருத்து.

512 முதல் 8, 192 வரையான குறிகள் மாதிரியை பொறுத்து. நீண்ட உள்ளீடுகள் வெட்டப்படும் - உட்பொதிவதற்கு முன் நீண்ட ஆவணங்களை பத்திகளாக வெட்டு.

mxbai-embed-large-v1 நமது சொந்த GPUs களில் இயங்குகிறது மற்றும் மிகவும் மலிவான கருவிகளில் ஒன்றாகும் - உங்கள் தினசரி இலவச பந்தலில் இருந்து ஒவ்வொரு அழைப்புக்கும் சுமார் ~100 டாக்கன்கள். $5 = 200K டாக்கன்கள்.

ஆம் — /v1/embeddings/ க்கு சரங்களின் பட்டியலை POST செய்யவும் மற்றும் mxbai-embed-large-v1 அதே வரிசையிலான வெக்டார்களின் பட்டியலைத் திரும்பத் தரும். கோரிக்கை ஒன்றுக்கு 2,048 வரையுள்ள தொகுப்பு அளவு.

L2- இயல்பான முன்னிருப்பு — கோசைன் ஒற்றுமை = புள்ளி விளைவு. நீங்கள் வெவ்வேறு தூர அளவீட்டுக்கு ரொட்டி வெக்டார்களை விரும்பினால் `normalize=false` ஐ கடத்து.

ஏதாவது — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1 plain JSON floats returns; the DB never sees the model.

ஆம் — POST to /v1/embeddings/ with model="mxbai-embed-large-v1". OpenAI-க்கு ஏற்ற பதில் வடிவம், எனவே ஏற்கனவே உள்ள பயனர் நூலகங்கள் மாற்றமின்றி செயல்படுகின்றன. /api/ முழு உரை உள்ளது.

தனியாக நிறுவப்பட்ட மாதிரிகள் உங்கள் உரையை எங்கள் GPUs களில் வைத்திருக்கவும் அழைப்பு திரும்பிய பிறகு அதை தவிர்க்கவும். பிரீமியம் ஒரு DPA உடன் செல்கிறது. நாங்கள் உங்கள் உள்ளீடுகளை பயிற்சி செய்ய மாட்டோம்.

தானே-தொடர்புடைய குறுந்தகவல்களுக்கு 100 மில்லிசெகண்டுகளுக்கு கீழ், பிரீமியம் 100-500 மில்லிசெகண்டுகள். தொகுப்பு அழைப்பு கிட்டத்தட்ட நேரியல் அளவு - 1,000 துண்டுகள் 2-10 விநாடிகளில் முடிகிறது.

ஆம் - Free.ai உட்பொதிப்புகளின் வணிக பயன்பாட்டை வழங்குகிறது. தயாரிப்பு தேடல், RAG குழாய்கள், பரிந்துரை முறைகள் ஒரு வெக்டார் ரியோடின்றி உருவாக்கப்படுகின்றன.

Free.ai ஐ நேசிக்கிறீர்களா?

இந்த பக்கத்தை மதிப்பீடு செய்