mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 រូបិយប័ណ្ណ​ក្នុង​មួយ call
~100 រូបិយប័ណ្ណ​ក្នុង​មួយ call

mxbai-embed-large-v1 គឺជា a គំរូ​បង្កប់ ដែលបានសាងសង់ដោយ mixedbread.ai ។ ខ្លាំងបំផុតនៅ Semantic search, clustering, similarity. ។ ខ្លួនឯងបានរៀបចំនៅលើ Free.ai GPUs - រត់ដោយឥតគិតថ្លៃប្រឆាំងនឹងទឹកកាក់ប្រចាំថ្ងៃរបស់អ្នក (100 រូបិយប័ណ្ណ ក្នុង​មួយ​ការ​ហៅ) ។ ចេញផ្សាយក្រោម Apache 2.0 — ការប្រើពាណិជ្ជកម្មត្រូវបានអនុញ្ញាតនៅលើ Free.ai ។

ប្រើ​តាម​រយៈ API

OpenAI- ឆបគ្នា REST API ។ បង្កើតសោ និងហៅម៉ូដែលនេះក្នុងមួយវិនាទី ។

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
ឯកសារ API យក​សោ API

សំណួរ​ដែល​សួរ​ញឹកញាប់

mxbai-embed-large-v1 បម្លែង​អត្ថបទ​ទៅ​ជា​វ៉ិចទ័រ​ដិត (បញ្ជី​អណ្ដែត) ដែល​ចាប់​យក​ន័យ & # 160; ។ ប្រើ​វា​សម្រាប់​ការ​ស្វែងរក​សមីការ ការ​ដាក់​ជា​ក្រុម ការ​ផ្ដល់​អនុសាសន៍ ការ​បង្កើត​ការ​ទាញយក​ដែល​បាន​បង្កើន (RAG) និង​ភារកិច្ច​ណាមួយ​ដែល "អត្ថបទ​នេះ​ស្រដៀង​នឹង​អត្ថបទ​នោះ" & # 160; ។

វិមាត្រជាទូទៅគឺ 384, 768, 1024, ឬ 1536 អាស្រ័យលើម៉ូដែល។ BGE-M3 បញ្ចេញ 1024-dim; OpenAI Ada បញ្ចេញ 1536 ។ ចម្លើយតប API រួមបញ្ចូលទាំងវិមាត្រដូច្នេះ DB វ៉ិចទ័ររបស់អ្នកជ្រើសលិបិក្រមខាងស្ដាំ។

ម៉ូដែលបង្កប់សម័យទំនើប (រួមទាំងជម្រើសភាគច្រើននៅលើ Free.ai) ត្រូវបានបណ្តុះបណ្តាលលើ 100 + ភាសា. ការងារស្វែងរកភាសាឆ្លងកាត់ - ស្វែងរកនៅក្នុងភាសាអង់គ្លេស, ឯកសារផ្គូផ្គងនៅក្នុងភាសាអេស្ប៉ាញ.

512 ទៅ 8,192 សញ្ញាសម្គាល់អាស្រ័យលើម៉ូដែល។ ធាតុបញ្ចូលវែងត្រូវបានកាត់ - ឯកសារវែងចានទៅជាជំពូកមុនពេលបង្កប់។

mxbai-embed-large-v1 រត់នៅលើ GPUs ផ្ទាល់ខ្លួនរបស់យើងហើយជាផ្នែកមួយនៃឧបករណ៍ដែលមានតំលៃថោកបំផុត - អំពី ~ 100 សញ្ញាក្នុងមួយការហៅដែលបានដកស្រង់ពីទឹកដោះគោឥតគិតថ្លៃប្រចាំថ្ងៃរបស់អ្នក. $5 = 200K សញ្ញា.

បាទ - POST បញ្ជីនៃខ្សែអក្សរទៅ / v1 / embeddings / និង mxbai-embed-large-v1 ត្រឡប់បញ្ជីនៃវ៉ិចទ័រក្នុងលំដាប់ដូចគ្នា។ ទំហំ batch រហូតដល់ទៅ 2,048 ក្នុងមួយសំណើ។

L2- ធម្មតា​តាម​លំនាំដើម - ភាព​ស្រដៀងគ្នា​របស់​កូស៊ីន = ផលិតផល​ចំណុច & # 160; ។ ឆ្លងកាត់ `normalize=false` ប្រសិន​បើ​អ្នក​ចង់​វ៉ិចទ័រ​ដើម​សម្រាប់​ម៉ែត្រ​ចម្ងាយ​ផ្សេង​គ្នា & # 160; ។

ណាមួយ - Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB ។ mxbai-embed-large-v1 ត្រឡប់ទទឹង JSON ធម្មតា; DB មិនដែលឃើញម៉ូដែល។

បាទ - POST ទៅ /v1/embeddings/ ជាមួយ ម៉ូដែល =" mxbai-embed-large-v1 "។ រាងឆ្លើយតប OpenAI ឆបគ្នា, ដូច្នេះបណ្ណាល័យម៉ាស៊ីនភ្ញៀវដែលមានស្រាប់ធ្វើការមិនផ្លាស់ប្តូរ។ /api/ មានសេចក្ដីយោងពេញលេញ។

ម៉ូដែលដែលគ្រប់គ្រងដោយខ្លួនឯងរក្សាអត្ថបទរបស់អ្នកនៅលើ GPUs របស់យើងហើយបោះបង់វាបន្ទាប់ពីការហៅត្រឡប់មកវិញ។ ប្រាក់រង្វាន់ឆ្លងកាត់ជាមួយ DPA ។ យើងមិនបណ្តុះបណ្តាលលើការបញ្ចូលរបស់អ្នកទេ។

ក្រោម 100ms សម្រាប់អត្ថបទខ្លីនៅលើខ្លួនឯងបានរៀបចំ, 100-500ms លើប្រាក់រង្វាន់។ ការហៅទូរស័ព្ទដោយឡែកៗបានវិមាត្រប្រមាណជាលីនេអ៊ែរ - 1,000 chunk បញ្ចប់ក្នុង 2-10 វិនាទី។

បាទ - Free.ai ផ្តល់ការប្រើពាណិជ្ជកម្មនៃការបង្កប់. កសាងការស្វែងរកផលិតកម្ម, បំពង់ RAG, ប្រព័ន្ធផ្ដល់អនុសាសន៍ដោយគ្មានការបង់ពន្ធលើវ៉ិចទ័រ។

ស្រឡាញ់ Free.ai? ប្រាប់មិត្តភក្តិរបស់អ្នក!

វាយតម្លៃ​ទំព័រ​នេះ