BGE-M3
Free.ai (self-hosted)
·
embeddings
·
~100 жетони по call
BGE-M3 is a модел уграђивања built by BAAI. Strongest at Text embeddings, semantic search. Само домаћин на Free.ai ГПУ — ради бесплатно против вашег дневног базена жетона (100 žeтона по позиву). Released under MIT — commercial use permitted on Free.ai.
Користи преко АПИ‐ а
АПИ сагласан са OpenAI‐ ом. Генеришите кључ и позовите овај модел за секунде.
curl -X POST https://api.free.ai/v1/image/generate/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"bge-m3","prompt":"your prompt here"}'
АПИ документација
Добављање АПИ кључа
Често постављана питања
BGE-M3 converts text into a dense vector (a list of floats) that captures meaning. Use it for semantic search, clustering, recommendation, retrieval-augmented generation (RAG), and any task where "is this text similar to that text" matters.
Типичне димензије су 384, 768, 1024 или 1536 у зависности од модела. BGE-M3 емитује 1024- димензије; OpenAI Ada емитује 1536. Одзив АПИ укључује димензију тако да ваш вектор ДБ бира прави индекс.
Модерни модели уграђивања (укључујући и већину опција на Free.ai) обучени су за 100+ језика. Претрага на језику — претрага на енглеском, поклапање докумената на шпанском.
512 до 8. 192 жетона у зависности од модела. Дужи улази су одсечени — делови дугих докумената у пасусе пре уграђивања.
BGE-M3 runs on our own GPUs and is among the cheapest tools — about ~100 tokens per call drawn from your daily free pool. $5 = 200K tokens.
Да — ПОСТАВИ списак низова на / v1/ убацивање / и BGE-M3 _ враћа списак вектора у истом редоследу. Партијске величине до 2. 048 по захт› јеву.
Л2- нормално — косинус сличност = производ тачке. Додај „ нормализовано=false “ ако желите сирове векторе за другачију метричку раздаљину.
Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. BGE-M3 returns plain JSON floats; the DB never sees the model.
Да — ПОСТ до / v1/ убацује / са моделом="BGE-M3 _ ". Облик одговора сагласан са OpenAI, тако да постојеће библиотеке клијента раде непром› ијењено. /api / има пуну референцу.
Само-домаћински модели задржавају текст на нашим ГПУ-овима и одбацују га након враћања позива.
Под-100м за кратак текст на премијуму, од 100 до 500 м. Пакетни позиви су приближно линеарно — 1000 парчића је завршено за 2 до 10 секунди.
Да — Free.ai дозвољава комерцијалну коришћење уграђивања.