mxbai-embed-large-v1

Free.ai (self-hosted) · embeddings · ~100 토큰당 call
~100 토큰당 call

mxbai-embed-large-v1 는 a 임베딩 모델 로 mixedbread.ai 에 의해 만들어졌습니다. 프리미엄 Free.ai GPU에서 자체 호스팅 — 일일 토큰 풀(100 토큰 통화당)에서 무료로 실행됩니다. Apache 2.0에 의해 배포 — Free.ai에서 상업적 사용이 허용됩니다.

API를 통해 사용

OpenAI 호환 REST API. 키를 생성하고 몇 초 만에 이 모델을 호출합니다.

curl -X POST https://api.free.ai/v1/image/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"mxbai-embed-large-v1","prompt":"your prompt here"}'
API 문서화 API 키 가져오기

자주 묻는 질문

mxbai-embed-large-v1 는 텍스트를 의미를 포착하는 밀집된 벡터(부동수의 목록)로 변환합니다. 의미 검색, 클러스터링, 추천, 검색 증강 생성(RAG), 그리고 "이 텍스트가 그 텍스트와 유사한가"가 중요한 모든 작업에 사용합니다.

일반적인 차원은 모델에 따라 384, 768, 1024 또는 1536입니다. BGE-M3 은 1024-dim 을 발생시키고 OpenAI Ada 는 1536 을 발생시킵니다. API 응답에는 차원이 포함되므로 벡터 DB가 올바른 인덱스를 선택합니다.

현대적인 임베디드 모델(Free.ai의 대부분의 옵션 포함)은 100개 이상의 언어로 훈련되어 있습니다. 언어간 검색 작업 — 영어로 검색, 스페인어로 문서를 일치시킵니다.

모델에 따라 512에서 8,192 토큰까지. 긴 입력은 잘라집니다. 긴 문서를 임베딩하기 전에 단락으로 분할합니다.

mxbai-embed-large-v1는 우리의 GPU에서 실행되며 가장 저렴한 도구 중 하나입니다. 일일 무료 풀에서 콜당 약 100 토큰을 얻을 수 있습니다. $5 = 200K 토큰.

Yes — /v1/embeddings/ 에 문자열 목록을 POST하고 mxbai-embed-large-v1 는 동일한 순서로 벡터 목록을 반환합니다. 요청당 최대 2,048개의 배치 크기.

기본적으로 L2 정규화 — 코사인 유사도 = 점 곱. 다른 거리 측정법에 대한 원시 벡터를 원한다면 `normalize=false`를 전달하십시오.

Any — Pinecone, Weaviate, Qdrant, Chroma, pgvector, FAISS, LanceDB. mxbai-embed-large-v1은 일반 JSON 부동수를 반환하며, DB는 모델을 절대로 볼 수 없습니다.

예 — model="mxbai-embed-large-v1"을 사용하여 /v1/embeddings/로 POST합니다. OpenAI 호환 응답 형태, 기존 클라이언트 라이브러리가 변경되지 않고 작동합니다. /api/에는 전체 참조가 있습니다.

셀프 호스팅 모델은 텍스트를 GPU에 저장하고 호출이 돌아온 후 버립니다. 프리미엄은 DPA를 통해 통과합니다.

셀프 호스팅에서 짧은 텍스트에 대해 100ms 미만, 프리미엄에서 100-500ms. 일괄 호출은 대략 선형적으로 확장되며 1,000개의 덩크가 2-10초 내에 완료됩니다.

예 — Free.ai은 임베딩의 상업적 사용을 허용합니다. 벡터당 로열티 없이 생산 검색, RAG 파이프라인, 추천 시스템을 구축할 수 있습니다.

Love this tool? Share it!

이 페이지 평가하기