47  
查询码: 00000099
mr使用xinference部署text embedding模型
专家 作者: 宋美霞 于 2024年12月19日 ,于 2025年05月14日 编辑


确保docker已安装

下载模型

apt-get install git-lfs 或者yum install git-lfs 

cd /home

mkdir models

cd /home/models

git clone https://www.modelscope.cn/BAAI/bge-m3.git

git clone https://www.modelscope.cn/AI-ModelScope/m3e-large.git


导入4.2base镜像

通过SFTP下载,SFTP地址、密码联系天数工程师

get /MR_4.2.0/x86/sdk/corex-docker-installer-4.2.0-10.2-ubuntu20.04-py3.10-x86_64.run /home

get /MR_4.2.0/x86/apps/py3.10/transformers-4.45.2+corex.4.2.0-py3-none-any.whl /home

安装base镜像

bash corex-docker-installer-4.2.0-10.2-ubuntu20.04-py3.10-x86_64.run --silent --disable-dkms

启动容器

docker run --shm-size="32g" -it -v /usr/src:/usr/src -v /lib/modules:/lib/modules -v /dev:/dev -v /home:/home --name=test -p 9997:9997 --privileged --cap-add=ALL --pid=host corex:4.2.0

安装inference库

pip3 install xinference[transformers,vllm]==1.3.1.post1 -i https://pypi.tuna.tsinghua.edu.cn/simple

pip3 uninstall opencv-python -y

pip3 install sentence-transformers

pip3 install /home/transformers-4.45.2+corex.4.2.0-py3-none-any.whl

启动xinference服务

xinference-local --host 0.0.0.0 --port 9997

注册模型

cd /home/models

vim bge_m3.json 

{     "model_name": "bge-m3-local",     "dimensions": 1024,     "max_tokens": 8192,     "language": ["en","zh"],     "model_id": "BAAI/bge-m3",     "model_uri": "/home/models/bge-m3" }


vim m3e_large.json

{     "model_name": "m3e-large-local",     "dimensions": 1024,     "max_tokens": 512,     "language": ["en","zh"],     "model_id": "moka-ai/m3e-large",     "model_uri": "/home/models/m3e-large" }

xinference register --model-type embedding --file bge_m3.json --persist
xinference register --model-type embedding --file m3e_large.json --persist

启动模型

cd /home/models

xinference launch --model-name bge-m3-local --model-type embedding
xinference launch --model-name m3e-large-local --model-type embedding

简易测试

curl -X 'POST' \
  'http://0.0.0.0:9997/v1/embeddings' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '  {     "model": "bge-m3-local",     "input": "What is the capital of China?"   }

'


curl -X 'POST' \
  'http://0.0.0.0:9997/v1/embeddings' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '

{     "model": "m3e-large-local",     "input": "What is the capital of China?"   }

'

如果有需要的话,注销模型

xinference unregister --model-type embedding --model-name bge-m3-local
xinference unregister --model-type embedding --model-name m3e-large-local
笔记



  目录
    天数智芯知识库系统 -V 5.2.6 -wcp