12、xinference部署与自定义模型

news2025/2/28 9:52:53

创建虚拟环境

conda create --name xinference python=3.10.9

激活虚拟环境

conda activate xinference

官网：https://inference.readthedocs.io/zh-cn/latest/getting_started/installation.html

pip install "xinference[transformers]"

启动服务

xinference-local --host 0.0.0.0 --port 9997

便可在本地进行运行

我们以embedding模型为例测试
下载一个本地的模型，可以在魔塔社区进行下载
https://www.modelscope.cn/models/Jerry0/text2vec-base-chinese
在这里插入图片描述

记住下载文件的路径，可以在代码中进行设置自定义的路径

#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('Jerry0/text2vec-base-chinese',cache_dir='../models')

在xinference界面选择注册模型–>embedding模型，根据实际的参数进行填写，主要是路径要写对
在这里插入图片描述
如果报错，需要去安装依赖包

 pip install sentence-transformers

安装后重新注册并launch
在这里插入图片描述

over

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2128583.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！