在Ubuntu服务器上部署xinference

在Ubuntu服务器上部署xinference

news2026/2/12 12:09:59

一、拉取镜像

docker pull xprobe/xinference:latest

二、启动容器（GPU）

docker run -d --name xinference -e XINFERENCE_MODEL_SRC=modelscope -p 9997:9997 --gpus all xprobe/xinference:latest xinference-local -H 0.0.0.0

# 启动一个新的Docker容器
docker run
# 以分离（后台）模式运行容器
-d
# 将容器命名为"xinference"
--name xinference
# 设置环境变量，指定Xinference的主目录为容器内的
-e XINFERENCE_MODEL_SRC=modelscope 
# 将容器的9997端口映射到主机的9997端口
-p 9997:9997
# 允许容器使用主机上的所有GPU资源
--gpus all 
# 使用最新版本的xprobe/xinference镜像
xprobe/xinference:latest 
# 在容器内运行xinference-local命令，并设置主机地址为0.0.0.0（允许从任何IP地址访问）
xinference-local -H 0.0.0.0

三、访问

网址：http://localhost:9997

参考链接：

Docker 镜像 — Xinference

本地如何使用docker部署和使用Xinference_xinference docker部署-CSDN博客

Xinference本地直接安装、打开、部署、测试模型、api调用_xinference本地部署-CSDN博客

DeepSeek+Ollama+Xinference+RAGFlow+Dify部署教程，RAG落地5件套！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2337567.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

异步编程——微信小程序

异步编程——微信小程序

1. 前言引用来自：微信小程序开发中的多线程处理与异步编程_微信小程序多线程-CSDN博客微信小程序是基于JavaScript开发的，与浏览器JavaScript不同，小程序运行在WebView内部，没有多线程的概念。小程序的 JavaScript 是单线程的…

阅读更多...

STM32 四足机器人常见问题汇总

STM32 四足机器人常见问题汇总

文章不介绍具体参数，有需求可去网上搜索。特别声明：不论年龄，不看学历。既然你对这个领域的东西感兴趣，就应该不断培养自己提出问题、思考问题、探索答案的能力。提出问题：提出问题时，应说明是哪款产品&a…

阅读更多...

Windows 下实现 PHP 多版本动态切换管理（适配 phpStudy）+ 一键切换工具源码分享

Windows 下实现 PHP 多版本动态切换管理（适配 phpStudy）+ 一键切换工具源码分享

🚀 Windows 下实现 PHP 多版本动态切换管理（适配 phpStudy） 一键切换工具源码分享 📦 工具特点🧪 效果展示🧱 环境要求🧑‍💻 源码展示：php_switcher.py🛠 打…

阅读更多...

ReportLab 导出 PDF（图文表格)

ReportLab 导出 PDF（图文表格)

ReportLab 导出 PDF（文档创建） ReportLab 导出 PDF（页面布局） ReportLab 导出 PDF（图文表格) 文章目录 1. Paragraph（段落）2. Table（表格）3. VerticalBarChart&#xff0…

阅读更多...

yolov8复现

yolov8复现

Yolov8的复现流程主要包含环境配置、下载源码和验证环境三大步骤： 环境配置查看电脑状况：通过任务管理器查看电脑是否有独立显卡（NVIDIA卡）。若有，后续可安装GPU版本的pytorch以加速训练；若没有&#xff0…

阅读更多...

RestSharp和Newtonsoft.Json结合发送和解析http

RestSharp和Newtonsoft.Json结合发送和解析http

1.下载RestSharp和Newtonsoft.Json 2编写ApiRequest和ApiResponse和调用工具类HttpRestClient 请求模型 /// <summary>/// 请求模型/// </summary>public class ApiRequest{/// <summary>/// 请求地址/api路由地址/// </summary>public string Route {…

阅读更多...

【Pytorch之一】--torch.stack()方法详解

【Pytorch之一】--torch.stack()方法详解

torch.stack方法详解 pytorch官网注释 Parameters tensors：张量序列，也就是要进行stack操作的对象们，可以有很多个张量。 dim：按照dim的方式对这些张量进行stack操作，也就是你要按照哪种堆叠方式对张量进行堆叠。dim的…

阅读更多...

数据中台（大数据平台）之数据资源目录

数据中台（大数据平台）之数据资源目录

数据资源目录是数据管理的账本，是数据应用的基础，更是是数据治理成果的体现，因此数据中台产品应提供数据资源目录编制、发布、资源挂载、下架的管理能力。 1.数据资源目录分类资源目录能够支持基于业务特点创建和维护基础目录分类和特色目…

阅读更多...

【随身WiFi】随身WiFi Debian系统优化教程

【随身WiFi】随身WiFi Debian系统优化教程

0.操作前必看本教程基于Debian系统进行优化，有些操作对随身WiFi来说可能会带来负优化，根据需要选择。所有操作需要在root用户环境下运行，否则都要加sudo 随身wifi Debian系统，可以去某安的随声WiFi模块自行搜索刷机点赞&am…

阅读更多...

JAVA Web_定义Servlet2_学生登录验证Servlet

JAVA Web_定义Servlet2_学生登录验证Servlet

题目页面StudentLogin.html中有一HTML的表单代码如下： <form action"studentLogin" method"post">学生姓名：<input type"text" name"stuName" value""><br>登录密码：…

阅读更多...

Unity入门笔记(缘更)

Unity入门笔记(缘更)

内容来源SiKi学院的Luna’s Fantasy 文章目录一、基础知识1.准备2.基础知识1.层级(Layer)2.轴心点3.预制体(Prefab)4.刚体组件(Rigidbody)5.碰撞器组件(BoxCollider) 二、代码1.移动一、基础知识 1.准备 Unity安装： https://unity.cn 2.基础知识 1.层级(Layer…

阅读更多...

【Python】用Python写一个俄罗斯方块玩玩

【Python】用Python写一个俄罗斯方块玩玩

【Python】用Python写一个俄罗斯方块玩玩一、引言1.成品效果展示二、思考准备1.思考设计2.代码设计2.1 游戏页面2.2 控件设计2.2.1 方块生成2.2.2 方块碰撞2.2.3 方块消融2.2.4 游戏主循环2.2.5 游戏窗口三、游戏完整版一、引言今日看到侄子在玩游戏，凑近一看…

阅读更多...

记录一次生产中mysql主备延迟问题处理

记录一次生产中mysql主备延迟问题处理

登录库： mysql -uXXXX -pXXXX -P3306 -hXXXXXX -A 备库上执行：show slave status\G 查看 seconds_Behind_Master，延迟 2705s，而且还一直在增加。 SHOW CREATE TABLE proc_i_income_temp; -- 查看表的结构 show index from proc…

阅读更多...

ffmpeg无损转格式的命令行

ffmpeg无损转格式的命令行

将ffmpeg.exe拖入命令行窗口 c:\users\zhangsan>D:\ffmpeg-2025-03-11\bin\ffmpeg.exe -i happy.mp4 -c:v copy -c:a copy 格式转换后.mkv -c:v copy 仅做拷贝视频,不重新编码 -c:a copy 仅做拷贝音频 ,不重新编码

阅读更多...

强化学习算法系列（五）：最主流的算法框架——Actor-Critic算法框架

强化学习算法系列（五）：最主流的算法框架——Actor-Critic算法框架

强化学习算法 （一）动态规划方法——策略迭代算法(PI)和值迭代算法(VI) （二）Model-Free类方法——蒙特卡洛算法(MC)和时序差分算法(TD) （三）基于动作值的算法——Sarsa算法与Q-Learning算法 （四…

阅读更多...

设计模式(结构型)-桥接模式

设计模式(结构型)-桥接模式

目录摘要定义类图角色具体实现优缺点优点缺点使用场景使用案例 JDBC 和桥接模式总结摘要在软件开发领域，随着系统规模和复杂性的不断攀升，如何设计出具有良好扩展性、灵活性以及可维护性的软件架构成为关键挑战。桥接模式作为一…

阅读更多...

【MySQL】MySQL数据库 —— 简单认识

【MySQL】MySQL数据库 —— 简单认识

目录 1. 数据库的介绍 1.1 什么是数据库 1.2 数据库和数据结构之间关系 2. 数据库分类 2.1 关系型数据库（RDBMS） 2.2 非关系型数据库 2.3 区别一些行内名词简单解释： 3. 关于mysql 主要学什么 4. MySQL中重要的概念 4.1 概念 4…

阅读更多...

RNN - 语言模型

RNN - 语言模型

语言模型给定文本序列 x 1 , … , x T x_1, \ldots, x_T x1,…,xT，语言模型的目标是估计联合概率 p ( x 1 , … , x T ) p(x_1, \ldots, x_T) p(x1,…,xT)它的应用包括做预训练模型（eg BERT，GPT-3）生成本文&#xff…

阅读更多...

$过拟合、归一化、正则化、鞍点$

过拟合、归一化、正则化、鞍点

过拟合过拟合的本质原因往往是因为模型具备方差很大的权重参数。定义一个有4个特征的输入，特征向量为,定义一个模型，其只有4个参数，表示为。当模型过拟合时，这四个权重参数的方差会很大，可以假设为。当经过这个模型后…

阅读更多...

【python画图】：从入门到精通绘制完美柱状图

【python画图】：从入门到精通绘制完美柱状图

目录 Python数据可视化：从入门到精通绘制完美柱状图一、基础篇：快速绘制柱状图1.1 使用Matplotlib基础绘制1.2 使用Pandas快速绘图二、进阶篇：专业级柱状图定制2.1 多系列柱状图2.2 堆叠柱状图2.3 水平柱状图三、专业参数速查表Matplotlib …

阅读更多...

推荐文章

最新文章