Mac M2 本地下载 Xinference

Mac M2 本地下载 Xinference

news2025/4/14 18:50:11

想要在Mac M2 上部署一个本地的模型。看到了Xinference 这个工具

一、Xorbits Inference 是什么

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

本地部署参考了这两个文档

部署文档

欢迎来到 Xinference！ — Xinference

部署文档

接入 Xinference 部署的本地模型 | 中文 | Dify

二、本地部署

安装命令

pip install xinference

安装成功

硬件加速

CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python

安装成功

启动（启动的时候，指定从魔搭上拉取模型。注意这里，国内的话用魔搭拉取会顺畅一些，国外的话可以不指定，取huggingface上去拉去模型）

XINFERENCE_MODEL_SRC=modelscope xinference-local --host 0.0.0.0 --port 9997

本地访问

http://0.0.0.0:9997

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1637780.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【已解决】pandas读excel中长数字变成科学计数法的问题

【已解决】pandas读excel中长数字变成科学计数法的问题

pandas 读excel中的长数字时，即使excel中已经设置为文本，读进df后也会自动变成科学计数法。在日常的数据分析和处理工作中，Excel和pandas是数据分析师们不可或缺的得力助手。然而，在使用pandas读取Excel文件时，我们有…

阅读更多...

基于残差神经网络的汉字识别系统+pyqt前段界面设计

基于残差神经网络的汉字识别系统+pyqt前段界面设计

研究内容: 中文汉字识别是一项具有挑战性的任务，涉及到对中文字符的准确分类。在这个项目中，目标是构建一个能够准确识别中文汉字的系统。这个任务涉及到数据集的收集、预处理、模型训练和评估等步骤。尝试了使用残差神经网络（ResNet&#x…

阅读更多...

Rust Rocket创建第一个hello world的Web程序 Rust Rocket开发常用网址和Rust常用命令

Rust Rocket创建第一个hello world的Web程序 Rust Rocket开发常用网址和Rust常用命令

一、Rust Rocket简介 Rust Rocket 是一个用 Rust 语言编写的 Web 应用框架，它结合了 Rust 的安全性和性能优势，以及 Web 开发的便利性。以下是 Rust Rocket 框架的一些优点： 安全性：Rust 是一种注重安全性的编程语言，…

阅读更多...

【前端探索者：从零到精通的Web前端实战专栏】

【前端探索者：从零到精通的Web前端实战专栏】

🚀 在这个代码编织梦想的时代，Web前端作为互联网的颜值担当，正以日新月异的速度重塑数字世界。想要在前端江湖里游刃有余，你需要的不仅仅是一把锋利的剑，更是一套完整的武功秘籍！今天，我们就为你揭开【Web前端】专栏的神秘面纱，带你从菜鸟到大神，一飞冲天！ 📚 专栏…

阅读更多...

Text-to-SQL小白入门（12）Awesome-Text2SQL开源项目star破1000

Text-to-SQL小白入门（12）Awesome-Text2SQL开源项目star破1000

项目介绍项目地址 23年9月份刚开源这个项目，大半年过去了，star数终于破1000啦，决定在知乎更新一下内容，看看内容变化，知乎有上当时项目介绍的链接：追光者：Text-to-SQL小白入门（六&…

阅读更多...

【Qt QML】Frame组件

【Qt QML】Frame组件

Frame（框架）包含在： import QtQuick.Controls继承自Pane控件。用于在可视框架内布局一组逻辑控件。简单来说就是用来包裹和突出显示其他可视元素。Frame不提供自己的布局，但需要自己对元素位置进行设置和定位，例如通过…

阅读更多...

Spring Boot Admin

Spring Boot Admin

概述 Spirng Boot Admin 登录页面 Spring Boot Admin是一个用于管理Spring Boot应用的监控工具,它允许你查看和管理多个Spring Boot应用实例。用于应用信息进行界面化的展示，常常辅助我们开发人员快速查看服务运行状态在微服务架构中，Spring Boot Admin通…

阅读更多...

【linux】进程（深入理解linux进程状态）

【linux】进程（深入理解linux进程状态）

开始之前先说一个与本文无关的小知识，chdir命令可以更改当前进程的工作目录哦。目录 linux具体进程状态：R && S：T && t：D：僵尸进程 && 孤儿进程： OS的理论线：运行&…

阅读更多...

JMeter性能压测脚本录制

JMeter性能压测脚本录制

第一步：电脑打开控制面板设置代理服务器第二步：jmeter的测试计划添加一个HTTP（S）脚本记录器在脚本记录器里配置好信息，然后保存为脚本文件（.*表示限定） 此方框内容为项目地址（可改…

阅读更多...

如何安装cuda版本的torch-sparse和torch-scatter

如何安装cuda版本的torch-sparse和torch-scatter

安装对应cuda版本的torch，确保cuda可用使用nvidia-smi查看cuda版本，我的是11.4，然后就找到pytorch历史版本，页面搜索cuda 11.4，没搜到，继续往小版本搜，搜到cuda 11.3，果断安装&…

阅读更多...

日拱一卒，月进一步（10）

日拱一卒，月进一步（10）

303. 区域和检索 - 数组不可变 - 力扣（LeetCode） 动态规划~ 前缀和最朴素的思想是存储数组nums的值，每次调用sumRange时，通过循环的方法计算数组nums从下标i到下标j的元素和，需要计算j-i1个元素的和。由于每次检索…

阅读更多...

Sobel算法：边缘提取的原理与实践【基于python、C++基于opencv的代码实现！！】

Sobel算法：边缘提取的原理与实践【基于python、C++基于opencv的代码实现！！】

Sobel算法：深入解析边缘检测的原理与实现在图像处理领域，边缘检测是一项至关重要的任务。其中，Sobel算法以其高效和稳定的性能，成为边缘检测中的常用方法之一。本文将深入解析Sobel算法的原理与实现，带您了解如何通过…

阅读更多...

02_机器学习算法_基于XGBoost的分类预测

02_机器学习算法_基于XGBoost的分类预测

1. XGBoost 算法 1.1 XGBoost 的介绍 XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型，而是一个可供用户轻松解决分类、回归或排序问题的软件包。它内部实现了梯度提升树(GBDT)模型，并对模型中的算法进行了诸多…

阅读更多...

通过先序和中序求后序（通过后序和中序求先序）

通过先序和中序求后序（通过后序和中序求先序）

一、通过先序和中序求后序二、通过后序和中序求后序 1、利用后序和中序的特点来求出二叉树 2、后序输出二叉树如图，先给了一个后序和中序，后序的最后一个为根节点然后在中序中查找相同的元素，在这个元素左边的为左子树，右…

阅读更多...

最简方式安装oracle 23c free

最简方式安装oracle 23c free

简介我一直认为，最靠谱的文档就是原厂官网的文档，阅读再次加工的文档都有可能把你带偏。 oracle官网提供了大量的文档，一个好的oracle使用者，应该首先是好的oracle官网阅读者。 oracle数据库作为收费颇贵的商业数据库软件&#…

阅读更多...

C++ 优先级队列priority_queue

C++ 优先级队列priority_queue

1、常用接口底层使用的是堆实现，默认为大堆 2、理解： 优先级队列就是即使插入的是一个乱序的，但是依旧会按照有序的顺序出队列优先级队列就是会根据大小来出队列，而不是谁在队头就出谁。优先级队列底层是使用堆实现&#x…

阅读更多...

Android Studio Jellyfish | 2023.3.1，快来看看有什么更新吧

Android Studio Jellyfish | 2023.3.1，快来看看有什么更新吧

大家节日快乐，在这个快乐的节日里，Android Studio 又迎来了它新一轮更新，虽然本次更新里有一大份和我们“没什么关系”，但是也许你的“网络”支持呢？一起来感受下全新的 Jellyfish （水母） 给我们…

阅读更多...

使用Python及R语言绘制简易数据分析报告

使用Python及R语言绘制简易数据分析报告

Pytohn实现在python中有很多包可以实现绘制数据分析报告的功能，推荐两个较为方便的包：pandas-profiling 和 sweetviz 。使用 pandas-profiling 包（功能全面） 这个包的个别依赖包与机器学习的 sklearn 包的依赖包存在版本冲突&a…

阅读更多...

Upload-labs 靶场通关解析（上）

Upload-labs 靶场通关解析（上）

前言文件上传漏洞是一种常见的网络安全漏洞，存在于许多Web应用程序中。攻击者利用这个漏洞可以上传恶意文件到目标服务器，从而执行各种恶意操作，如执行恶意代码、获取敏感信息、控制服务器等。文件上传漏洞的原理是，Web应用程…

阅读更多...

商超物联网方案-Hotspot Service和客流分析方案概述

商超物联网方案-Hotspot Service和客流分析方案概述

商超物联网方案-Hotspot Service和客流分析方案概述场景概述大型商场、大型综合体在相互竞争及线上消费的影响下，利润增长缓慢，迫切需要通过提供个性化服务提升顾客购物体验，促进利润增长。向不同顾客推送其感兴趣的广告，不仅…

阅读更多...

推荐文章

最新文章