怎么在Windows操作系统部署阿里开源版通义千问(Qwen2)

news2024/11/15 21:21:22

怎么在Windows操作系统部署阿里开源版通义千问(Qwen2)

| 原创作者/编辑:凯哥Java | 分类:人工智能学习系列教程

添加图片注释,不超过 140 字(可选)

GitHub上qwen2截图

随着人工智能技术的不断进步,阿里巴巴通义千问团队近期发布了Qwen2系列开源模型,这一系列模型在多个领域展现出卓越的性能,特别是在自然语言理解、知识、代码、数学及多语言等能力上均显著超越当前领先的模型。本文将详细介绍如何在Windows操作系统上部署阿里开源版通义千问(Qwen2)模型,快速上手并体验这一强大的AI工具。

一、准备工作

在开始部署之前,请确保您的Windows系统满足以下要求:

1. 系统兼容性:确保您的Windows系统版本支持所需的软件安装。

2. 显卡驱动:如果您的计算机配备了独立显卡,请确保显卡驱动是最新的,以便更好地支持模型运行。

3. 硬盘空间:Qwen2模型文件较大,需要足够的硬盘空间来存储。

凯哥使用的电脑配置:

CPU:I7-12700F

内存:32GB

显卡:RTX3060 12G

添加图片注释,不超过 140 字(可选)

cpu和内存

添加图片注释,不超过 140 字(可选)

显卡

二、下载并安装Ollama

Ollama是一个用于运行大型AI模型的工具,支持多种模型格式,包括Qwen2。首先,您需要从Ollama的官方网站下载并安装Ollama。

  1. 访问Ollama官网:进入Ollama官网(https://ollama.com/download/windows)。

2. 下载并安装:点击“Download”按钮,选择Windows版本进行下载。下载完成后,按照提示进行安装。

这里凯哥就选择Windows版本的。

添加图片注释,不超过 140 字(可选)

ollama官网下载页面

三、下载Qwen2模型

接下来,您需要从阿里通义千问的官方仓库下载Qwen2模型。

1. 访问官方教程:访问Qwen2官方教程(实际链接以官方提供为准)。

https://qwen.readthedocs.io/zh-cn/latest/

2. 选择适合的模型:根据您的硬件条件(如显卡显存大小),选择适合的Qwen2模型版本。在官方教程中,拉到最下面,可以看到效率评估。如下图:

添加图片注释,不超过 140 字(可选)

找到效率评估

因为凯哥的显卡是12GB,所以凯哥选择Qwen2-7B-Instruct。如果你的显卡也是12GB,可以选择Qwen2-7B-Instruct版本。

添加图片注释,不超过 140 字(可选)

Qwen2-7B-Instruct不同版本内存占用

凯哥使用的下载地址:https://modelscope.cn/models/qwen/Qwen2-7B-Instruct-GGUF/files

3. 下载模型文件:在官方教程中,找到模型下载链接,下载对应的.gguf文件。注意,模型文件可能包含多个精度版本(如q8、q16等),选择适合您需求的版本。

说明:

会看到不同的后缀,q”+ 用于存储权重的位数(精度)+ 特定变体,数字越大性能越强。

数字越大,精度越高,k是在所有的attention和feed_forward张量上将精度提升2位,m是在一半的attention和feed_forward张量上将精度提升2位。

根据自己的需求选择模型,凯哥这里直接选了q8。

添加图片注释,不超过 140 字(可选)

凯哥选择的q8

四、部署Qwen2模型

下载完模型文件后,您可以使用Ollama来部署Qwen2模型。

1. 创建模型文件:在Windows上创建一个新文件夹(例如命名为“qwen”),将下载的.gguf文件放入该文件夹中。然后,在该文件夹内创建一个名为“Modelfile”的文本文件,内容填写为:

 
 

FROM ./qwen2-7b-instruct-q8_0.gguf

注意替换文件名以匹配您下载的模型文件。

2. 使用Ollama创建模型:打开命令行工具(如CMD或PowerShell),切换到包含Modelfile的文件夹。运行以下命令来创建Qwen2模型:

添加图片注释,不超过 140 字(可选)

模型创建成功

如果显示“success”,则表示模型创建成功。

3. 运行模型:创建成功后,您可以通过以下命令来运行模型:

 
 

ollama run Qwen2-7B

此时,您应该能看到一个对话框或命令行界面,您可以在这里输入文本与模型进行交互。

添加图片注释,不超过 140 字(可选)

命令行输入文案地方

在这里输入:你是谁?看看模型怎么交互的。

可以看到模型交互如下:

添加图片注释,不超过 140 字(可选)

模型交互效果

补充说明: 如果要看本地有哪些大模型:ollama list

如果要删除这个模型的话:ollama rm xxx

如果要看运行了哪些大模型:ollama ps

运行结果:

添加图片注释,不超过 140 字(可选)

运行效果

五、在Web界面中运行Qwen2

虽然直接在命令行中运行模型很方便,但为了获得更好的用户体验,您可以将Qwen2模型集成到Web界面中。

1. 安装Node.js:

首先,需要在Windows上安装Node.js。访问Node.js官网,下载并安装最新版本的Node.js。

凯哥使用的是版本号是18.6

添加图片注释,不超过 140 字(可选)

凯哥本地node版本

2. 下载ollama-webui:

从GitHub或其他源下载ollama-webui的代码。

 
 

https://github.com/ollama-webui/ollama-webui-lite

3. 设置并启动Web界面:

按照ollama-webui的文档说明,设置Node.js环境,安装依赖,并启动Web服务器。然后,在浏览器中打开Web页面,选择您的Qwen2模型即可开始对话。

3.1镜像提速:

入ollama-webui文件夹,设置国内镜像源提速:

 
 

npm config set registry http://mirrors.cloud.tencent.com/npm/

3.2 安装依赖

 
 

npm install

错误解决办法:

如果报错说要audit,则依次进行即可:

 
 

npm audit

添加图片注释,不超过 140 字(可选)

启动

3.3 启动Web界面:

命令执行完成就可以用看到如下图的访问地址:

添加图片注释,不超过 140 字(可选)

启动成功输出访问地址

打开Web页面,选择你的模型即可开始对话:

添加图片注释,不超过 140 字(可选)

访问页面

通过web和模型进行交互:

我们依然输入:你是谁?

添加图片注释,不超过 140 字(可选)

在web也没和模型交互效果

好了,至此,你就可以在自己电脑上和模型进行对话了。

大家好:我是凯哥Java(kaigejava),如果大家感兴趣,可以一起学学AI。

六、总结

通过以上步骤,您可以在Windows操作系统上成功部署阿里开源版通义千问(Qwen2)模型,并通过命令行或Web界面与模型进行交互。Qwen2系列模型凭借其卓越的性能和广泛的应用场景,将为您的AI项目提供强大的支持。

希望本文能帮助您顺利部署阿里开源版通义千问模型,享受AI技术带来的便利与乐趣。如有任何疑问,请随时查阅官方文档或寻求技术支持。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2095896.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【华为】轻松get!eNSP登录无线AC Web界面的新姿势

【华为】轻松get!eNSP登录无线AC Web界面的新姿势 无线AC:web界面实验准备华为云配置01 拉取设备02添加UDP端口03再添加VMnet1(VMnet8 也行)网段连接AC的端口04最后设置端口映射 无线AC配置01拉取AC设备和连接华为云02配置AC的g0/0/1端口(SVI…

AI时代,需要什么样的服务器操作系统?

文|刘俊宏 编|王一粟 AI时代,中国的服务器系统正在面临一场双重挑战。 今年6月底,最主流的开源服务器操作系统CentOS正式停服,找一个合适的操作系统进行迁移成为了必选项。同时,AI时代的到来&#xff0c…

笔记:《利用Python进行数据分析》之数据聚合

观前提示:这节内容不多,但难度较大,尤其是要能熟练运用时很不容易的 数据聚合 聚合指的是任何能够从数组产生标量值的数据转换过程。之前的例子已经用过一些,比如mean、count、min以及sum等。你可能想知道在GroupBy对象上调用me…

网络原理 - 初识

文章目录 局域网(LAN)广域网(WAN)网络设备IP地址格式 端口号格式 认识网络协议协议分层 OSI七层模型(只是理论,没有实际运用)TCP/IP五层(或四层)模型网络设备所在分层 封装和分用 计算机之间通过网络来传输数据,也称为网络通信。 根据网络互连…

AI问答:.NET核心组成概要、程序运行步骤和查询SDK版本的方法

.NET三大组成 ①Runtime (运行时): CLR:公共语言运行时,执行程序、内存管理、垃圾回收(GC)、安全性检查、异常处理,是跨平台的关键要素。 JIT:实时编译器,将中间语言…

JDBC与数据库之间的操作(增删改查、获取主键、业务逻辑分离、属性文件配置)

参考视频哔哩哔哩 1、Service和Servicelmpl的概念 java中service和servicelmpl是常见的代码组织方式 Service是指业务逻辑的接口,定义了系统对外提供的功能。Servicelmpl是Service接口的具体实现,实现了具体的业务逻辑。 Service和Servicelmpl的好处…

Android自定义View实现不同朝向字体变色

实现效果: 1.一个文字两种颜色 2.实现不同朝向 3.结合ViewPager 思路:TextView可行?系统提供的只能够显示一种颜色,需要自定义View extends TextView:onMeasure()不需要实现 textColor颜色,textSize字体大小…

OpenAI Whisper API (InvalidRequestError)

题意: OpenAI Whisper API(无效请求错误) 问题背景: Im trying to use OpenAI Whisper API to transcribe my audio files. When I run it by opening my local audio files from disk, it worked perfectly. Now Im developing a FastAPI e…

学习WebGl基础知识(二)

学习目标&#xff1a; 掌握WebGl基础知识 学习内容&#xff1a; 创建一个Webgl程序 创建三维上下文对象创建顶点着色器和片元着色器创建和编译顶点着色器和片元着色器创建着色器程序对象绘制图元 创建一个Webgl程序 1.第一步获取画布&#xff0c;创建三维上下文对象 <ca…

一些硬件知识(十七)

电源芯片选型&#xff1a; 1.考虑拓扑结构 2.考虑功率&#xff0c;从而决定自行搭建电路还是选择芯片 3.对于低功耗产品&#xff0c;静态电流是非常重要的因素&#xff0c;一定重要考虑&#xff1a; 同步buck省去了续流二极管&#xff0c;效率比异步的高。 如果真的比耐压值…

ESP32小车:1.硬件模块与连接

一、硬件模块 总的元器件清单:亚克力板(三轮),两个普通减速电机,一个开关模块,一个 首先,需要一块亚克力单层底板,推荐随便在淘宝上买一块2WD亚克力单层板,比如: 最好亚克力板自带电机,买一套也不过15块。如果没有需另外购买两个普通TT直流减速电机和轮子。…

基于yolov8的102种昆虫检测系统python源码+onnx模型+评估指标曲线+精美GUI界面

【算法介绍】 基于YOLOv8的102种昆虫检测系统是一款高效、准确的昆虫识别工具&#xff0c;它利用YOLOv8这一先进的目标检测算法&#xff0c;实现了对102种不同昆虫的实时检测与识别。该系统在农业、生态研究、生物多样性保护等多个领域具有广泛的应用价值。 YOLOv8算法以其高…

HTML沙漏爱心

目录 写在前面 完整代码 下载代码 代码分析 系列文章 写在最后 写在前面 教你用HTML语言实现炫酷的沙漏爱心,该代码不仅可以用电脑运行,手机、平板也可以直接运行哦。 完整代码 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"><…

【Linux】:文件IO

目录 1.C文件接口 1.1 当前路径是什么&#xff1f; 1.2 "w"和"a"​编辑 2.系统文件I/O 2.1 "比特宏"标识符的实现: 2.2 open 1.系统默认创建文件的权限只写 2.设置新建文件的权限 3. 覆盖写/清空写/追加写 3.访问文件的本质 3.1 文件…

茴香豆Web实践

茴香豆 是由书生浦语团队开发的一款开源、专门针对国内企业级使用场景设计并优化的知识问答工具。 茴香豆特点&#xff1a; 三阶段 Pipeline &#xff08;前处理、拒答、响应&#xff09;&#xff0c;提高相应准确率和安全性 打通微信和飞书群聊天&#xff0c;适合国内知识问…

提高工作效益方法(一)

目录 如何提高工作效率? 如何提高工作效率?&#xff08;每日工作安排&#xff09; 怎么在职场做好时间管理&#xff1f; 如何提高工作效率? 提高工作效率的关键在于采用一系列策略和方法&#xff0c;以确保工作能够高效、有序地进行。通过这些方法&#xff0c;可以有效地提…

【whisper】使用whisper实现语音转文字

whisper需要ffmpeg支持 官网下载ffmpeg https://www.gyan.dev/ffmpeg/builds/下载完毕后解压放到合适的位置 添加环境变量 在cmd中输入以下 ffmpeg -version出现下面结果代表成功 安装whisper pip install openai-whisper在vscode中运行 测试代码 import whisperif __n…

【c++】cout打印char * 或者char[]的细节详解

目录 char* 类型 1.打印指向的字符串 2.打印指针指向的地址 问题描述 解决方法 char型数组 1. 想要输出字符串 2. 想输出字符数组的地址 printf 和cout 的对比 1.打印首字符 2.打印字符串 3.打印字符串首地址 &#x1f497;感谢阅读&#xff01;&#x1f497; char*…

新火种AI|减脂增肌没捷径?对不起,那是AI 出现以前的事情了...

作者&#xff1a;小岩 编辑&#xff1a;彩云 对于很多人来说&#xff0c;“拥有完美的身材”是人生的重要目标之一&#xff0c;练出好身材的人也会以此为傲&#xff0c;会把自己的好身材po到社交媒体上。换个角度来说&#xff0c;为了让自己社交媒体上的形象足够完美&#xf…

Axure RP下载+详细安装步骤资源百度云盘分享

众所周知&#xff0c;Axure全称“axure rp”&#xff0c;是一款专业的快速原型设计工具。 它能帮助网站需求设计者&#xff0c;快捷而简便的创建基于网站构架图的带注释页面示意图、操作流程图、以及交互设计&#xff0c;并可自动生成用于演示的网页文件和规格文件&#xff0c…