通义千问 Qwen-7B-Chat-Int4 模型本地化部署

通义千问 Qwen-7B-Chat-Int4 模型本地化部署

news2026/2/14 14:08:14

如需在本地或离线环境下运行本项目，需要首先将项目所需的模型下载至本地，通常开源 LLM 与 Embedding 模型可以从 HuggingFace 下载。

以本项目中默认使用的 LLM 模型 THUDM/ChatGLM2-6B 与 Embedding 模型 moka-ai/m3e-base 为例：

下载模型需要先安装 Git LFS，然后运行

参考：通义千问部署搭建_代码浪人的博客-CSDN博客

git clone https://www.modelscope.cn/qwen/Qwen-7B-Chat.git

git clone https://www.modelscope.cn/qwen/Qwen-7B-Chat-Int4.git

拉代码

git clone https://github.com/QwenLM/Qwen-7B.git

pip install -r requirements.txt

pip install -r requirements_web_demo.txt

修改web_demo.py

启动：python web_demo.py

量化：(量化过程报GPU版本问题暂时未调通)

GPTQ

请注意：我们更新量化方案为基于 AutoGPTQ 的量化，提供Int4量化模型。该方案在模型评测效果几乎无损，且存储需求更低，推理速度更优。

以下我们提供示例说明如何使用Int4量化模型。在开始使用前，请先保证满足要求（如torch 2.0及以上，transformers版本为4.32.0及以上，等等），并安装所需安装包：

pip install auto-gptq optimum

随后即可使用和上述一致的用法调用量化模型：

下载：git clone https://www.modelscope.cn/qwen/Qwen-7B-Chat-Int4.git

没成功一直报这个GPU版本的问题

nvidia-smi

Start Locally | PyTorch

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

conda info --envs

conda remove --name ancillary --all

-------------------------------------------------------------

参考：【PyTorch】PyTorch、Cuda 的安装和使用_cuda pytorch-CSDN博客

conda create -n pytorch python=3.8

进入： conda activate pytorch

nvcc --version

查看版本

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

退出：deactivate(参考)

pip install -r requirements.txt

再次启动 GPU 可以使用了。

改用量化的模型

修改模型的路径后

参考：通义千问-7B-Chat-Int4 · 模型库 (modelscope.cn)

pip install modelscope

pip install auto-gptq optimum

cd ..

git clone -b v1.0.8 https://github.com/Dao-AILab/flash-attention

cd flash-attention && pip install .

启动成功后速度不错：

---------------------------------------------------------------------

#获取版本号
conda --version 或 conda -V

#检查更新当前conda
conda update conda

#查看当前存在哪些虚拟环境
conda env list 或 conda info -e

#查看--安装--更新--删除包

conda list：
conda search package_name# 查询包
conda install package_name
conda install package_name=1.5.0
conda update package_name
conda remove package_name

#创建名为your_env_name的环境
conda create --name your_env_name
#创建制定python版本的环境
conda create --name your_env_name python=2.7
conda create --name your_env_name python=3.6
#创建包含某些包（如numpy，scipy）的环境
conda create --name your_env_name numpy scipy
#创建指定python版本下包含某些包的环境
conda create --name your_env_name python=3.6 numpy scipy

conda activate your_env_name

deactivate your_env_name

conda remove -n your_env_name --all

conda remove --name your_env_name --all

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1262858.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【Flutter】graphic图表实现自定义tooltip

【Flutter】graphic图表实现自定义tooltip

renderer graphic中tooltip的TooltipGuide类提供了renderer方法，接收三个参数Size类型，Offset类型，Map<int, Tuple>类型。可查到的文档是真的少，所以只能在源码中扒拉例子，做符合需求的修改。官方github示例官方示例这个例子感觉像是tooltip和提供的那些属性的…

阅读更多...

error “you should set MAGICKCORE_HDRI_ENABLE

error “you should set MAGICKCORE_HDRI_ENABLE

最近做一个项目需要配置ImageMagick库，本项目配置环境如下： ImageMagick version 7 Operating system, version and so on ubuntu 20.04 Description error "you should set MAGICKCORE_HDRI_ENABLE 查阅网上的资料： 默认的是DMAGICKC…

阅读更多...

《孙子兵法》与商务谈判在销售中的应用

《孙子兵法》与商务谈判在销售中的应用

《孙子兵法》是中国古代一部伟大的军事战略书籍，也是一部深深影响着中华民族的哲学经典。它的思想深刻而全面，无论是战争策略、战术执行，还是对人性与社会的理解，都有着独到的见解。在商业领域，尤其是销售中&#xff0…

阅读更多...

鸿蒙开发已成新趋势

鸿蒙开发已成新趋势

随着华为鸿蒙操作系统的快速崭露头角，鸿蒙开发已然成为当前技术领域的热门新趋势。本文将深入探讨鸿蒙开发的重要性和独特优势，并详细介绍一些关键的鸿蒙开发技术和工具，以及它们对开发者个人和整个行业带来的深远影响。首先，鸿蒙…

阅读更多...

手写数字识别加法器--深度学习实验

手写数字识别加法器--深度学习实验

上次老师布置了一个实验： 手写数字识别--深度学习实验-CSDN博客这次在上次的基础上又布置了一个实验，也是做了好久才做出，所以把实验报告放到CSDN保存，自己忘了方便查阅，也为其他人提供借鉴。实验源码自取&#x…

阅读更多...

FFA 2023｜字节跳动 7 项议题入选

FFA 2023｜字节跳动 7 项议题入选

Flink Forward 是由 Apache 官方授权的 Apache Flink 社区官方技术大会，作为最受 Apache Flink 社区开发者期盼的年度峰会之一，FFA 2023 将持续集结行业最佳实践以及 Flink 最新技术动态，是中国 Flink 开发者和使用者不可错过的的技术盛宴。 …

阅读更多...

C#中的async/await异步编程模型

C#中的async/await异步编程模型

前言当谈到异步编程时，C#中的async/await是一个强大且方便的工具。它使得编写并发和异步操作变得更加简单和可读，同时提供良好的可维护性。本文将详细解释async/await的使用，以及如何在C#中有效地利用它来实现异步操作。目录前言1. async…

阅读更多...

项目监控：项目跟踪和控制的工具和步骤

项目监控：项目跟踪和控制的工具和步骤

项目管理不仅仅是分配和审查任务，还包括平衡团队成员的工作量、创建预测和避免障碍的工作流程。整个过程涉及许多步骤，因此，项目监控成为了成功业务活动的关键之一，是项目经理确保与团队共同实施的计划顺利进行的方式。项目监控为…

阅读更多...

细胞级浮游藻类智能检测系统

细胞级浮游藻类智能检测系统

产品信息新一代浮游藻类智能检测系统问世！英视江河首次将藻类检测精度提升到细胞级！英视江河致力于新一代浮游生物的识别、计数。特征是群体藻类和群体种个体均精准检测！目前设备已在山东、宁夏、内蒙多地实际应用。郑州英视江河生态环境科…

阅读更多...

爬虫http代理有什么用处？怎么高效使用HTTP代理？

爬虫http代理有什么用处？怎么高效使用HTTP代理？

在进行网络爬虫工作时，我们有时会遇到一些限制，比如访问频率限制、IP被封等问题。这时，使用HTTP代理可以有效地解决这些问题，提高爬虫的工作效率。本文将介绍爬虫HTTP代理的用处以及如何高效地使用HTTP代理。一、爬虫HTTP代理的用…

阅读更多...

leetCode 17.电话号码的字母组合 + 回溯算法 + 图解 + 笔记

17. 电话号码的字母组合 - 力扣（LeetCode） 给定一个仅包含数字 2-9 的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意 1 不对应任何字母。示例 1&…

阅读更多...

汽车电子 -- 车载ADAS之DOW(开门预警 )

汽车电子 -- 车载ADAS之DOW(开门预警 )

相关法规文件: DOW： GB/T XXXXX—XXXX 乘用车车门开启预警系统性能要求及试验方法一、开门预警 DOW（Door open Warning） 参看：功能定义-开门碰撞预警在停车状态即将开启车门时，监测车辆侧方及侧后方的其它道路使…

阅读更多...

pdf文件能扫码查看吗？一键做文本二维码

pdf文件能扫码查看吗？一键做文本二维码

pdf格式是常用的一种文件格式，很多资料、展示性的内容都会选择这种格式，现在很多人都需要将文件生成二维码图片后分享给他人，那么文件存入二维码展示的方法有哪些呢？下面给大家分享一招使用二维码生成器来生成二维码图片的操作方法…

阅读更多...

UE5学习（游戏存档，两种适应性的射线检测，时间膨胀）

UE5学习（游戏存档，两种适应性的射线检测，时间膨胀）

游戏存档 0.建立游戏存档类 1.建立存档命名要用规律，读档时根据命名调用 2.读取存档这里是用存档时间（秒）验证是否有存档成功。两种鼠标位置射线检测方法两种适用性未使用大量项目验证，为个人观点 1.适用于游戏中 2.适用于…

阅读更多...

关于Linux服务器高并发场景下系统参数优化的诸多奇技淫巧

关于Linux服务器高并发场景下系统参数优化的诸多奇技淫巧

文章目录 🔊博主介绍🥤本文内容开篇内存优化——马达与燃油磁盘优化——加油与换胎网络参数优化——挂挡与提速进程优化——适度开疆拓土 📢文章总结📥博主目标 🔊博主介绍 🌟我是廖志伟，一名Ja…

阅读更多...

Python+Appium自动化测试大法，让你的测试效率飞升，绝不等待！封装元素定位方法超详解！

Python+Appium自动化测试大法，让你的测试效率飞升，绝不等待！封装元素定位方法超详解！

在appium自动化测试脚本运行的过程中，因为网络不稳定、测试机或模拟器卡顿等原因，有时候会出现页面元素加载超时元素定位失败的情况，但实际这又不是bug，只是元素加载较慢，这个时候我们就会使用元素等待的方法来避免这种…

阅读更多...

视频文案怎么写，媒介盒子支招

视频文案怎么写，媒介盒子支招

近几年短视频成为风口，各行各业都想分一杯羹，但是一头热的你，是否知道短视频的相关文案怎么写呢?正所谓兵马未动，文案先行，一个合适的文案是上热门的秘密武器，今天媒介盒子就来和大家聊聊：视频…

阅读更多...

力扣2.两数相加

力扣2.两数相加

题目描述把题读懂后，这道题存在两个需要解决的问题：1.进位问题；2.两个链表长度不一代码 class Solution {public ListNode addTwoNumbers(ListNode l1, ListNode l2) {//创建新链表的伪指针，指向链表的头结点ListNode prev n…

阅读更多...

Spring源码解读之创建bean

Spring源码解读之创建bean

本文章我们会解读一下Spring如何根据beanDefinition创建bean的； 代码入口： AnnotationConfigApplicationContext applicationContext new AnnotationConfigApplicationContext(AppConfig.class);applicationContext.refresh(); 当spring执行refresh(…

阅读更多...

人工智能-产生式系统实验（动物识别）

人工智能-产生式系统实验（动物识别）

1.实验目的 1.熟悉知识的表示方法 2.掌握产生式系统的运行机制 3.产生式系统推理的基本方法。 2.实验内容运用所学知识，设计并编程实现一个小型动物识别系统，能识别虎、金钱豹、斑马、长颈鹿、鸵鸟、企鹅、信天翁等七种动物的产生式系统。规则库&…

阅读更多...

推荐文章

最新文章