本地部署 Qwen-Agent

news2024/11/19 23:24:49

本地部署 Qwen-Agent

  • 1. Qwen-Agent 概述
  • 2. Github 地址
  • 3. 创建虚拟环境
  • 4. 安装 flash-attention
  • 5. 部署 Qwen 模型服务
  • 6. 部署 Qwen-Agent
  • 7. 浏览器访问 Qwen Agent
  • 8. 安装浏览器助手

1. Qwen-Agent 概述

Qwen-Agent 是一个代码框架,用于发掘开源通义千问模型(Qwen)的工具使用、规划、记忆能力。 在 Qwen-Agent 的基础上,我们开发了一个名为 BrowserQwen 的 Chrome 浏览器扩展,它具有以下主要功能:

  • 与Qwen讨论当前网页或PDF文档的内容。
  • 在获得您的授权后,BrowserQwen会记录您浏览过的网页和PDF材料,以帮助您快速了解多个页面的内容,总结您浏览过的内容,并减少繁琐的文字工作。
  • 集成各种插件,包括可用于数学问题求解、数据分析与可视化、处理文件等的代码解释器(Code Interpreter)。

2. Github 地址

https://github.com/QwenLM/Qwen-Agent

3. 创建虚拟环境

(可选)设置 Python 安装默认源,

pip config set global.index-url http://mirrors.aliyun.com/pypi/simple/

创建虚拟环境,

conda create -n qwen-agent python=3.10 -y
conda activate qwen-agent 

安装 pytorch,

pip install torch==2.0.0+cu118 torchvision==0.15.1+cu118 torchaudio==2.0.1 --index-url https://download.pytorch.org/whl/cu118

4. 安装 flash-attention

安装 flash-attn,

git clone -b v1.0.8 https://github.com/Dao-AILab/flash-attention; cd flash-attention
pip uninstall -y ninja && pip install ninja
cd flash-attention && pip install .

(可选)下方安装可选,安装可能比较缓慢。

pip install csrc/layer_norm
pip install csrc/rotary

refer:

  • https://github.com/Dao-AILab/flash-attention
  • https://github.com/Dao-AILab/flash-attention/tree/main/csrc/layer_norm

5. 部署 Qwen 模型服务

安装依赖,

git clone https://github.com/QwenLM/Qwen.git; cd Qwen
pip install -r requirements.txt
pip install fastapi uvicorn openai "pydantic>=2.3.0" sse_starlette

启动模型服务,通过 -c 参数指定模型版本,

  • 指定 --server-name 0.0.0.0 将允许其他机器访问您的模型服务
  • 指定 --server-name 127.0.0.1 则只允许部署模型的机器自身访问该模型服务
python openai_api.py --server-name 0.0.0.0 --server-port 7905 -c Qwen/Qwen-7B-Chat

目前,我们支持指定-c参数为以下模型,按照GPU显存开销从小到大排序:

  • Qwen/Qwen-7B-Chat-Int4
  • Qwen/Qwen-7B-Chat
  • Qwen/Qwen-14B-Chat-Int4
  • Qwen/Qwen-14B-Chat

对于7B模型,请使用2023年9月25日之后从官方HuggingFace重新拉取的版本,因为代码和模型权重都发生了变化。

6. 部署 Qwen-Agent

安装依赖,

git clone https://github.com/QwenLM/Qwen-Agent.git; cd Qwen-Agent
pip install -r requirements.txt

启动 Qwen-Agent,

python run_server.py --model_server http://127.0.0.1:7905/v1 --workstation_port 7864

7. 浏览器访问 Qwen Agent

现在您可以访问 http://127.0.0.1:7864/ 来使用工作台(Workstation)的创作模式(Editor模式)和对话模式(Chat模式)了。

在这里插入图片描述

8. 安装浏览器助手

安装BrowserQwen的Chrome插件(又称Chrome扩展程序):

打开Chrome浏览器,在浏览器的地址栏中输入 chrome://extensions/ 并按下回车键;

确保右上角的 开发者模式 处于打开状态,之后点击 加载已解压的扩展程序 上传本项目下的 browser_qwen 目录并启用;

单击谷歌浏览器右上角扩展程序图标,将BrowserQwen固定在工具栏。

注意,安装Chrome插件后,需要刷新页面,插件才能生效。

当您想让Qwen阅读当前网页的内容时:

请先点击屏幕上的 Add to Qwen’s Reading List 按钮,以授权Qwen在后台分析本页面。

在这里插入图片描述

再单击浏览器右上角扩展程序栏的Qwen图标,便可以和Qwen交流当前页面的内容了。

在这里插入图片描述

以 https://aws.amazon.com/jp/government-education/worldwide/japan/public-sector-generative-ai/ 为例,让它整理一下页面内容,“内容を整理してください”,得到以下结果。

通义千问还懂日文,ビックリしました。

在这里插入图片描述

注:阅读PDF文档为实验功能,尚不稳定。将在线PDF加入Qwen的阅读列表时,可能会因为网络问题、下载NLTK依赖等因素导致Qwen预处理时间较长,请耐心等待。建议先下载为本地PDF后,再在浏览器中打开本地PDF。

完结!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1059297.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

拯救者R9000P 2023测试,从入门到发烧(多图预警)

20231003 By wdhuag 目录 前言: 开箱检查注意事项: 后期升级拆机参考: 机器配置: 总结: 开箱: BIOS画面: 备份原系统: 详细参数: 跑分: 安装Wind…

jenkins利用插件Active Choices Plug-in达到联动显示或隐藏参数,且参数值可修改

1. 添加组件 Active Choices Plug-in 如jenkins无法联网,可在以下两个地址中下载插件,然后放到/home/jenkins/.jenkins/plugin下面重启jenkins即可 Active Choices Active Choices | Jenkins plugin 2. 效果如下: sharding为空时,sharding_info和copy_info不显示 shard…

ElementPlus弹出消息提示框

request.post(api/furn/updata, this.form).then(res > {console.log(res);if (res.code200){//弹出消息框this.$message({message: 修改成功,type: success,});}else if (res.code 400) {//弹出消息框this.$message.error(修改失败);}//关闭对话框this.dialogFormVisible …

安装OpenPCDet跑通PointPillars

前言 刚开始接触OpenPCDet这个库,配置环境好久都不成功,后面看到这篇博文 【OpenPCDet】Kitti数据集下训练PointPillars并评估&可视化 给我提供了思路,本文主要记录一下安装过程中出现的错误 环境 ubuntu20.04 CUDA Version: 11.5 安…

语义分割 Semantic Segmentation

之前了解过语义分割的内容,感觉可以做好多东西,然后就抽空学习了一下,这里记录一下方便以后查阅,这篇文章可能也会随着学习的深入不断更新。 语义分割 Semantic Segmentation 一些基本概念几种语义分割算法Fully Convolutional Ne…

华硕X555YI, Win11下无法调节屏幕亮度

翻出一个旧电脑华硕X555YI,装Win11玩,已经估计到会有一些问题。 果然,装完之后,发现屏幕无法调节亮度。试了网上的一些方法,比如修改注册表等,无效。 估计是显卡比较老,哪里没兼容。然后用驱动…

iOS---生成证书文件的时候无法选择导出.p12文件

解决办法: 左栏有两个分类,一个钥匙串,一个是种类,要选择种类里面的【我的证书】或【证书】进行导出。选择【系统】找到【我的证书】这样导出不了"个人信息交换(.p12)" 正确做法是:选择【登录】找到【我的…

尚硅谷ES学习笔记一

文章目录 第1章 Elasticsearch概述01-开篇02-技术选型Elasticsearch 是什么 全文搜索引擎Elasticsearch 应用案例03-教学大纲04-入门-环境准备05-入门-RESTful & JSON06-入门-Postman客户端工具07-入门-倒排索引08-入门-HTTP-索引-创建09-入门-HTTP-索引-查询 & 删除10…

可观测平台如何存储时序曲线?滴滴实践全历程分享

滴滴的时序曲线量从 2017 年 到 2023 年增长了几十倍。整个过程中我们不断地调整和改进以应对这样的增长。例如时序数据库的选型从最初的 InfluxDB,到 RRDtool,又开发了内存 TSDB 分担查询压力,再到 2020 年开始使用 VictoriaMetrics。载体也…

2023年【高压电工】证考试及高压电工复审模拟考试

题库来源:安全生产模拟考试一点通公众号小程序 高压电工证考试根据新高压电工考试大纲要求,安全生产模拟考试一点通将高压电工模拟考试试题进行汇编,组成一套高压电工全真模拟考试试题,学员可通过高压电工复审模拟考试全真模拟&a…

【PWN · ret2shellcode | “jmp esp“】[i春秋]ret2shellcode

当溢出长度不足时,如何将shellcode放入padding位值,并执行呢? 目录 前言 一、题目重述 ​编辑 二、题目分析 1.存在溢出 2.如何跳转 3.payload构想 4.Addr(jmp esp) 5.指令序列 三、exp 总 前言 回顾ret2shellcode发现还有很多基础的技巧没…

安装JDK(Java SE Development Kit)超详细教程

文章时间 : 2023-10-04 1. 下载地址 直接去下载地址:https://www.oracle.com/java/technologies/downloads/ (需要翻墙,不想翻墙或者不想注册oracel账号的,直接去我的阿里云盘) 阿里云盘:http…

2023年【熔化焊接与热切割】考试资料及熔化焊接与热切割复审模拟考试

题库来源:安全生产模拟考试一点通公众号小程序 2023年熔化焊接与热切割考试资料为正在备考熔化焊接与热切割操作证的学员准备的理论考试专题,每个月更新的熔化焊接与热切割复审模拟考试祝您顺利通过熔化焊接与热切割考试。 1、【单选题】 湿法水下焊接时…

零基础Linux_11(进程)进程程序替换+实现简单的shell

目录 1. 进程程序替换 1.1 程序替换原理 1.2 execl 接口 1.3 execv execlp execvp 1.4 exec 调各种程序 1.5 execle 接口 2. 实现简单的shell 2.1 打印提示和获取输入 2.2 拆开输入的命令和选项 2.3 创建进程和程序替换执行命令 2.4 内建命令实现路径切换 2.5 my…

【C++进阶(七)】仿函数深度剖析模板进阶讲解

💓博主CSDN主页:杭电码农-NEO💓   ⏩专栏分类:C从入门到精通⏪   🚚代码仓库:NEO的学习日记🚚   🌹关注我🫵带你学习C   🔝🔝 模板进阶 1. 前言2. 仿函数的概念3. 仿函数的实…

Scala第十六章节

Scala第十六章节 scala总目录 文档资料下载 章节目标 掌握泛型方法, 类, 特质的用法了解泛型上下界相关内容了解协变, 逆变, 非变的用法掌握列表去重排序案例 1. 泛型 泛型的意思是泛指某种具体的数据类型, 在Scala中, 泛型用[数据类型]表示. 在实际开发中, 泛型一般是结合…

计算机网络 第二章物理层

计算机网络第二章知识点速刷 其中重要的是信源和信宿,以及调制解调器在通信模型当中起到的作用。

JavaScript处理点击事件

在介绍点击事件之前,先给它们讲一些概念 事件监听 在JavaScript中,可以使用事件监听(Event Listener)来响应和处理各种事件。事件监听器是一种能够捕捉特定事件并执行相应代码的机制。事件监听器允许您在特定事件发生时执行自定…

如何在VS2022中进行调试bug,调试的快捷键,debug与release之间有什么区别

什么是bug 在学习编程的过程中,应该都听说过bug吧,那么bug这个词究竟是怎么来的呢? 其实Bug的本意是“虫子”或者“昆虫”,在1947年9月9日,格蕾丝赫柏,一位为美国海军工作的电脑专家,也是最早…

京东数据产品:8月大家电市场增长类目市场数据分析

上期我们已经分析了大家电市场及市场中的头部类目,从大家电的市场数据可知,整个行业大盘及多数细分市场都呈下滑走势。不过,仍有部分偏向精致生活的电器呈上升走势,如洗烘套装、内衣清洗机、衣物护理机等,下面我们一起…