比原生Transformer快的LMDeploy

news2024/11/16 5:42:33

创建conda环境

conda create lmdeploy

conda activate lmdeploy

安装依赖包(注:下对应的版本要不然容易报错)

pip install pytorch==2.1.2

pip install lmdeploy[all]==0.3.0

下载模型

通过Git协议下载模型。首先安装git-lfs组件 此处使用的root权限

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | bash
apt update
apt install git-lfs   
git lfs install  --system

安装好git-lfs组件后,由OpenXLab平台下载InternLM2-Chat-1.8B模型:

git clone https://code.openxlab.org.cn/OpenLMLab/internlm2-chat-1.8b.git

把模型放到对应的路径下如

mv /root/internlm2-chat-1.8b /root/internlm2-chat-1_8b

使用LMDeploy与模型对话

执行如下命令运行下载的1.8B模型

lmdeploy chat /root/internlm2-chat-1_8b

就可以与InternLM2-Chat-1.8B大模型对话了。比如输入“请给我讲一个小故事吧”,然后按两下回车键

也可以启动API服务器

lmdeploy serve api_server \
    /root/internlm2-chat-1_8b \
    --model-format hf \
    --quant-policy 0 \
    --server-name 0.0.0.0 \
    --server-port 23333 \
    --tp 1

其中,model-format、quant-policy这些参数是与第三章中量化推理模型一致的;server-name和server-port表示API服务器的服务IP与服务端口;tp参数表示并行数量(GPU数量)。

启动客户端调用

lmdeploy serve api_client http://localhost:23333

网页客户端连接API服务器

lmdeploy serve gradio http://localhost:23333 \
    --server-name 0.0.0.0 \
    --server-port 6006

打开浏览器,访问地址http://127.0.0.1:6006

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1967155.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

YOLOv8改进 | 主干网络 | 简单而优雅且有效的VanillaNet 【华为诺亚方舟】

秋招面试专栏推荐 :深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 💡💡💡本专栏所有程序均经过测试,可成功执行💡💡💡 专栏目录 :《YOLOv8改进有效…

【C++核心篇】—— C++面向对象编程:封装相关语法使用和注意事项详解(全网最详细!!!)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、封装(类)1.封装的使用(类和对象)2. 对象的初始化和清理2.1 构造函数2.2 析构函数2.3 构造函数的分类及调用 …

海外仓代理模式,借鸡生蛋也能成为跨境新出路

国际物流是跨境电商生态圈同质化最严重跨境电商最开放的“地带”。唯独海外仓,算是国际物流行业唯一的一块“世外桃源”,但一个1000平米的小仓库,每年至少要花费100万的运转资金,无论是新企业还是成熟的企业,建立海外仓…

成都云飞浩容文化传媒有限公司怎么样?靠谱吗?

在数字经济的浪潮中,电商行业如同一艘巨轮,乘风破浪,不断前行。而在这片波澜壮阔的蓝海中,成都云飞浩容文化传媒有限公司犹如一颗璀璨的新星,以其专业的电商服务能力和前瞻性的市场洞察,为众多品牌搭建起通…

【Python机器学习】支持向量机——基于最大间隔分隔数据

有些人认为,SVM是最好的现成的分类器,这里说的“现成”指的是分类器不加修改即可直接使用。同时,这就意味着在数据上应用基本形式的SVM分类器就可以得到低错误率的结果。SVM能够对训练集之外的数据点做出很好的分类决策。 支持向量机&#x…

SAP ABAP SUBMIT 用法详解(看这一篇就够了)

文章目录 前言一、案例介绍/笔者需求二、B报表(被SUBMIT的程序)三、A报表(用SUBMIT的程序) a.SUBMIT B程序 b.AND RETURN 详解 c.CL_SALV_BS_RUNTIME_INFO 捕获ALV数据的方法 d.捕获…

使用STM32实现一个线性代数计算器

文章目录 背景挑战与困难如何整合编译?error: non-ASM statement in naked function is not supportederror: #pragma import is an ARM Compiler 5 extension, and is not supported by ARM Compiler 6error: redefinition of __FILE 改造demo中的cout改造delete运…

gdb调试 查找段错误

先设置 程序崩溃时的core文件产生 ulimit -c unlimited http://t.csdnimg.cn/BBGBQ 记得改完之后重启虚拟机。 core文件:当程序发生异常(如段错误)并退出时,操作系统可以选择生成一个 core 文件。这个文件包含了程序崩溃时刻…

【吊打面试官系列-Dubbo面试题】Dubbo 支持服务降级吗?

大家好,我是锋哥。今天分享关于 【Dubbo 支持服务降级吗?】面试题,希望对大家有帮助; Dubbo 支持服务降级吗? 以通过 dubbo:reference 中设置 mock"return null"。mock 的值也可以修改为 true,然…

软测面试二十问(最新面试)

1.软件测试的流程是什么 参加需求评审会,解决需求疑问---写测试用例---对测试用例进行评审---评审后开始执行测试---提交bug---追踪bug---关闭bug---回归测试---交叉测试---编写测试报告---冒烟测试 2.什么是黑盒测试和白盒测试?它们有何区别 黑盒测试…

医院HIS搭建|HIS系统开发|HIS系统源码

在现代医疗管理中,医院信息系统(HIS)扮演着至关重要的角色。它是一个综合性的信息平台,旨在提高医院运营效率,优化患者护理,并确保医疗数据的准确性和安全性。以下是HIS系统包含的一些核心功能:…

抖音短视频矩阵管理系统:短视频运营的得力助手

1. 抖音短视频矩阵管理系统介绍 随着短视频行业的迅速发展,越来越多的企业和自媒体人开始关注短视频运营。抖音作为国内最受欢迎的短视频平台之一,拥有庞大的用户群体和丰富的内容资源。为了更好地管理和运营短视频,抖音短视频矩阵管理系统应…

数据结构:线性表(上)

谈到线性的数据结构,那肯定离不开两个最基础的:数组和链表,当然有了数组和链表就会聊到栈和队列。 那么本篇我们就来介绍数组和链表 一、数组 数组(Array) 是一种很常见的数据结构。它由相同类型的元素(…

Linux操作系统及gcc工具实验报告

Linux操作系统及gcc工具实验 一、 实验目的 1.学习在VMware虚拟机上搭建Linux操作系统。 2.掌握Linux操作系统的环境配置及使用。 3. 学会使用gcc工具编译。 二、 实验环境 硬件:PC机 软件:VMware虚拟机、Linux系统。 三、…

8-springboot集成nacos config

本文介绍spring boot集成nacos config,注意这里和spring cloud没任何关系,单纯基于spring boot。 0、环境 jdk 1.8nacos 2.0.3Idea 2021.1maven 3.8.1 1、springboot搭建 Idea新建maven项目,构建完成后,添加以下依赖&#xff…

新160个crackme - 018-crackme_0006

运行分析 输入Name和Serial,点击Check无反应 PE分析 ASM程序,32位,无壳 静态分析&动态调试 ida找到关键字符串,进入关键函数 通过静态分析和动态调试,得到以下结论 总结:1、String Serial2、String2 是…

JavaScript_语法_运算符_一元运算符

变量_ typeof 运算符: (可以使用 typeof 运算符来确定 JavaScript 变量的数据类型) 注: 复杂数据 typeof 运算符把对象、数组或 null 返回 object。 null被认为是对象的占位符 1.5 运算符 1.一元运算符:只有一个运算数的运算符 eg. A , …

电商平台服务器 IP 地址遭受攻击?

平台突然瘫痪?客户反映无法购物?订单无法查询?电商平台在促销活动期间往往会迎来流量高峰,这就给了网络攻击者可乘之机。服务器 IP 地址遭受恶意攻击,导致网站无法正常访问,就会造成以上后果,给…