RWKV-CHN模型部署教程

news2024/10/10 10:56:58

一、模型介绍

RWKV 语言模型(用纯 100%RNN 达到 GPT 能力,甚至更强),该项目旨在通过为您自动化所有事情来消除使用大型语言模型的障碍。您需要的是一个只有几兆字节的轻量级可执行程序。此外,该项目还提供了一个接口兼容 OpenAI API,这意味着每个 ChatGPT 客户端都是一个 RWKV 客户端。

  • 您可以在服务器上部署 backend-python,并仅将此程序用作客户端。将您的服务器地址填写在“设置”的 API URL中。
  • 如果您正在部署和提供公共服务,请通过 API 网关限制请求大小,以防止提交过长的提示导致资源使用过多。此外,请根据您的实际情况 限制max_tokens 请求情况: https://github.com/josStorer/RWKV-Runner/blob/master/backend-python/utils/rwkv.py#L567,默认设置为 AS LE=102400,在极端情况下,这可能会导致个体响应的大量资源消耗。
  • 默认配置已启用自定义 CUDA 内核加速,速度更快,消耗的 VRAM 更少。如果您遇到兼容性问题(输出乱码),进入配置页面,选择关闭 ,或尝试升级 GPU 驱动程序。Use Custom CUDA kernel to Accelerate
  • 如果 Windows Defender 声称这是病毒,您可以尝试下载 v1.3.7_win.zip 并让它自动更新到最新版本,或将其添加到受信任的列表。Windows Security``Virus & threat protection``Manage settings``Exclusions``Add or remove exclusions``Add an exclusion``Folder``RWKV-Runner
  • 对于不同的任务,调整 API 参数可以达到更好的效果。例如,对于翻译任务,您可以尝试将温度设置为 1,将 Top_P 设置为 0.3。

二、模型特点

  • RWKV 模型管理,一键启动。
  • 前端和后端分离,如果您不想使用客户端,也可以单独部署前端服务,或后端推理服务,或带有 WebUI 的后端推理服务。简单部署示例 | 服务器部署示例
  • 兼容 OpenAI API,让每个 ChatGPT 客户端都成为 RWKV 客户端。启动模型后,打开 http://127.0.0.1:8000/docs 以查看更多详细信息。
  • 自动安装依赖,只需要一个轻量级的可执行程序。
  • 预设多级 VRAM 配置,几乎在所有计算机上都能正常工作。在 Configs 页面中,将 Strategy 切换到 WebGPU,它 也可以在 AMD、Intel 和其他显卡上运行。
  • 包括用户友好的聊天、完成和组合交互界面。还支持聊天预设、附件 上传、MIDI 硬件输入和轨道编辑。
  • 内置 WebUI 选项,一键启动 Web 服务,共享您的硬件资源。
  • 简单易懂、操作简单的参数配置,以及各种操作指导提示。
  • 内置模型转换工具。
  • 内置下载管理和远程模型检查功能。
  • 内置一键式 LoRA Finetune。(仅限 Windows)
  • 也可以用作 OpenAI ChatGPT、GPT-Playground、Ollama 等客户端。(填写 API URL 和 API 密钥 设置页面)
  • 多语言本地化。
  • 主题切换。
  • 自动更新。

屏幕截图

三、部署流程

1.创建虚拟环境

apt update
conda create -n RWKV-CHN python=3.8
conda activate RWKV-CHN

2.克隆模型

git lfs install 
git clone https://www.modelscope.cn/studios/BlinkDL/RWKV-CHN.git

3.安装依赖

安装之前进入requirements.txt将镜像源换成清华源(加快安装速度)

cd RWKV-CHN
pip install -r requirements.txt

4.修改端口

进入app.py文件在修改最后一行为

demo.launch(server_name='0.0.0.0', server_port=8080)

5.运行模型

python app.py

屏幕截图

四、网页演示

点击“http://0.0.0.0”访问WebUI,进行对话

屏幕截图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2201809.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue打印网页pdf,并且有按钮调整缩小放大

本人详解 作者:王文峰,参加过 CSDN 2020年度博客之星,《Java王大师王天师》 公众号:JAVA开发王大师,专注于天道酬勤的 Java 开发问题中国国学、传统文化和代码爱好者的程序人生,期待你的关注和支持!本人外号:神秘小峯 山峯 转载说明:务必注明来源(注明:作者:王文峰…

[AutoSar]BSW_Diagnostic_005 RoutineControl service (0x31)介绍

目录 关键词平台说明背景一、请求格式二、sub-function definition三、响应格式四、NRC五、case 关键词 嵌入式、C语言、autosar、OS、BSW、UDS、diagnostic 平台说明 项目ValueOSautosar OSautosar厂商vector芯片厂商TI编程语言C,C编译器HighTec (GCC)autosar版…

录屏工具分享

遇到问题 现在很多录屏工具都是要会员 要么就不清,压缩画质 解决方案 (1)QQ录屏 QQ录屏缺点就是界面上会有个录屏计时阻挡。没有影响的话可以使用。录几分钟出来也是几百M的容量 (2)格式工厂 录的视频很清晰&…

打造梦幻AI开发环境:一步步解锁高效配置的魅力

作者简介:我是团团儿,是一名专注于云计算领域的专业创作者,感谢大家的关注 座右铭: 云端筑梦,数据为翼,探索无限可能,引领云计算新纪元 个人主页:团儿.-CSDN博客 目录 前言&#…

【如何保存Pixso中原型图的图标】

【如何保存Pixso中原型图的图标】 在软件UI设计完成后,设计师需要将设计中的图标导出为开发团队所需的图片文件,以便进行后续开发工作。pixso中原型图的图标到处如下图,按照序号操作流程即可到处图片。

wireshark获取QQ图片

今天随手写下之前做的一个比较有意思的实验:Wireshark抓取qq图片 1.前提 手机和电脑处于同一网络之中,这里我使用了校园网。 接着使用手机向电脑发出图片 2.wireshark流量抓包 先查看好手机的ip地址,随后使用命令:ip.src10.33.X…

MybatisPlus的日常使用

一、基础接口 public interface BaseMapper<T> {/*** 插入一条记录* param entity 实体对象*/int insert(T entity);/*** 根据 ID 删除* param id 主键ID*/int deleteById(Serializable id);/*** 根据 columnMap 条件&#xff0c;删除记录* param columnMap 表字段 map …

Anthropic Message Batches API 满足批量处理大量请求

现在开发的系统有大量知识汇总统计、跑批处理需求的同学可以尝试一下&#xff0c;看看能不能解决自己目前的问题~~ 可能是一个解决方案 Anthropic 推出的 Message Batches API &#xff0c;专门用于帮助开发者批量处理大量请求。它的主要目的是通过一次性处理大量非实时任务&a…

Linux工具的使用——【gcc/g++的使用】【make/Makefile的使用】【如何让普通用户使用sudo】

目录 Linux工具的使用-021.如何让普通用户使用sudo1.1为什么无法使用sudo1.2解决步骤1.3验证 2.编译器gcc/g的使用2.1预处理2.2编译2.3汇编2.4链接2.5函数库2.5.1静态库与动态库2.5.1.1动态链接2.5.1.2静态链接 2.6gcc的默认链接方式2.7gcc的静态链接2.8g的使用2.8.1g的静态链接…

Apache Flink Dashboard

1、Overview Apache Flink Web Dashboardhttp://110.40.130.231:8081/#/overview 这张图片显示的是Apache Flink的Web UI界面&#xff0c;其中包含了以下几个部分&#xff1a; Available Task Slots: 显示当前可用的任务槽位数量。任务槽位是指Flink集群中可用于运行任务的资…

【华为HCIP实战课程十】OSPF网络DR和BDR实战讲解,网络工程师

一、DR与BDR的基础介绍 点到点同步LSA成本小 多点接入网络同步LSA成本大,需要DR/BDR 由于MA网络中,任意两台路由器都需要传递路由信息,网络中有n台路由器,则需要建立n*(n-1)/2个邻接关系。任何一台路由器的路由变化都会导致多次传递,浪费了带宽资源,DR和BDR应运而生!…

大数据存储计算平台EasyMR:多集群统一管理助力企业高效运维

随着全球企业进入数字化转型的快车道&#xff0c;数据已成为企业运营、决策和增长的核心驱动力。为了处理海量数据&#xff0c;同时应对数据处理的复杂性和确保系统的高可用性&#xff0c;企业往往选择部署多个Hadoop集群&#xff0c;这样的策略可以将生产环境、测试环境和灾备…

分布式 ID

背景 在复杂分布式系统中&#xff0c;往往需要对大量的数据和消息进行唯一标识。随着数据日渐增长&#xff0c;对数据分库分表后也需要有一个唯一ID来标识一条数据或消息&#xff0c;数据库的自增 ID 显然不能满足需求&#xff1b;此时一个能够生成全局唯一 ID 的系统是非常必…

电商选品/跟卖| 亚马逊卖家精灵爬虫

卖家精灵(SellerSprite)基于大数据和人工智能技术,精准查询每个产品的销量、关键词、自然搜索数据,为亚马逊跨境卖家提供一站式选品、市场分析、关键词优化、产品监控等, 基于买家精灵跟卖,可谓事半功倍, 如何利用买家精灵, 快速获取跟卖信息. from extensions.basic_exte…

Java基础知识——String篇

一、String 1、是什么 String 是 Java 中用于表示字符串的类。Java 中的字符串是不可变的&#xff0c;也就是说一旦创建&#xff0c;字符串的内容无法更改。 2、如何构造 &#xff08;1&#xff09;无参数构造方法&#xff1a; String str new String(); //创建一个空字符…

毕业设计项目-基于Spring Boot开发的古诗词管理系统

项目简介 这是一个基于Spring Boot开发的古诗词管理系统&#xff0c;旨在为用户提供在线古诗词交流平台。系统分为用户和管理员两个角色&#xff0c;各自拥有不同的功能和权限。该系统提供了以下功能&#xff1a; 用户功能&#xff1a; 登录和注册功能&#xff0c;确保用户身…

json格式的post请求目前不行, 要换成form表单形式的post请求怎么改

问: 下面是我的代码 export function fetchDeleteList<T>(agentSessionId: string) {return post<T>({url: http://192.168.0.116:8089/pipe-ics/agent/delete,method: post,data: { agentSessionId },}) } 目前是json格式的post请求, 目前不行, 要换成form表单…

如何使用IntelliJ IDEA生成UML图

&#x1f3dd;️ 博主介绍 大家好&#xff0c;我是一个搬砖的农民工&#xff0c;很高兴认识大家 &#x1f60a; ~ &#x1f468;‍&#x1f393; 个人介绍&#xff1a;本人是一名后端Java开发工程师&#xff0c;坐标北京 ~ &#x1f389; 感谢关注 &#x1f4d6; 一起学习 &…

基于深度学习的花卉识别系统

简介&#xff1a; 基于Python的花卉识别分类系统利用深度学习和计算机视觉技术&#xff0c;能够准确识别和分类各种花卉&#xff0c;如玫瑰、郁金香和向日葵等。这种系统不仅有助于植物学研究和园艺管理&#xff0c;还在生态保护、智能农业和市场销售等领域展现广泛应用前景。随…

HAL库常用的函数:

目录 HAL库&#xff1a; 1.GPIO常用函数&#xff1a; 1.HAL_GPIO_ReadPin( ) 2.HAL_GPIO_WritePin( ) 3.HAL_GPIO_TogglePin( ) 4.HAL_GPIO_EXTI_IRQHandler( ) 5.HAL_GPIO_EXTI_Callback( ) 2.UART常用函数&#xff1a; 1.HAL_U…