一键式RWKV RAG、RWKV-Keras、新论文...RWKV社区7月动态速览!

news2024/9/24 13:24:12

大家好,《RWKV 社区最新动态》迎来了第三期内容,本期统计了 RWKV 社区 7 月的重要动态,一起来看看吧!

省流版本:

  1. RWKV 官方公告
    • RWKV-6-World 14B 模型已发布
    • RWKV 中文官网 rwkv.cn 正式上线
  2. RWKV 社区新项目
    • RWKV RAG:一键式 RWKV RAG 本地搭建项目,实现了最小封装和极高的扩展性
    • RWKV-Keras:RWKV 的 Keras 实现,支持 RWKV 模型和 State 的推理和训练
    • rwkv6-keras-operator:RWKV6 模块的 RWKV 核算子,已发 PIP 包
    • RWKV Runner:更新版本并启动易用性改版计划,正在招募前端贡献者
  3. RWKV 的新学术研究:
    • GoldFinch:RWKV/Transformer 混合模型架构
    • Restore-RWKV:RWKV 医学图像修复模型
    • Decision-RWKV:基于 RWKV 模型的机器人终身学习算法
  4. 8 月预告:RWKV 的小说微调模型(7B、14B)正在训练中,有望在 8 月发布!

RWKV 官方动态

RWKV-6-World 14B 开源发布

2024 年 7 月 19 日,RWKV 开源基金会宣布正式向全球开源 RWKV-6-World 14B 模型。

RWKV-6-World 14B 是迄今最强的稠密纯 RNN 大语言模型。在最新的性能测试中,该模型英文性能相当于 Llama2 13b。在同参数的模型评测中,RWKV-6-World 14B 的多语言性能显著最强,且支持全球 100+种语言和代码。

在“无法作弊的模型评测” Uncheatable Eval 排行榜中,RWKV-6-World 14B 的综合评测分数比 llama2 13B 和 Qwen1.5 14B 更强。

RWKV 中文官网正式上线

RWKV 中文官网(rwkv.cn)正式上线了,RWKV 中文官网目前有四大板块,分别是首页、生态页、资讯页,以及 RWKV 中文文档页面。

你可以在 RWKV 中文官网找到关于 RWKV 的绝大多数信息,包括但不限于 RWKV 架构的介绍、RWKV 多模态等研究和相关论文、RWKV 的本地部署和推理教程、RWKV 的全参/微调训练教程,以及 RWKV 最新新闻动态等信息。

RWKV 社区的新项目/更新

RWKV RAG 项目

RWKV_RAG 是 RWKV 的本地 RAG 项目,实现了傻瓜式的本地 RWKV RAG 系统搭建流程。

RWKV_RAG 架构实现了实现了最小封装和高扩展性:所有功能异步化且无封装,想怎么调接口就怎么调接口。

此外,RWKV_RAG 已支持带图形化界面的 LoRA、State tuning、Pissa 等主流 RWKV 微调方法,可以一键微调以适应任何下游任务。

RWKV_RAG 很快会适配多模态和知识图谱功能,敬请期待!

RWKV-RAG 仓库地址: https://github.com/AIIRWKV/RWKV_RAG
RWKV——RAG 架构

RWKV6-Keras

RWKV6-Keras 项目是基于 RWKV 模型的 Keras 实现,由 RWKV 社区的 infiy-quine 兴趣组牵头开发,基于 bert4keras3 和 RWKV6_Keras 算子两个项目。

除了支持训练和推理 RWKV 模型,RWKV6-Keras 还支持 RWKV State 的训练和推理。

以下是 RWKV6-Keras 基于不同后端的生成速度对比:

前置条件torch(keras)jax(keras)tensorflow(keras)RWKV-Pytorch
有 cuda 算子(bs=1)4 token/s78.0 token/s//
无 cuda 算子(bs=1)4 token/s77.0 token/s77.0 token/s25.75 tokens/s
有 cuda 算子(bs=64)/1500.0 token/s//
无 cuda 算子(bs=64)/1289.0 token/s/578.68 tokens/s
prefill(有 cuda)185ms5ms//
prefill(无 cuda)6s209ms186ms480 ms

对比测试显示,更推荐使用 jax 作为 RWKV6-Keras 后端,以获得最佳性能。

RWKV6-Keras 模型下载:https://www.modelscope.cn/models/q935499957/RWKV6-1.6B-Keras

rwkv6-keras-operator 项目

rwkv6-keras-operator 是一个适用于 bert4keras3 库中 RWKV6 模块的 RWKV 核算子,这个算子在 jax、pytorch 框架提供了原生 CUDA 实现,但对于 TensorFlow 框架只提供基本的上层 api 实现。

  • RWKV6_Keras 算子 pip 包地址:https://pypi.org/project/rwkv6-keras-operator
  • GitHub 仓库:https://github.com/infiy-quine/RWKV6_Keras_Operator

rwkv.cpp 新增 RWKV-6 支持

rwkv.cpp 项目新增了对于 RWKV-6 架构的支持,这意味着 RWKV-6 模型可以在 CPU 上实现较快的推理速度。

详情可见:https://github.com/RWKV/rwkv.cpp/pull/174

在 1.8.5 版本的更新中 ,RWKV Runner 的 rwkv.cpp 模式也同步支持 RWKV-6 架构。

RWKV Runner 项目更新

1. RWKV Runner 发布 1.8.5 版本

RWKV Runner 更新到了 v1.8.5,新版本支持了开发者工具,允许用户自定义头像,并且修复了一些已知问题。

2. RWKV Runner 易用性改版

RWKV Runner 正在启动易用性改版计划,使得软件更开箱即用,对新手更友好。

易用性改版主要围绕前端板块展开,具体任务如下:

RWKV Runner 前端改版

RWKV Runner 开发组正在寻找有意向参与改版的前端高手(技术栈 react, typescript, tailwindcss),以加快改版的进度。如果您有意向参与到改版计划,欢迎在公众号后台留言“改版计划”,我们将第一时间联系您。

Runner API 指南

RWKV 社区发布了关于 RWKV Runner API 的详细用法。文章列出 RWKV Runner 每一个 API 的作用、请求主体的参考结构、必需字段和可选字段等内容,帮助大家更轻松、更灵活地调用 RWKV Runner 的 API。

Runner API 使用指南:https://mp.weixin.qq.com/s/ZU9vpBa6cRMe-0PmrZkJew

RWKV 学术研究相关

格灵深瞳开源 RWKV-CLIP 模型

格灵深瞳近日在 WiseModel 平台上开源了 RWKV-CLIP 模型,RWKV-CLIP (Contrastive Language-Image Pre-training)是一个 RWKV 驱动的视觉语言表示学习模型,该框架可以利用大型语言模型(LLMs)来合成和细化基于网络的文本、合成标题和检测标签的内容。

  • RWKV-CLIP 模型下载:https://wisemodel.cn/models/deepglint/RWKV-CLIP/file

RWKV-CLIP 更多链接:

  • RWKV-CLIP GitHub 仓库:https://github.com/deepglint/RWKV-CLIP
  • RWKV-CLIP 论文地址:https://arxiv.org/abs/2406.06973

Restore-RWKV

Restore-RWKV 是首个基于 RWKV 的医学图像修复模型。文章提出了一种循环 WKV(Re-WKV)注意力机制,该机制以线性计算复杂度捕获全局依赖关系。Restore-RWKV 在各种医学图像修复任务中均具有卓越的性能,包括 MRI 图像超分辨率、CT 图像去噪 PET 图像合成和一体化医学图像修复。

相关链接:

  • Restore-RWKV 论文地址:https://arxiv.org/abs/2407.11087
  • Restore-RWKV GitHub 仓库:https://github.com/Yaziwel/Restore-RWKV

GoldFinch

GoldFinch 是一种 RWKV/Transformer 混合序列模型,将新的 GOLD transformer 叠加在 Finch(RWKV-6) 架构的增强版本之上,有效地在线性时间和空间中生成高度压缩和可重用的 KV-Cache。相对于 1.5B 参数的 Finch 和 Llama 模型而言,GoldFinch 的建模性能显着提高。

相关链接:

  • GoldFinch论文地址:https://arxiv.org/abs/2407.12077
  • GoldFinch GitHub 仓库地址:https://github.com/recursal/GoldFinch-paper

Decision-RWKV

南方科技大学的研究团队提出了 Decision-RWKV (DRWKV) 模型,并将经验回放(experience replay)的概念与 Decision-RWKV 模型相结合,设计出适合机器人的终身学习算法。

实验结果显示 DRWKV 模型在单任务测试和终身学习场景中拥有先进的性能。与此同时, Decision-RWKV 相比 DT(Decision-Transformer)显著地减少了推理时间和内存占用,使其成为现实应用(尤其是机器人领域)的更佳选择。

相关链接:

  • Decision-RWKV 论文地址:https://arxiv.org/abs/2407.16306
  • Decision-RWKV GitHub 仓库:https://github.com/ancorasir/DecisionRWKV

8 月预告

RWKV 小说模型

据可靠消息,专用于写小说的 RWKV 小说微调模型(7B、14B)正在训练中,敬请期待!

关于《RWKV 社区动态》栏目

《RWKV 社区动态》栏目会不定期播报 RWKV 社区的最新消息,以帮助 RWKV 的关注者、爱好者、开发者更好地了解 RWKV 的发展情况。

《RWKV 社区最新动态》不定期更新,所以请保持关注我们的微信公众号(RWKV 元始智能)、QQ 频道(RWKV)等公开平台,以获取最新的消息。

加入 RWKV 社区

欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入我们的 QQ 频道和群聊,一起探讨 RWKV 模型。

  • RWKV 中文官网:https://rwkv.cn/
  • QQ 频道:https://pd.qq.com/s/9n21eravc
  • QQ 交流群:224287095

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1963913.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode删除链表的倒数第 N 个结点

给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 示例 1: 输入:head [1,2,3,4,5], n 2 输出:[1,2,3,5] 示例 2: 输入:head [1], n 1 输出:[] 示例 3&#x…

C++进阶(12)智能指针

个人主页:仍有未知等待探索-CSDN博客 专题分栏:C 一、概述 智能指针在构造的时候开辟空间,当智能指针生命周期结束则会自动调用析构函数释放空间。 解决问题:对于new开辟的时候出现异常,导致之前开辟的空间没有手动释放…

VMware虚拟机安装Windows7教程(超详细)

目录 1. 下载2. 安装 VMware3. 安装 Window73.1 新建虚拟机3.2 安装操作系统 4. 设置共享文件夹5. 安装 VMware Tools5.1 下载&安装缺少驱动5.2 开始安装 VMware Tools 6. 未🐔🔥解决 创作不易,禁止转载抄袭!!&…

MyBatis代码生成器:SpringBoot 引入MybatisGenerator

1. 引入插件 <plugin><groupId>org.mybatis.generator</groupId><artifactId>mybatis-generator-maven-plugin</artifactId><version>1.3.5</version><configuration><!--generator配置⽂件所在位置--><configurati…

7.5 grafana上导入模板看图并讲解告警

本节重点介绍 : blackbox_exporter grafana大盘导入和查看告警配置讲解 grafana大盘 grafana 上导入 blackbox_exporter dashboard 地址 https://grafana.com/grafana/dashboards/13659举例图片http总览图value_mapping设置 展示设置阈值&#xff0c;展示不同背景色 告警配…

过滤和筛选树形结构数据

场景 在平时项目开发中经常会遇到树形数据的处理&#xff0c;如树形数据根据条件值过滤掉不符合条件的选项&#xff0c;如果是最后的子数据符合条件那么就会保存这条树形链路的所有直属数据并过滤掉所有非直属的数据。如果是符合条件的数据还有子元素&#xff0c;那么就保留所…

算法强训day18

一、压缩字符串 链接&#xff1a;压缩字符串(一)_牛客题霸_牛客网 #include<iostream> using namespace std; #include<vector> class Solution { public:/*** 代码中的类名、方法名、参数名已经指定&#xff0c;请勿修改&#xff0c;直接返回方法规定的值即可***…

mac电脑不能快速传输文件的原因是什么 mac无法拷贝文件到移动硬盘的原因是什么 macbook传输速度慢

新买的移动硬盘连接上Mac电脑&#xff0c;想要将Mac上的文件拷贝到移动硬盘里&#xff0c;但是Mac无法拷贝文件到移动硬盘里&#xff0c;直接拖拽、剪切都不行&#xff0c;尤其是一些大的安装包或视频文件的拷贝&#xff0c;需要花费大量的时间&#xff0c;给Mac用户造成了很多…

Excel文档受损打不开,还能修复吗?

Excel作为最常用的表格文件&#xff0c;在我们日常的工作当中使用尤其频繁&#xff0c;且经常涉及到一些重要数据文件的编辑和保存。然而&#xff0c;有时我们会遇到Excel文档受损而无法打开的情况&#xff0c;这无疑会给我们的工作带来诸多不便。那么&#xff0c;当Excel文档受…

SpringCloud API网关

SpringCloud API网关 文章目录 SpringCloud API网关1. 概念2. Spring Cloud Gateway2.1 介绍2.2 操作方式 3.Route Predicate Factories3.1 介绍3.2 使用方式 1. 概念 API网关&#xff0c;简称网关&#xff0c;本身是一个服务&#xff0c;通常作为后端服务的唯一入口&#xff…

git学习准备阶段

准备阶段 ubantu下载安装git sudo apt-get install git查看git版本 git -v注册用户名 git config --global user.name [name][name]填入自己的名字&#xff0c;如果没有空格的情况下&#xff0c;可以不加引号,–global是在全局下操作&#xff0c;如果没有这个参数就只是在本…

Orcale(备份导入导出)

1.备份恢复 1.1.备份定义 备份就是把数据库复制到转储设备的过程。其中&#xff0c;转储设备是指用于放置数据库副本的磁带或磁盘。通常也将存放于转储设备中的数据库的副本称为原数据库的备份或转储。备份是一份数据副本 1.2.备份分类 从物理与逻辑的角度来分类&#xff1a…

C++ 哈希系列容器 + 位图 + 布隆过滤器

目录 1 unordered 系列关联式容器 2 哈希介绍 3 闭散列哈希 4 哈希桶 5 封装实现unordered系列set和map 6 位图 7 哈希切割 8 布隆过滤器 1 unordered 系列关联式容器 在学习哈希结构实现之前&#xff0c;我们先学习一下哈希在库里面的一些使用unordered_set 和unorderen_m…

昂科烧录器支持HolyChip芯圣电子的8位触摸微控制器HC88T3661

芯片烧录行业领导者-昂科技术近日发布最新的烧录软件更新及新增支持的芯片型号列表&#xff0c;其中HolyChip芯圣电子的8位触摸微控制器HC88T3661已经被昂科的通用烧录平台AP8000所支持。 HC88T3661是一颗采用高速低功耗CMOS工艺设计开发的增强型8位触摸微控制器&#xff0c;内…

探索全光网技术 | 全光网络技术方案选型建议一 (办公室场景)

全光网技术方案选型建议 | 办公室场景 目录 一、场景设计需求二、办公室场景拓扑三、部署方式四、产品相关规格说明五、方案优势与特点 校园办公室网络是校园员工日常处理工作的重要载体&#xff0c;学校领导、教学、研究、行政、财务等各部门均需要办公室网络来承载日常的工作…

【已修改 Python】TypeError: ‘tuple’ object does not support item assignment

【已修改 Python】TypeError: ‘tuple’ object does not support item assignment 在Python编程的浩瀚宇宙中&#xff0c;TypeError: tuple object does not support item assignment 是一个令人困惑但又常见的错误。它如幽灵般潜伏在代码的深处&#xff0c;当你不慎尝试修改…

C#:枚举及位标志周边知识详解(小白入门)

文章目录 枚举为什么要有枚举?枚举的性质设置默认类型和显式设置成员的值 位标志(重要)位标记是什么及作用位标志周边知识HasFlag判断是否有该功能枚举前面加Flags的好处 关于枚举的更多知识using static简化代码获取枚举成员的字面量 枚举 为什么要有枚举? 为了增加代码的…

WPF中使用定时器更新元素-DispatcherTimer

在WPF中使用定时器来更新UI元素是一种常见且有用的做法&#xff0c;特别是当你需要基于时间间隔来刷新数据或执行某些操作时。DispatcherTimer是WPF中用于在UI线程上执行周期性任务的理想选择&#xff0c;因为它确保了对UI元素的更新是线程安全的 例子程序 每隔0.5s 界面中的…

volatile的使用方法介绍

volatile的使用方法介绍 volatile的使用方法介绍 文章目录 volatile的使用方法介绍volatile的使用方法 volatile的使用方法 volatile的使用大家最熟悉的就是说防止编译器优化&#xff0c;今天我们来做一下实验 //vs2022 中volatile的修饰 #include<Windows.h> #includ…

vue3集成LuckySheet实现导入本地Excel进行在线编辑

第一步&#xff1a;克隆或者下载下面的代码 git clone https://github.com/dream-num/Luckysheet.git第二步&#xff1a;安装依赖 npm install npm install gulp -g 第三步&#xff1a;运行 npm run dev效果如下图所示 第四步&#xff1a;打包 打包执行成功后&#xff0c;…