一年前 LLM AGI 碎片化思考与回顾系列⑦ · 在SystemⅡ未知之境之中徘徊

news2024/11/26 8:46:17

阅读提示:

本篇系列内容的是建立于自己过去一年在以LLM为代表的AIGC快速发展浪潮中结合学术界与产业界创新与进展的一些碎片化思考并记录最终沉淀完成,在内容上,与不久前刚刚完稿的那篇10万字文章「融合RL与LLM思想,探寻世界模型以迈向AGI」间有着非常紧密的联系,可以说,这篇长篇文章中的很多内容也是基于这些碎片化的思考与沉淀,当然也正是这样的一个个碎片化的、看似玄幻大胆、step by step的探索过程,才促成我最终完成那篇看上去并不是特别易读的文章。

因此,这个系列文章将以笔记的形式,去重新回顾体会一下自己去年的这些碎片化思考与探索历程,并希望将这些碎片化的、step by step探索式的思考与历程分享给大伙。一方面去回顾、修正自己之前的思考和观点,一方面作为那篇长文阅读的补充参考,并在其中的内容中标注出与其相关的阅读指针与提示。

在内容记录形式上,因为一年前自己的思考历程按时间顺序记录呈现出一定的主题割裂与内容的碎片化,我将按照时间线顺序向大家呈现一年前自己的想法,内容上可能进行一些合并和整合但会尽量保持原文内容不变。

另外大伙需特别注意的是,因为保持了原始记录时内容的不变(仅修改笔记上的笔误与错字),一年前的想法跟当前的认知可能会有较大的差异和改变,也会存在一些不成熟观点,千万不要被我当时片面的观点所误导。主要是想给大家抛出一些过去技术进展当中存在的一些问题和关键点,当然坦率地说,自己确实也在回顾中针对某些想法有了新的思路!如果大家针对我过去或刚完稿的那篇文章有更有建设性的意见甚至批评指正那就更好了!

最后,为了不让这个系列笔记显得不那么单调,在每一篇内容中会附上一些过去自己经历的有趣的生活照片或的图片,有吃喝玩乐,有学术美图,也有搞笑娱乐。


「2023/06/12 · 在SystemⅡ未知之境之中徘徊

图片

背景提要 ↓

基于上一篇“探索复杂推理的未知之境”,本篇笔记将在system2的未知之境中继续徘徊、探索,并对一些本质问题继续通过慢思考的模式来尝试进行思维上的扩散与延展,并期待在其中过滤并把握住一些本质洞察。同时,大家可以结合本次记录和思考的内容,可以去阅读那篇「融合RL与LLM思想,探寻世界模型以迈向AGI」文章的中篇第一小节「system2·慢思考本质阐释」,我想将会有一些不一样的体会吧,这也是这个系列分享目的之一。

记录正文 ↓

前日针对整个E2E下的system2涉及到的深度推理模式与对应的神经网络中的神经元信号激活形式两者间的等效性进行了大胆猜想与尝试,在这一过程中,我们看到针对某一模式寻找对应的另一种抽象结构上的形式化映射匹配,其难度可想而知,且现在似乎也没有相关完备的理论去支撑印证它,而对于复杂的长链推理本身而言,对于我们当下的探索来说仍有许多未解之谜:

① 上接前文,这种E2E system2长链思维模式是否对于我们所身处的真实世界来说是一种真实存在的客观认知规律呢,其反映出的推理链,归纳链,反思链等这些看似决策过程的中间环节是否是得出答案(因→果)的客观存在的必须一环呢?是否存在其它链式模式或完全的非链式结构(非人类或超越人类现有认知模式)甚至根本不存在这种长链模式的存在呢?而上述这种范长链模式是否可以通过一个完全E2E的的方式通过超大样本,超大多样性的推理任务数据集仅通过输入因和输出的果(不包含中间的推理模式过程)将这种中间的非或超人类推理模式硬拟合到模型参数并通过网络中神经元信号激活的传递中呢?!

如果拿强化学习(如DPO)训练的过程来举例,即仅通过稀疏奖励函数而非稠密奖励函数来完成对于神经网络中多层神经元的目标价值的梯度优化。研究强化学习的大家可能都知道,密集型的过程奖励对模型目标的收敛是有益的,但这种“有益”的意义背后的真实原因可能还未找到一个足矣令人信服的答案。直觉上,这种稠密的过程奖励通过利用某种可行的模式将优化目标进行细粒度切分并融合,即同时将切分后的细粒度目标映射匹配到稠密奖励的过程中来,这一过程也许降低了目标优化过程中采用数学工具或方法的难度,也许是仅仅按照人类的某种特有的先验认知模式来形式性的“简化”这一复杂过程的折中,也许通过这样的形式性“简化”或“取巧”,也会在这一过程中使我们丢失或遗漏一些东西,甚至是导致这一过程复杂度提升的元凶。(回到当前时间节点的额外补充:大家可以试想一下基于CV像素级别建模学习的sora和llm对于原始训练数据的采样并最终学习到物理规律的过程)在这里可以思考一下alpha zero的强化学习过程中的长期稀疏奖励与短期稠密奖励两者间的平衡意义。

② 可否真的可以将长链推理中的规划、步骤分解、反思等过程模式映射为某种模型网络信号激活结构,实现E2E呢?如某一场景下模型通过迭代反思后发现并没有理解问题或基于历史长链推理出现了偏差或矛盾而无法做出生成应答,而模型内部的某隐层信号激活状态又会感知到这种状态,模型内部的神经元信号传递并激活到另一其中隐层状态,从而形式上促进另一种思维模式去继续尝试探索...目前这一部分仍仅停留在猜想假说阶段,后续可能需要结合实验进行持续的探索,但相信最终人类能够通过逐步的探索,最终打开隐藏在模型内部的黑盒。

③【阶段性总结】:感觉我所理解的上述system2的E2E更多是体现在让模型网络中神经元的激活状态与路径(参数控制)最终拟合到人类所擅长的认知长链推理模式中去,实现模型网络结构中参数激活传递的多跳,而COT思想下的autoGPT,HuggingGPT,plugin更多是在推理形式维度上生成单跳(为什么说是推理形式维度:因为在模型网络结构参数中实际上应该是多跳,如物理的多跳,但这种物理的多跳没有涌现出逻辑的多跳)。即推理真正的在模型参数的激活中中涌现出抽象长链推理。


「本篇配图

这一期的笔记貌似问题很多,看的出来在涉足“未知之境”当中自己的这种迷茫和彷徨,甚至直到当下,其中的部分问题还是悬而未决。

但处于这种“未知之境”中除了带给我迷茫和彷徨之外,也对未知有着越来越强烈的兴奋和期待。

因此本期配图将为大家附上我未曾亲身品尝过并拍照留存的一些美食图片(之前的配图都是来自自己的吃拍照),图片来自昨日好友朋友圈晒的吃拍照,嗯...他也是一位爱吃拍的“美食家”哦~你们能是否吃过或能叫出菜名吗?味道如何?欢迎大家评论区讨论~

图片

图片


「融合RL与LLM思想,探寻世界模型以迈向AGI」内容回顾与再版更新

融合RL与LLM思想,探寻世界模型以迈向AGI「上篇」

融合RL与LLM思想,探寻世界模型以迈向AGI「中/下篇」

融合RL与LLM思想,探寻世界模型以迈向AGI「下篇」

融合RL与LLM思想,探寻世界模型以迈向AGI「总结」

合集PDF版本v6.2已更新,大家可访问百度网盘地址自行下载:

https://pan.baidu.com/s/1dwuviZkL8J7afBhjEQqXqg?pwd=lm51

提取码: lm51

或扫码下载:

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1852247.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

02--MySQL数据库概述

目录 第10章 子查询 10.1 SELECT的SELECT中嵌套子查询 10.2 SELECT的WHERE或HAVING中嵌套子查询 10.3 SELECT中的EXISTS型子查询 10.4 SELECT的FROM中嵌套子查询 第11章 MySQL支持的数据类型 11.1 数值类型:包括整数和小数 1、整数类型 2、bit类型 3、小数类型 11.2…

1996年-2023年 全国298个地级市-外商直接投资FDI(数据收集)

外商直接投资(FDI)是一种跨国界的经济活动,它涉及外国投资者在中国境内进行的直接投资行为。这种投资行为不仅包括以货币、实物、技术等形式的资本投入,还可能包括开办独资企业、合资企业、合作企业,以及参与资源开发等…

FreeCAD中智能指针分析

实现原理 FreeCAD中有两套智能指针,一个是OCC的智能指针handle,另一个是自己定义的智能指针Reference,两种智能指针都是通过引用计数方式管理指针。 1.1 OCC智能指针handle OCC在基础类包中定义了一个模板类handle,该类包含一个私…

Github 2024-06-23开源项目日报 Top10

根据Github Trendings的统计,今日(2024-06-23统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量TypeScript项目3C++项目2JavaScript项目2非开发语言项目2Jupyter Notebook项目1Python项目1Vue项目1Java项目1HTML项目1从零开始构建你喜爱的技…

直流电机三级串电阻启动

直流电动机在工农业生产中拥有广泛的应用,这主要得益于其调速范围广、调速平稳、过载能力强以及启动和制动转矩大的优点。为了降低起动电流和起动转矩,研究者们探索了直流电动机串电阻起动方法。这种方法通过在直流电动机电枢绕组中串入电阻,…

【学习笔记】CSS

CSS 1、 基础篇 1.1、选择器 1.2、长度单位 1.3、CSS2 常用属性 1.4、盒模型 1.5、浮动 1.6、定位 position2、 CSS3 2.1、新增长度单位 2.2、新增颜色表示 2.3、新增选择器 2.4、新增盒子属性 2.5、新增背景属性 …

电子SOP实施(MQTT协议)

架构图 服务与程序 用docker启动mqtt broker(服务器) 访问:http://192.168.88.173:18083/#/dashboard/overview 用户名:admin 密码:*** 消息发布者(查找sop的url地址,发布出去) 修改url,重新发布消息 import ran…

5.XSS-反射型(post)利用:获取cookie

原理: 文件路径:\pikachu\pkxss\xcookie\post.html 将post.html文件,复制到皮卡丘的根路径下或者根下随意路径即可,并编辑文件 需要修改以下两个地址,第一个地址是将原界面的样子链接过来,让用户认为是原…

探索Agent AI智能体的未来

随着人工智能(AI)技术的飞速发展,Agent AI智能体正成为一种改变世界的新力量。这些智能体不仅在当前的技术领域中发挥着重要作用,而且在未来将以更深远的影响改变我们的生活、工作和社会结构。本文将探讨Agent AI智能体的现状、潜…

Python学习打卡:day13

day13 笔记来源于:黑马程序员python教程,8天python从入门到精通,学python看这套就够了 目录 day1397、初识对象98、类的成员方法类的定义和使用成员变量和成员方法成员方法的定义语法 99、类和对象在程序中通过类来描述基于类创建对象 100、…

通信系统网络架构_2.广域网网络架构

1.概述 通俗来讲,广域网是将分布于相比局域网络更广区域的计算机设备联接起来的网络。广域网由通信子网于资源子网组成。通信子网可以利用公用分组交换网、卫星通信网和无线分组交换网构建,将分布在不同地区的局域网或计算机系统互连起来,实现…

24年下半年各省自考报名时间汇总

24年下半年各省自考报名时间汇总

自动驾驶⻋辆环境感知:多传感器融合

目录 一、多传感器融合技术概述 二、基于传统方法的多传感器融合 三、基于深度学习的视觉和LiDAR的目标级融合 四、基于深度学习的视觉和LiDAR数据的前融合方法 概念介绍 同步和配准 时间同步 标定 摄像机内参标定(使用OpenCV) 摄像机与LiDAR外…

Java学习 - 网络静态路由与动态路由 讲解

网络畅通的条件 数据报包有去有回网络中的路由器必须知道且只需要知道下一跳的地址【路由器只要知道下一跳地址就行,不必知道如何到达任意的路由器,因为如果要实现,路由表将非常非常巨大,这是不可能的】 静态路由 静态路由是指…

【Python系列】探索 NumPy 中的 mean 函数:计算平均值的利器

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

LabVIEW电控旋翼测控系统

开发基于LabVIEW开发的电控旋翼测控系统,通过高效监控和控制提升旋翼系统的性能和安全性。系统集成了多种硬件设备,采用模块化设计,实现复杂的控制和数据处理功能,适用于现代航空航天领域。 项目背景 传统旋翼系统依赖机械和液压…

【AI技术】GPT-4o背后的语音技术猜想

前言: 本篇文章全文credit 给到 台大的李宏毅老师,李宏毅老师在机器学习上风趣幽默、深入浅出的讲解,是全宇宙学AI、讲中文学生的福音,强力推荐李宏毅老师的机器学习课程和深度学习 人工智能导论; 李宏毅老师的个人长…

网络安全-如何设计一个安全的API(安全角度)

目录 API安全概述设计一个安全的API一个基本的API主要代码调用API的一些问题 BasicAuth认证流程主要代码问题 API Key流程主要代码问题 Bearer auth/Token auth流程 Digest Auth流程主要代码问题 JWT Token流程代码问题 Hmac流程主要代码问题 OAuth比较自定义请求签名身份认证&…

Day9 —— 大数据技术之ZooKeeper

ZooKeeper快速入门系列 ZooKeeper的概述什么是ZooKeeper?ZooKeeper的特点和功能使用ZooKeeper的原因 ZooKeeper数据模型ZooKeeper安装ZooKeeper配置ZooKeeper命令行操作常见服务端命令 ZooKeeper的概述 什么是ZooKeeper? ZooKeeper是一个开源的分布式协…

微服务——重复消费(幂等解决方案)

目录 一、唯一ID机制二、幂等性设计三、状态检查机制四、利用缓存和消息队列五、分布式锁总结 在微服务中,防止重复消费的核心思想是通过设计使得操作一次与多次产生相同的效果,并为每次操作生成唯一的ID。这样,即使在消息被重复发送的情况下…