人工智能本来是个很简单的事,咋被人们整的这么神秘?

news2024/9/23 5:28:56

(1)

很多人以为大模型的参数量大是因为数据多。

其实大模型的参数量和超参数的配置相关。主要的超参数有下面几个:

  • 词表大小:Vocab_Size

  • 最大位置编码大小:Max_Position_embeddings

  • 隐层节点数大小:Hidden_Size

  • 隐层数:Num_Hidden_Layer

  • 注意力头数:Num_Attention_Heads

这些都在每个模型的配置文件中(一般都是Config.json)

很多人连大模型的原理都不知道,既不看论文,也不看源代码,就一顿瞎逼逼大模型,瞎幻想。

(2)

很多人以为大模型聪明是因为数据量大。

其实数据量大并不能决定大模型有多聪明。

海量的、高质量的这些咱们人类产生的数据(如人写的文章、人拍的照片、人设计的视频),其价值就是让模型通过最大概率统计自动地得到结构性的特征标签,免去咱们人类对数据进行特征手工标注,就这个价值。

你再想想一个异曲同工的事:咱们搞企业信息化,不就是业务活动在现实里发生了,录入员在自己脑子里回忆了回忆、思考了思考,然后按照屏幕上的结构性的离散字段一个个录入,就特征表示了这个物理世界发生的连续的业务活动。本质上,这个录入员录入字段,其实就是在做数据的特征手工标注。

(3)

很多人以为大模型之所以聪明,就是因为它模仿了人的大脑结构。这有点像中国人老爱蛇蛇蝎蝎搞的所谓的:以形补形。

其实大模型的结构和人的大脑结构、大模型使用的神经网络结构和人的大脑中的神经网络结构,根本长得不一样,就是用了同一个名字,结构根本没啥相似性。

很多人对ChatGPT能像咱们日常人一样理解、回答,感觉很神奇。其实这有啥神奇啊,不就是因为ChatGPT是大量的人工专家进行了四道Post PreTrain Fine-Tuning、Prompt-Tuning、Instruction-Tuning、RLHF么,它当然像人了啊,因为它就是人工调的嘛。

(4)

很多人对中国人蛇蛇蝎蝎搞的所谓针灸、点穴、经络很神奇。其实这有啥神奇啊。

神经系统本质就是个人体信息高速公路,用生物电进行信息传输,道理和咱们家使用的上网光纤一个原理。

你所谓的猛击一下点穴或者针灸,不外乎就是阻断神经毛细,所以信息无法做到下行和上行畅通,所以大脑指挥和躯干反馈进行了分离。

(5)

很多人对做梦也觉得很神奇。其实这有啥神奇啊。

大脑前额本质就是个非常快速处理但容量较小的内存。你天天接受外界的信息,到了晚上就得腾清,从热存储转移到冷存储上。

有些信息是你天天日常接受的,那就不再重复转移,而是给你天天日常使用的信息不断一票票加权重,这和搜索引擎的Page Rank是一个道理。

有些信息是新的信息,大脑会把新的信息和老的信息做相似度度量,根据度量进行自动分类或聚类,然后进行新老信息链接,这也和搜索引擎或者和全连接网络很相似。

如果有些信息对于你来说太新太陌生,你的大脑怎么也无法和你已经存在的信息做链接,大脑这时候就开始使坏了。要么你的大脑太笨,它就扔掉了这个信息,所以你经历过一些新事但是忘记了,本质就是这个。或者你的大脑不太笨,它就开始瞎编造,根据信息相似度进行硬怼硬连接,这时候就是你的做梦,你在梦境中会感觉这个场景既熟悉又陌生,本质就是这样。所以大家现在看到大模型胡编乱造,其原理和做梦一个道理。

(6)

很多人惊叹要到科幻电影终结者的时代呀。而且把人类自己想象定义的蛇蛇蝎蝎的一些概念也迁移到了大模型身上,比如什么:理解、逻辑、推理、顿悟、涌现...。

这都是什么脑子啊。

我曾经在知乎上看过一段,我给copy过来,原理其实很简单:

记忆是一阶从原始数据到表征数据的相关性连接。

推理规则和推理方法本身是二阶记忆内部的相关性连接

小规模模型在二阶链接上的密度是稀疏的,特定大规模建模可以在二阶连接上超过50%,形成具有连通性的通路,就形成了似乎具备推理能力。

过去所谓的逻辑和原理都是人通过先验知识赋予的似乎不证自明的假设,但是在LLM中,这部分是可以产生的,当然需要正确的调教方法。这挑战了人类几百年来认为是不可动摇的归纳和演绎方法,现在看来归纳和演绎规则并非真正原理,这些其实都是可以解释和可以构造的。

总结一下,就是过去的调教和模型规模,导致其在高阶连接上是稀疏的,而GPT3.5以后高阶相关性的密度达到了全局性联通的边界。所以GPT让人产生了其可以逻辑推理和长程对话的感觉,这是一种表征而已。侧面证明了人类崇拜几千年的逻辑、公理、假设、真理、意义这类东西其实都是语言层面的,不过是形而上学。

所以,把原理本质讲透了,很多事情本来很简单。但你不打破砂锅问到底老想囫囵吞枣,那就容易蛇蛇蝎蝎形成神化、崇拜化。

82cc6e468a520a2431074ba19182f475.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/547050.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux - 第16节 - 网络基础(应用层二)

1.HTTP协议 我们在套接字部分编写的代码和应用层一中编写的网络计算器代码都是在应用层工作的,是应用层代码,因此应用层代码包括: (1)基本系统socket套接字系列接口的使用。 (2)定制协议&#x…

一个炎爆术分享给大家~

先来强势围观&#xff1a; 再看代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title><script src"https://cdnjs.cloudflare.com/ajax/libs/three.js/r120/…

23种设计模式之外观模式(Facade Pattern)

前言&#xff1a;大家好&#xff0c;我是小威&#xff0c;24届毕业生&#xff0c;在一家满意的公司实习。本篇文章将23种设计模式中的外观模式&#xff0c;此篇文章为一天学习一个设计模式系列文章&#xff0c;后面会分享其他模式知识。 如果文章有什么需要改进的地方还请大佬不…

云从科技从容大模型:大模型和AI平台什么关系?为什么造行业大模型?

原创&#xff1a;亲爱的数据 2023年5月18日&#xff0c;坐标广州南沙&#xff0c;来自云从科技的“云从从容大模型”正式亮相。 自此&#xff0c;云从科技从CV四小龙“进阶”成为一家AI大模型公司&#xff0c;同时&#xff0c;别忘记云从还有一个身份常被人提起&#xff1a;首家…

纯虚函数与抽象类

纯虚函数与抽象类 虚析构函数状态转换的引入C中的状态转换C中的状态转换职责链模式 纯虚函数和虚基类使用规则实例接口继承和实现继承 虚析构函数 在上一次博客中写到了这么一段代码&#xff1a; class object { private: int value;public:object(int x 0) : value(x) {}~o…

嵌入式音视频开发过程中如何控制码率?

一、码率控制的意义&#xff1a; 在音视频领域&#xff0c;码率控制模式有着举足轻重的地位。那什么是码率控制&#xff1f;码率控制是指通过调节图像的压缩比例&#xff0c;从而决定输出编码码率的过程。 二、H264有多少种码率控制模式&#xff1a; H264码率控制模式分别有&am…

DailyMart01:一点小想法,一个新的开始!

大家好呀&#xff0c;我是飘渺&#xff01; 截至目前&#xff0c;我已在公众号和知识星球上发布了多个系列文章&#xff0c;涵盖了SpringBoot老鸟系列、SpringCloud微服务系列、运维监控系列、分库分表系列和Kubernetes云原生系列。尽管每个系列的重点各有不同&#xff0c;它们…

【MYSQL】事务的4大属性,对隔离级别的详细讲解

目录 1.原子性和持久性 1.1.手动提交事务 1.2.自动提交事务 1.3.事务的原理&#xff1a; 2.隔离性 1.读未提交&#xff08;Read Uncommitted&#xff09; 2.读提交&#xff08;Read Committed&#xff09; 3.可重复读 4.串行化 3.一致性 4.理解读提交和可重复读的实现…

iptables

目录 iptables概述 netfilter/iptables 关系&#xff1a; 四表五链 四表&#xff1a; 五链&#xff1a; 数据包到达防火墙时&#xff0c;规则表之间的优先顺序&#xff1a; 规则链之间的匹配顺序&#xff1a; 主机型防火墙&#xff1a; 网络型防火墙&#xff1a; ipta…

Uart,RS232,RS485串口通讯协议学习

目录 定义 UART&#xff08;通常被称为串口,简单意味着使用广泛&#xff0c;具有普适性) RS232 RS232电平转换 RS485 -Recommended Standard (再推荐标准) 485和232的对比 RS485组网 总结 定义 串口是我们都很熟悉的&#xff0c;尤其是需要串口调试的时候,打印信息插…

C语言函数大全-- _w 开头的函数(4)

C语言函数大全 本篇介绍C语言函数大全-- _w 开头的函数 1. _wstrtime 1.1 函数说明 函数声明函数功能wchar_t *_wstrtime(wchar_t *buffer);用于获取当前系统时间并返回一个宽字符字符串表示&#xff0c;格式为 "HH:MM:SS"&#xff08;小时:分钟:秒&#xff09; …

2023 Vue开发者的React入门

Vue 和 React 都是流行的 JavaScript 框架&#xff0c;它们在组件化、数据绑定等方面有很多相似之处 本文默认已有现代前端开发(Vue)背景&#xff0c;关于 组件化、前端路由、状态管理 概念不会过多介绍 0基础建议详细阅读 Thinking in React-官方文档 了解 React 的设计哲学 R…

彻底理解粘性定位 - position: sticky(IT枫斗者)

彻底理解粘性定位 - position: sticky 介绍 粘性定位可以被认为是相对定位(position: relative)和固定定位(position: fixed)的混合。元素在跨越特定阈值前为相对定位&#xff0c;之后为固定定位。例如: .sticky-header { position: sticky; top: 10px; }在 视口滚动到元素…

【JavaWeb】--05.Request和Response、JSP、会话技术

文章目录 Request和Response1.概述2.Request对象2.1 Request继承体系2.2Request获取请求数据2.3 IDEA创建Servlet2.4 请求参数中文乱码问题POST请求解决方案GET请求解决方案 2.5 Request请求转发 3.Response对象3.1 Response设置响应数据功能介绍3.2 Response请求重定向3.3 路径…

【全网首测】5G随身Wi-Fi —— 中兴U50 Pro

说到随身Wi-Fi&#xff0c;大家应该都不陌生。 它是一个专门将移动信号转换成Wi-Fi信号的设备&#xff0c;经常被用于旅行和出差场景&#xff0c;也被人们亲切地称为“上网宝”。 现在&#xff0c;我们已经全面进入了5G时代&#xff0c;随身Wi-Fi也升级迭代&#xff0c;出现了支…

人工智能的界面革命,消费者与企业互动的方式即将发生变化。

本文来源于 digitalnative.substack.com/p/ais-interface-revolution 描述了一种社会现象&#xff1a; 随着真实友谊的减少和虚拟友谊的增加&#xff0c;越来越多的人开始将AI聊天机器人视为自己的朋友&#xff0c;甚至建立了深厚的情感纽带。这可能与当前人们越来越孤独的现实…

面向“伙伴+华为”体系,华为产品力的变与不变

在日前举办的“华为中国合作伙伴大会2023”上&#xff0c;华为面向政企市场提出了建设“伙伴华为”体系的发展方向。可想而知&#xff0c;接下来会有更多伙伴加入这一体系&#xff0c;也会有更多客户可以借由这个体系加速完成自身的数字化转型和智能化升级。而产品与技术&#…

luaplus Windows编译(一)

前言 LuaPlus是Lua的C增强&#xff0c;也就是说&#xff0c;LuaPlus本身就是在Lua的源码上进行增强得来的。用它与C进行合作&#xff0c;是比较好的一个选择。 1:准备 luaplus_all 下载地址&#xff1a;https://github.com/jjensen/luaplus51-all jamplus 下载地址 https://gi…

基于神经网络算法的鱼类迁徙轨迹拟合研究

本试验采用HTI Model 291便携型声学标签接收系统,包括的基本部件有:291便携型声学标签接收器1台,590型水听器4根,最新795型声学标签40枚,490-LP 型标签编程器1台,690系列电缆400m,492微型声学标签探测器1台,115VAC型滤波器1台,TagProgrammer 、MarkTags和AcousticTag专…

30个数据科学工作中最常用的 Python 包

Python 可以说是最容易入门的编程语言&#xff0c;在numpy&#xff0c;scipy等基础包的帮助下&#xff0c;对于数据的处理和机器学习来说Python可以说是目前最好的语言。 在各位大佬和热心贡献者的帮助下Python拥有一个庞大的社区支持技术发展&#xff0c;开发两个各种 Python…