为什么AI越来越像玄学

news2024/12/27 2:17:14

毫无疑问,AI大模型的发展已经超出了人类的理解能力,我们把大模型称之为“黑箱”,甚至因sora引起了大佬之间的舌战,有人认为sora懂物理世界,有人认为sora只会预测token,修改像素,但是为什么一个大模型能够操纵像素生成如此复杂场景的视频依然令双方费解。

在这里插入图片描述

机器学习的发展史

机器学习的发展史是一个漫长而多彩的过程,涉及了多个领域和技术的创新和应用。

  • 推理期(20世纪50-70年代初):这一时期的主要思想是认为只要给机器赋予逻辑推理能力,机器就具有智能。代表性的成果有A.Newell和H.Simon的“逻辑理论家”和“通用问题求解”程序,以及M.Minsky和S.Papert的《感知器》一书。
  • 知识期(20世纪70年代中期):这一时期的主要思想是认为要使机器具有智能,就必须设法使机器拥有知识。代表性的成果有E.A.Feigenbaum的“知识工程”和“专家系统”,以及T.Mitchell的“版本空间”算法。
  • 学科形成期(20世纪80年代):这一时期是机器学习正式成为一个独立学科领域并快速发展的时期,各种机器学习技术百花齐放。代表性的成果有决策树、神经网络、贝叶斯分类器、支持向量机、AdaBoost等。
  • 繁荣期(20世纪90年代至今):这一时期是机器学习得到广泛应用和认可的时期,统计学方法占主导,深度学习技术诞生并急速发展。代表性的成果有随机森林、梯度提升树、LSTM、卷积神经网络、强化学习等。
深度学习的发展史

神经网络的由来可以追溯到20世纪40年代,当时一些科学家提出了人工神经元的概念,模拟了生物神经元的结构和功能。1958年,Rosenblatt提出了感知器模型,是第一个能够进行学习和分类的神经网络。1969年,Minsky和Papert发表了《感知器》一书,指出了感知器的局限性,即只能处理线性可分的问题,不能处理异或等非线性问题。这导致了神经网络的第一次低潮。

1986年,Rumelhart等人提出了反向传播算法,使得多层神经网络可以通过梯度下降法进行有效的训练。这引发了神经网络的第二次高潮,出现了很多新的神经网络模型和应用,如Hopfield网络、玻尔兹曼机、自编码器、卷积神经网络等。但是,由于计算资源的限制,以及统计学习理论的发展,神经网络又逐渐被支持向量机等其他机器学习方法所取代。

2006年,Hinton等人提出了深度信念网络和贪婪逐层预训练的方法,成功地训练了一个深度神经网络,并在图像识别和语音识别等任务上取得了突破性的结果。 这开启了神经网络的第三次高潮,也就是深度学习的时代。随着计算能力的提升,数据量的增加,优化算法的改进,以及网络结构的创新,深度神经网络在各个领域都展现出了强大的性能和潜力,如图像生成、自然语言处理、强化学习等。
在这里插入图片描述

为什么深度学习能够一骑绝尘

深度学习神经网络能够在许多机器学习任务中取得优异的表现,主要有以下几个原因:

  • 深度学习神经网络可以自动从数据中学习到合适的特征表示,而不需要人工设计或选择特征,这样可以减少人为的偏见和误差,提高模型的泛化能力和适应性。
  • 深度学习神经网络可以利用多层的非线性变换,来拟合复杂的函数关系,表达更高层次的抽象概念,捕捉数据的内在结构和规律。
  • 深度学习神经网络可以处理高维的数据,如图像、语音、文本等,而不需要降维或压缩,这样可以保留数据的完整性和信息量,提高模型的精度和效率。
  • 深度学习神经网络可以利用大量的数据和计算资源,来训练更大规模的模型,从而提升模型的性能和能力。
  • 深度学习神经网络可以借鉴和模仿人类的认知和学习机制,如注意力、记忆、迁移、元学习等,来实现更智能和灵活的机器学习。

当然,深度学习神经网络并不是万能的,也有一些局限和挑战,如训练难度、理解性、鲁棒性、可信度等,需要不断地探索和优化。

神经网络AI大模型难以理解

神经网络AI大模型难以理解的原因有以下几点:

  • 神经网络AI大模型通常包含了海量的参数和层次,其内部的运算和信息流动非常复杂,难以用直观的方式来解释。
  • 神经网络AI大模型的训练过程涉及了很多随机性和不确定性,如初始化、正则化、优化器、批量归一化等,这些都会影响模型的行为和输出,但很难量化和控制。
  • 神经网络AI大模型的学习能力往往超越了人类的认知范围,它们可以从大量的数据中提取出隐含的特征和规律,但这些特征和规律可能并不符合人类的常识和逻辑,或者无法用人类的语言来表达。
  • 神经网络AI大模型的输出往往缺乏可靠性和可信度,它们可能会产生错误的、不一致的、不可解释的、甚至有害的结果,但却没有给出相应的置信度或原因。
AI大模型优化越来越像玄学

大模型优化是指在训练大规模的深度学习模型时,如何选择合适的超参数、优化器、损失函数、正则化方法等,以提高模型的性能和泛化能力。大模型优化有时被称为玄学,是因为它往往缺乏统一的理论指导,而需要依赖经验、直觉、实验等,而且不同的模型和数据集可能需要不同的优化策略,很难找到一个通用的最优解。

大模型优化的难度和复杂度也随着模型规模的增长而增加,因为大模型往往涉及更多的参数、更大的数据量、更高的计算资源和更长的训练时间,这些都会给优化带来挑战。 例如,大模型可能会遇到梯度消失、梯度爆炸、过拟合、欠拟合、局部最优等问题,需要采用一些特殊的技巧和方法来解决,如学习率衰减、动量法、批量归一化、残差连接、注意力机制、数据增强、模型蒸馏、知识蒸馏等。

大模型优化的目标是找到一个能够在给定的数据集和任务上达到最佳性能的模型,但是这个目标并不容易实现,因为模型的性能受到多种因素的影响,如模型结构、数据质量、训练方法、评估指标等,而这些因素之间又存在着复杂的相互作用和依赖关系。 因此,大模型优化需要不断地尝试、调整、评估和改进,而这个过程往往没有固定的规则和步骤,而是需要根据具体的情况和目的来灵活地进行。

总之,大模型优化是一门既有科学性又有艺术性的学问,它需要结合理论和实践,运用创造力和逻辑思维,不断地探索和优化,才能找到最适合的模型和方法。 这也是为什么大模型优化有时被人们戏称为玄学,因为它往往需要一些不可预测和不可复制的因素,如灵感、直觉、运气等,而这些因素很难用科学的方法来解释和验证。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1465725.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[面试] InnoDB中如何解决幻读?

幻读是通过 MVCC 机制来解决的, MVCC 类似于一种乐观锁的机制,通过版本的方式来区分不同的并发事务,避免幻读 问题! 什么是幻读? 事务A前后两次读取同一个范围的数据,在事务A两次读取的过程之间,事务B新增了数据,导致…

reCAPTCHA自动解决器 - 自动解决reCAPTCHAs

在当今数字环境中,保护网站免受自动机器人的攻击变得至关重要,这就是为什么reCAPTCHA被广泛采用的原因。尽管reCAPTCHA具有重要的作用,但手动解决它们可能会耗费时间并令人沮丧。然而,随着先进技术的出现,我们现在拥有…

怎么理解ping?这是我听过最好的回答

晚上好,我是老杨。 Ping这几个字母,已经深入网工人的骨髓了吧? 把Ping用到工作里,肯定不少人在用,但对Ping的了解和理解是不是足够深,取决了你能在工作里用到什么程度,能让它帮你到什么地步。…

【Pytorch深度学习开发实践学习】B站刘二大人课程笔记整理lecture06 Logistic回归

【Pytorch深度学习开发实践学习】B站刘二大人课程笔记整理lecture06 Logistic回归 课程网址 Pytorch深度学习实践 部分课件内容: import torchx_data torch.tensor([[1.0],[2.0],[3.0]]) y_data torch.tensor([[0.0],[0.0],[1.0]])class LogisticRegressionModel(…

小程序--vscode配置

要在vscode里开发微信小程序,需要安装以下两个插件: 安装后,即可使用vscode开发微信小程序。 注:若要实现鼠标悬浮提示,则需新建jsconfig.json文件,并进行配置,即可实现。 jsconfig.json内容如…

【算法与数据结构】1971、LeetCode寻找图中是否存在路径

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:本题应用并查集的理论直接就可以解决:【算法与数据结构】回溯算法、贪心算法、动态规划、图…

HTML5技术实现的小钢琴

HTML5技术实现的小钢琴 用HTML5实现的小钢琴&#xff0c;按下钢琴键上的相应字母用或用鼠标点击钢琴键发声&#xff0c;源码如下&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"v…

[SSD 测试 1.4] 硬件测试之主控测试 (CP | FT) | 主控是如何保证品质的?

专栏 《深入理解SSD》 <<<< 返回总目录 <<<< 主控制器方面&#xff0c;消费级市场的主要厂商包括三星、英特尔、西部数据、海力士和东芝&#xff0c;他们的产品涵盖了SATA和Nvme Pcie3.0/4.0接口。而在企业级市场&#xff0c;国内厂商华为海思H181x系…

VBA_MF系列技术资料1-385

MF系列VBA技术资料1-385 为了让广大学员在VBA编程中有切实可行的思路及有效的提高自己的编程技巧&#xff0c;我参考大量的资料&#xff0c;并结合自己的经验总结了这份MF系列VBA技术综合资料&#xff0c;而且开放源码&#xff08;MF04除外&#xff09;&#xff0c;其中MF01-0…

深陷债务风波,折价变卖股权,皓宸医疗能否自救于水火?

近日&#xff0c;皓宸医疗科技股份有限公司&#xff08;下称“皓宸医疗”&#xff09;发布公告称&#xff0c;上海金融法院于1月24日至27日对其持有的抚顺银行股份有限公司出资额为2.27亿元的非上市股份有限公司股权进行了第一次公开拍卖&#xff0c;拍卖结果为流拍。 皓宸医疗…

Jenkins2.426邮件通知配置

之前安装的jenkins出现问题了&#xff0c;重新装了jenkins&#xff0c;需要重新配置&#xff1a;Maven&#xff0c;JDK&#xff0c;Allure报告&#xff0c;邮件通知&#xff0c;Extended E-mail Notification等 配置Maven&#xff0c;JDK参考&#xff1a;CICD集合(四):Jenkins…

vue实现拖拽(vuedraggable)

实现效果: 左侧往右侧拖动&#xff0c;右侧列表可以进行拖拽排序。 安装引用&#xff1a; npm install vuedraggable import draggable from vuedraggable 使用&#xff1a; data数据&#xff1a; componentList: [{groupName: 考试题型,children: [{componentType: danxua…

JVM内存随着服务器内存的升高而升高问题排查

一、故障描述 公司测试环境和线上环境&#xff0c;都会有&#xff1a;JVM内存随着服务器内存的升高而升高 这种问题 二、排查 1、linux服务器上使用htop查看java项目内存占比&#xff0c;给最大最小推内存300m&#xff0c;但是实际上超出一倍 2、排查方案 a、通过后面的学习…

Emlog博客网站快速搭建并结合内网穿透实现远程访问本地站点

文章目录 前言1. 网站搭建1.1 Emolog网页下载和安装1.2 网页测试1.3 cpolar的安装和注册 2. 本地网页发布2.1 Cpolar临时数据隧道2.2.Cpolar稳定隧道&#xff08;云端设置&#xff09;2.3.Cpolar稳定隧道&#xff08;本地设置&#xff09; 3. 公网访问测试总结 前言 博客作为使…

人工智能 — 图像滤波器

目录 一、图像噪声1、高斯噪声2、椒盐噪声3、泊松噪声4、乘性噪声5、瑞利噪声6、伽马噪声 二、图像滤波三、各种滤波器1、均值滤波2、中值滤波3、最大最小值滤波4、引导滤波 四、图像增强1、点处理1、线性变换2、分段线性变换3、对数变换4、幂律变换/伽马变换 2、领域处理3、图…

浏览器自动填充

input同时有多个 当input框的类型为typepassword&#xff0c;其上一个框为typetext&#xff0c;浏览器会自动填充保存过的账户密码、解决自动填充有以下几种处理方法&#xff1a; 1、在浏览器端设置 2、给出一组假页面存储&#xff0c;必须在同一个Form表单中&#xff0c;让填充…

解决SpringAMQP工作队列模型程序报错:WARN 48068:Failed to declare queue: simple.queue

这里写目录标题 1.运行环境2.报错信息3.解决方案4.查看解决之后的效果 1.运行环境 使用docker运行了RabbitMQ的服务器&#xff1a; 在idea中导入springAMQP的jar包&#xff0c;分别编写了子模块生产者publisher&#xff0c;消费者consumer&#xff1a; 1.在publisher中运行测试…

[AI]部署安装有道QanyThing

前提条件&#xff1a; 1、win10系统更新到最新的版本&#xff0c;系统版本最好为专业版本 winver 查看系统版本&#xff0c;内部版本要大于19045 2、CPU开启虚拟化 3、开启虚拟化功能&#xff0c;1、2、3每步完成后均需要重启电脑&#xff1b; 注&#xff1a;windows 虚拟…

农业四情在线监测站的应用

TH-Q3农业四情在线监测站可广泛应用于农田管理、作物种植、病虫害防治、气象灾害预警等领域。通过实时监测和数据分析&#xff0c;该系统可以帮助农民实现精准施肥、科学灌溉、合理调控作物生长等目标&#xff0c;提高农业生产效率和质量。同时&#xff0c;该系统还可以为政府决…

Pytorch学习(杂知识)

Mini-batch Mii-batch是一种在机器学习中常用的训练算法。它是将大的数据集分成一些小的数据集&#xff0c;每次只用一个小的数据集来训练模型。通常情况下&#xff0c;训练数据集中的数据越多&#xff0c;训练出的模型越准确&#xff0c;但是如果数据集太大&#xff0c;就会导…