AI入门指南:什么是人工智能、机器学习、神经网络、深度学习?

news2024/11/25 0:30:20

文章目录

  • 一、前言
  • 二、人工智能(AI)是什么?
    • 起源
    • 概念
    • 人工智能分类
    • 人工智能应用
  • 三、机器学习是什么?
    • 概念
    • 机器学习常见算法
    • 机器学习分类
    • 机器学习与人工智能的关系
  • 四、神经网络是什么?
    • 概念
    • 神经网络组成部分
    • 神经网络模型
    • 神经网络和机器学习的关系
  • 五、深度学习是什么?
    • 概念
    • 深度学习的特点
    • 深度学习与人工智能、机器学习的关系
    • 深度学习面临的挑战
  • 六、总结
  • 七、未来展望
  • 八、参考资料

一、前言

本文主要面向那些想了解或准备从事人工智能相关领域研究和工作的入门人士。在踏入这个领域之前,全面了解人工智能的概貌。

二、人工智能(AI)是什么?

起源

人工智能研究领域正式成立于1956年在达特茅斯学院举行的“达特茅斯会议”。与会者后来在20世纪60年代成为该领域的先驱者。他们及其学生研发出的程序被媒体誉为“令人惊叹”:计算机不仅能学会国际跳棋策略,还能解决代数文字难题、证明逻辑定理,甚至能进行英语对话。在20世纪50年代末至60年代初,许多英国和美国的大学纷纷建立了人工智能实验室。

概念

人工智能(AI),是“Artificial Intelligence”的缩写。人工智能是一种由人类创造出来的具有智能的系统,旨在让机器模拟人类的行为和思维,以处理特定的问题。

人工智能的核心在于模拟人类智能。如今,人工智能 (AI) 已变成了一个无所不包的术语,涵盖许多不同的学科,包括计算机科学、数据分析和统计、硬件和软件工程、语言学、神经学,甚至哲学和心理学。

在业务使用的操作层面上,人工智能 (AI) 是一组主要基于机器学习和深度学习的技术。这些技术被用于数据分析、预测、对象分类、自然语言处理、推荐系统和智能数据检索等多种应用场景。

人工智能分类

  1. 弱人工智能(Artificial Narrow Intelligence (ANI))
    • 专用AI:针对特定任务或应用进行设计和训练,如语音助手、推荐系统和自动翻译工具。它在特定领域内表现优异,但不具备广泛的智能能力。
  2. 通用人工智能(Artificial General Intelligence (AGI))
    • 强AI:具备类似于人类的全面智能,能够理解、学习和应用各种知识和技能。这种类型的AI尚未完全实现,仍处于探索阶段。
  3. 超人工智能(Artificial Super Intelligence (ASI))
    • 超越人类的智能:一种理论上的AI,超越人类的所有智力和能力。这仍然是未来的愿景和研究方向。

严格地讲,我们现在看到的都属于“弱人工智能”——具有特定能力或能完成特定任务的人工智能。例如,赢得国际象棋比赛(RL)或从一系列照片中识别某个物体(CV);包括现在的五花八门的聊天机器人和文生图模型,以及其他各类AIGC产品都应该被划分在ANI范围之内。

人工智能应用

从事人工智能领域的人员主要分为两部分:一部分在学术界,如大学和研究所的教授,另一部分在企业中,如各种算法工程师。

当前,人工智能领域的几个热门主题包括但不限:

  1. 数据挖掘(Data Mining):从大量数据中提取有用的信息和模式。
  2. 机器视觉(Computer Vision, CV):让计算机能够“看”并理解图像和视频。
  3. 自然语言处理(Natural Language Processing, NLP):使计算机能够理解和生成自然语言。
  4. 语音交互:处理和生成语音,使机器能够与人类进行语音交流。
  5. 自动驾驶:开发能够自主驾驶的车辆技术。
  6. 游戏AI:在游戏中应用AI技术,提升游戏体验和挑战性。

三、机器学习是什么?

概念

机器学习是人工智能(AI)的基础。它是一种通过数据训练模型,使计算机能够自动学习和改进的方法。具体来说,机器学习利用算法解析数据,从中识别模式和规律,并基于这些模式和规律进行预测或决策,而不需要明确编写指令。其核心理念是让机器通过大量数据和算法进行学习从而产生经验,以便在遇到新数据时能够做出合理的判断。

简单来说机器学习实际上是在告诉机器(可以理解为电脑、CPU或任何能够处理逻辑计算的设备)是如何通过一系列数据学习到一些规则或决策。

想象一下,你在教小狗识别球时,可能会把球放在它面前,然后多次告诉它这个物体叫做“球”,并不断重复这一过程,同时给予奖励机制。经过一段时间的训练,当你说出“球”时,它就能准确知道你指的是什么。为了让小狗更加聪明,你可能会展示不同种类的球,如乒乓球、足球和篮球,并告知它们都叫“球”。经过长时间的训练,它可能就会明白,圆形且可以滚动的物品就叫做“球”。当你拿出一个网球时,它也能识别出这是“球”

如果你理解了这一过程,那你已经初步理解了什么是机器学习。上述我们称之为小狗学习,而机器学习则是教计算机如何学习。我们通过给计算机大量的数据,类似于给小狗展示多次的教学行为,让计算机从这些数据中找到规律和模式。当我们给小狗展示一个新的网球让它识别的过程,在机器学习中被称为预测或决策。

机器学习常见算法

在机器学习中,有许多算法可用于不同类型的问题。以下是一些常见的机器学习算法及其简要介绍:

算法用途原理示例
线性回归(Linear Regression)连续数值预测建立输入特征与输出值之间的线性关系,通过拟合直线来最小化预测值和实际值之间的误差。房价预测、股票价格预测
逻辑回归(Logistic Regression)二分类问题通过逻辑函数将线性回归结果映射到概率值,再通过阈值将概率值转换为类别标签。垃圾邮件分类、病人是否患病预测
决策树(Decision Tree)分类和回归问题构建树状模型,通过分裂数据形成节点,每个节点代表特征的测试,每个叶子节点代表类别或回归值。客户购买行为预测、信用评分
随机森林(Random Forest)分类和回归问题集成多棵决策树,通过投票或平均得到最终预测结果,减少过拟合。特征重要性评估、异常检测
支持向量机(Support Vector Machine, SVM)二分类和回归问题寻找最佳超平面将不同类别样本分开,最大化类间距离,使用核函数处理非线性分类问题。图像分类、文本分类
k最近邻算法(k-Nearest Neighbors, k-NN)分类和回归问题计算测试样本与训练样本之间的距离,将测试样本归类为其k个最近邻样本的多数类别或取邻居的平均值。手写数字识别、推荐系统
朴素贝叶斯(Naive Bayes)分类问题基于贝叶斯定理,假设特征之间独立,通过计算每个类别的概率进行分类。垃圾邮件检测、情感分析
k均值算法(k-Means Clustering)无监督学习中的聚类问题将数据划分为k个簇,迭代更新簇的中心和数据点的分配,最小化每个簇内的数据点之间的距离。市场细分、图像压缩
主成分分析(Principal Component Analysis, PCA)降维和特征提取将数据投影到具有最大方差的方向来减少数据维度,从而保留最重要的特征。数据预处理、图像降维
神经网络模型(Neural Networks)分类、回归和复杂问题由多个神经元组成的层次结构,通过调整权重和激活函数来处理和学习数据的复杂模式。深度学习中的神经网络有更多层次。图像识别、自然语言处理

机器学习分类

机器学习可以分为监督学习、无监督学习和强化学习三大类:

机器学习算法-有监督学习的定义与模型- 努力--坚持- 博客园

机器学习与人工智能的关系

机器学习和人工智能之间的关系可以概括为以下两点:

  1. 人工智能的子集:机器学习是人工智能的基础。人工智能涵盖了使机器具备智能行为的各种方法和技术,而机器学习是实现智能行为的必要方法,专注于通过数据训练模型来实现智能行为。
  2. 实现路径:人工智能的目标是模拟、延伸和扩展人类智能。机器学习提供了一条实现路径,通过让计算机从数据中学习并进行推断,来模拟人类的学习和决策过程。

总之,机器学习是实现人工智能的一种强有力的方法,通过数据驱动的方式,使计算机能够自动学习并在广泛的应用中展现智能行为。

四、神经网络是什么?

概念

人工神经网络(Artificial Neural Network,ANN,也简称为神经网络)是机器学习的一个分支,是一种模拟人脑神经系统的计算模型,用于处理和分析数据,通过使用模仿生物神经元协同工作方式的过程来识别现象、权衡利弊并得出结论。它的灵感来源于生物神经网络的结构和功能。

历史上,科学家一直希望模拟人的大脑,造出可以思考的机器。人为什么能够思考?科学家发现,原因在于人体的神经网络。

在这里插入图片描述

  1. 外部刺激通过神经末梢,转化为电信号,转导到神经细胞(又叫神经元)。
  2. 无数神经元构成神经中枢。
  3. 神经中枢综合各种信号,做出判断。
  4. 人体根据神经中枢的指令,对外部刺激做出反应。

既然思考的基础是神经元,如果能够"人造神经元"(artificial neuron),就能组成人工神经网络,模拟思考。上个世纪六十年代,提出了最早的"人造神经元"模型,叫做"感知器"(perceptron),直到今天还在用。

在这里插入图片描述

上图的圆圈就代表一个感知器。它接受多个输入(x1,x2,x3…),产生一个输出(output),好比神经末梢感受各种外部环境的变化,最后产生电信号。

例如我们约定每种输入只有两种可能:1 或 0。如果所有输入都是1,表示各种条件都成立,输出就是1;如果所有输入都是0,表示条件都不成立,输出就是0。

而将多个神经元进行组合便是人工神经网络,如下图:

人工神经网络- 抖音百科

神经网络组成部分

输入层

人工神经网络有几个向其输入数据的节点。这些节点构成了系统的输入层。

隐藏层

输入层处理数据并将其传递到神经网络中更远的层。这些隐藏层在不同层级处理信息,在接收新信息时调整其行为。深度学习网络有数百个隐藏层,可用于从多个不同角度分析问题。

例如,如果您得到了一张必须分类的未知动物的图像,则可以将其与您已经认识的动物进行比较。例如,您可以查看其眼睛和耳朵的形状、大小、腿的数量和毛皮花色。您可以尝试识别图样,如下所示:

  • 动物有蹄,所以它可能是牛或鹿。
  • 动物有猫眼,所以它可能是某种类型的野猫。

深度神经网络中的隐藏层以相同的方式工作。如果深度学习算法试图对动物图像进行分类,则其每个隐藏层都会处理动物的不同特征并尝试对其进行准确的分类。

输出层

输出层由输出数据的节点组成。输出 “是” 或 “否” 答案的深度学习模型在输出层中只有两个节点。那些输出更广泛答案的模型则有更多的节点。

神经网络模型

模型是指一种特定的网络结构和训练方法,用于解决特定类型的问题。虽然模型内部会使用各种算法来进行优化和学习,但在实际应用中,我们更常用模型这个术语来描述这些结构。

神经网络算法用途示例特点
前馈神经网络 (Feedforward Neural Network, FNN)分类和回归任务基本的图像分类、房价预测简单的网络结构,广泛应用于基础任务
卷积神经网络 (Convolutional Neural Network, CNN)图像和视频处理、计算机视觉任务手写数字识别、物体检测、人脸识别利用卷积层提取空间特征,适合处理图像数据
循环神经网络 (Recurrent Neural Network, RNN)自然语言处理、时间序列预测文本生成、语音识别、股票价格预测处理序列数据,保留序列中的时序信息
长短期记忆网络 (Long Short-Term Memory, LSTM)处理长序列数据,保留长期依赖信息语言翻译、视频分析解决RNN长距离依赖问题,适用于长序列任务
生成对抗网络 (Generative Adversarial Network, GAN)数据生成、图像生成、风格转换生成逼真的图像、视频生成、图像超分辨率由生成器和判别器组成,通过对抗训练生成数据
Transformer自然语言处理、序列建模机器翻译、文本摘要、对话生成、图像分类基于注意力机制,可以并行处理序列数据,显著提高训练速度和效果

这些神经网络模型各有特点,适用于不同的应用场景,推动了人工智能技术的不断发展和进步。

神经网络和机器学习的关系

神经网络与机器学习之间有着紧密的关系,神经网络是机器学习的一个子集。

神经网络是机器学习的一种模型:机器学习包括多种模型和算法,而神经网络是其中一种复杂且强大的模型。其他机器学习模型包括决策树、支持向量机(SVM)、K最近邻(KNN)等。

神经网络使用算法进行训练:神经网络的训练过程使用机器学习的算法,如前向传播和反向传播,通过大量数据调整模型参数,以提高性能。

五、深度学习是什么?

概念

在日常对话中,“深度学习”和“神经网络”这两个术语往往会交替使用,这可能会造成混淆。简单来说深度学习(deep learning)是更加复杂的人工神经网络。是一种以人工神经网络为架构,对数据进行学习的算法,而深度学习中的“深度”仅指神经网络中层的深度。一个由超过三层(包括输入层和输出层)构成的神经网络可以被视为一个深度学习算法。只有两层或三层的神经网络只是一个基本的神经网络,如下图:

img

深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术,可以完成更高难度的工作

显然,“深度学习”是与机器学习中的“神经网络”是强相关

深度学习在图像,语音等富媒体的分类和识别上取得了非常好的效果,所以各大研究机构和公司都投入了大量的人力做相关的研究和开发。我说个例子,你肯定听说过。那就是2016年谷歌旗下DeepMind公司开发的阿尔法围棋(AlphaGo)战胜人类顶尖围棋选手。阿尔法围棋的主要工作原理就是“深度学习”。

不过神经网络的计算量非常大,事实上在很长时间里由于基础设施技术的限制进展并不大。而GPU的出现让人看到了曙光,也造就了深度学习的蓬勃发展,“深度学习”才一下子火热起来。

深度学习的特点

(1)强调了模型结构的重要性:深度学习所使用的深层神经网络(Deep Neural Network,DNN)算法中,隐藏层往往会有多层,是具有多个隐藏层的深层神经网络,而不是传统“浅层神经网络”,这也正是“深度学习”的名称由来。

(2)强调非线性处理:线性函数的特点是具备齐次性和可加性,因此线性函数的叠加仍然是线性函数,如果不采用非线性转换,多层的线性神经网络就会退化成单层的神经网络,最终导致学习能力低下。深度学习引入激活函数,实现对计算结果的非线性转换,避免多层神经网络退化成单层神经网络,极大地提高了学习能力。

**(3)特征提取和特征转换:**深层神经网络可以自动提取特征,将简单的特征组合成复杂的特征,也就是说,通过逐层特征转换,将样本在原空间的特征转换为更高维度空间的特征,从而使分类或预测更加容易。与人工提取复杂特征的方法相比,利用大数据来学习特征,能够更快速、方便地刻画数据丰富的内在信息。

深度学习与人工智能、机器学习的关系

在这里插入图片描述

深度学习面临的挑战

由于深度学习是一项相对较新的技术,因此其实际实施会带来某些挑战。

大量高质量的数据

在大量高质量数据上训练深度学习算法时,可以获得更好的效果。输入数据集中的异常值或错误会显著影响深度学习过程。例如,在我们的动物图像示例中,如果数据集中意外引入了非动物图像,深度学习模型可能会将飞机归类为海龟。

为避免此类错误,必须先清理和处理大量数据,然后再训练深度学习模型。输入数据预处理需要大量的数据存储容量。

处理能力

深度学习算法是计算密集型的,需要具有足够计算能力的基础设施才能正常运行。否则,它们需要很长的时间来处理结果,GPU的出现让人看到了曙光,也造就了深度学习的蓬勃发展。

六、总结

人工智能是一个很广泛的概念,机器学习是人工智能的重要实现方式,即子集,而深度学习又是机器学习的一个子集,三者的关系如下图所示:

img

在这里插入图片描述

七、未来展望

笔者认为在未来的10年内,使用基本的机器学习算法来优化业务问题将成为IT行业的标准配置。许多工作将部分地被AI取代,至少目前的推荐系统、搜索引擎和广告领域已经基本上被AI完全取代了。

八、参考资料

  • 神经网络入门
  • 什么是深度学习?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1973237.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Hot100】LeetCode—76. 最小覆盖子串

题目 原题链接:76. 最小覆盖子串 1- 思路 利用两个哈希表解决分为 :① 初始化哈希表、②遍历 s,处理当前元素,判断当前字符是否有效、③收缩窗口、④更新最小覆盖子串 2- 实现 ⭐76. 最小覆盖子串——题解思路 class Solution …

Python | Leetcode Python题解之第316题去除重复字母

题目: 题解: class Solution:def removeDuplicateLetters(self, s: str) -> str:vis defaultdict(int)cnt defaultdict(int)for ch in s: cnt[ch] 1queue []for ch in s:if vis[ch] 0:while queue and queue[-1] > ch and cnt[queue[-1]]:vi…

VS Code设置C++编译器路径

C_Cpp.default.compilerPath是C/C编译器路径; python.condaPath是conda路径.

Could not connect to Redis at 127.0.0.1:6379: 由于目标计算机积极拒绝,无法连接

目录 报错 解决办法 报错 在redis文件夹的路径栏中输入 cmd 命令,打开控制栏窗口界面 报错说是 redis-cli.exe打开就显示Could not connect to Redis at 127.0.0.1:6379: 由于目标计算机积极拒绝,无法连接。 解决办法 (1)cmd…

【教学类-71-01】20240802蔬菜切切乐01

背景需求: ✂️自制教具分享✂️蔬菜切切乐(剪纸) - 小红书 (xiaohongshu.com)https://www.xiaohongshu.com/explore/65bf6809000000001100fa53?app_platformandroid&ignoreEngagetrue&app_version8.46.0&share_from_user_hidd…

mybatis保存postgresql数组格式数据

新建表的时候在int4后加上[]中括号就行 -- 创建数组 SELECT ARRAY[1, 2, 3, 4, 5];-- 访问数组元素(从1开始) SELECT ARRAY[1, 2, 3, 4, 5][1]; -- 返回 1-- 数组长度 SELECT array_length(ARRAY[1, 2, 3, 4, 5], 1); -- 返回 5-- 数组连接 SELECT ARRA…

C语言 | Leetcode C语言题解之第316题去除重复字母

题目&#xff1a; 题解&#xff1a; char* removeDuplicateLetters(char* s) {int vis[26], num[26];memset(vis, 0, sizeof(vis));memset(num, 0, sizeof(num));int n strlen(s);for (int i 0; i < n; i) {num[s[i] - a];}char* stk malloc(sizeof(char) * 27);int stk…

Linux软件编程

8月1日学习了最后的标准IO&#xff0c;流的偏移。然后进入了文件IO的学习&#xff0c;包括文件的打开、读写、关闭以及偏移。之后又学习了剩余的一些函数接口&#xff0c;可以对文件进行一些其余操作。 8月2日学习了目录文件和链接文件的操作。目录文件的操作包括目录的创建、…

8月17日|广州|Cocos开发者沙龙不见不散!

6月底举行的Cocos成都沙龙吸引了近200位开发者和10多家发行&#xff0c;得到了大家的一致好评。 Cocos广州沙龙即将到来&#xff0c;会邀请更多KOL和头部发行、渠道嘉宾分享行业经验&#xff0c;让大家实现技术干货、游戏合作、行业信息多丰收。 活动主题&#xff1a;小游戏与出…

二叉树构建(从3种遍历中构建)python刷题记录

R3-树与二叉树篇. 目录 从前序与中序遍历序列构造二叉树 算法思路&#xff1a; 灵神套路 从中序与后序遍历序列构造二叉树 算法思路&#xff1a; 灵神套路 从前序和后序遍历序列构造二叉树 算法思路&#xff1a; 灵神套路 从前序与中序遍历序列构造二叉树 算法…

请你学习:前端布局2 - 定位(Positioning)是一种重要的布局技术

在页面布局中&#xff0c;定位&#xff08;Positioning&#xff09;是一种重要的布局技术&#xff0c;它允许我们精确地控制元素在页面上的位置。定位模式、是否脱标以及移动位置是理解定位的三个关键方面。 1 定位模式 定位模式决定了元素在文档中的定位方式&#xff0c;通过…

一款完全免费的数据恢复软件

WinFR&#xff0c;Windows文件恢复&#xff08;微软命令行程序&#xff09;的免费图形界面&#xff0c;帮您轻松恢复文件。WinFR是免费的Windows数据恢复替代方案&#xff0c;支持U盘数据恢复、硬盘数据恢复、存储卡数据恢复、文件数据恢复等功能。WinFR完全调用Windows文件恢复…

简单的docker学习 第2章docker引擎

第2章docker引擎 2.1Docker 引擎发展历程 2.1.1 首发版本架构 Docker 在首次发布时&#xff0c;其引擎由两个核心组件构成&#xff1a;LXC&#xff08;Linux Container&#xff09;与 Docker Daemon。不过&#xff0c;该架构依赖于 LXC&#xff0c;使得 Docker 存在严重的问…

第一百八十六节 Java XML教程 - Java DOM编辑

Java XML教程 - Java DOM编辑 属性 以下代码显示如何向元素添加属性。 import java.io.StringWriter;import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.transform.OutputKeys; import javax.xml.transform.Tr…

【OS】AUTOSAR OS Spinlock实现原理(下篇)

目录 3.1 Spinlock配置代码 3.1.1 Os_SpinlockConfigType_Tag 3.1.2 Os_LockConfigType_Tag 3.1.3 不同配置参数对配置代码生成的影响 3.2 Os_GetSpinlock详解 3.2.1 Os_SpinlockIsNotLockedLocal 3.2.2 Os_SpinlockIsLockOrderValid 3.2.3 Os_SpinlockSuspendByMethod…

bias偏置项(bias term)

bias偏置项&#xff08;bias term&#xff09;或者称为截距项&#xff08;intercept term&#xff09; 简称b 它其实就是函数的截距&#xff0c;与线性方程y wx b中的b的意义是一样的。 在y wx b中&#xff0c;b表示函数在y轴上的截距&#xff0c;控制着函数偏离原点的距…

食品安全知识竞赛规则及流程方案

活动简介 本届竞赛以“反食品浪费”为主线&#xff0c;在专业知识比拼基础上&#xff0c;融入了食物贮存方法、标签标识认知等生活化场景&#xff0c;将科普知识与日常生活紧密结合&#xff0c;更深入地践行“以赛促学 以学促行”的比赛口号&#xff0c;旨在通过大学生群体带动…

vue3集成LuckySheet实现导入本地Excel进行在线编辑,以及导出功能

第一步&#xff1a;克隆或者下载下面的代码 git clone https://github.com/dream-num/Luckysheet.git第二步&#xff1a;安装依赖 npm install npm install gulp -g 第三步&#xff1a;运行 npm run dev效果如下图所示 第四步&#xff1a;打包 打包执行成功后&#xff0c;…

萤石摄像头更换wifi操作记录

手机和摄像头在同一wifi下下载萤石云视频app长按reset,蓝灯常闪app中配置WiFi&#xff0c;要输入设备验证码&#xff0c;在设备上有配置完就可以了 H264编码修改方法https://open.ys7.com/bbs/article/14

️ LangChain +Streamlit+ Llama :将对话式人工智能引入您的本地设备(下篇)

引言&#xff1a;种下一棵树最好的时间是十年前,其次是现在 书接上回&#xff1a;将对话式人工智能引入您的本地设备成为可能CSDNhttps://mp.csdn.net/mp_blog/creation/editor/140865426 目的&#xff1a;在这个大模型横行的时候&#xff0c;我们常用电脑如何开展大模型的工作…