收藏!当今最流行的10 种人工智能算法

news2024/11/24 19:51:44

人工智能的概念始于1956年的达特茅斯会议,由于受到数据、计算力、智能算法等多方面因素的影响,人工智能技术和应用发展经历了多次高潮和低谷。

2022年以来,以ChatGPT为代表的大模型一夜爆火,它能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。人工智能技术突然进入了新的阶段。

数据、计算力和算法被认为是人工智能发展的三大核心要素,数据是基础,算法是核心,计算力是支撑。
所有机器学习模型都旨在学习某个函数 (f),该函数提供输入值 (x) 和输出值 (y) 之间最精确的相关性。Y=f(X)
最常见的情况是,我们有一些历史数据X和Y,并且可以部署 AI 模型来提供这些值之间的最佳映射。结果不可能 100% 准确,否则这将是一个简单的数学计算,不需要机器学习。相反,我们训练的 f 函数可用于使用新的 X来预测新的Y,从而实现预测分析。各种机器学习模型通过采用不同的方法来实现这一结果,这是机器学习的基本原理。

现实中面临的问题数量巨大,用于解决这些问题的机器学习模型也多种多样,因为某些算法比其他算法更擅长处理某些类型的问题。因此,我们需要清楚地了解每种算法的优点与缺点,今天我们列出了 10 种最流行的 AI 算法,期望对大家有所帮助。

1、线性回归

迄今为止,线性回归在数理统计中的应用已有 200 多年的历史。该算法的要点是找到对我们尝试训练的函数f的精度影响最大的系数(B)值。最简单的例子是y= B0 + B1 * x,其中 B0 + B1 是所讨论的函数。

通过调整这些系数的权重,数据科学家可以获得不同的训练结果。该算法成功的核心要求是拥有清晰的数据,其中没有太多噪声(低值信息),并删除具有相似值(相关输入值)的输入变量。

线性回归就是要找一条直线,并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变量(x 值)和数值结果(y 值)。然后就可以用这条线来预测未来的值!

这种算法最常用的技术是最小二乘法(Least of squares)。这个方法计算出最佳拟合线,以使得与直线上每个数据点的垂直距离最小。总距离是所有数据点的垂直距离(绿线)的平方和。其思想是通过最小化这个平方误差或距离来拟合模型。



线性回归算法经常用在对金融、银行、保险、医疗保健、营销和其他行业的统计数据进行梯度下降优化。

2、逻辑回归

逻辑回归是另一种流行的人工智能算法,能够提供二进制结果。这意味着该模型既可以预测结果,又可以指定 y 值的两类之一。该函数也是基于改变算法的权重,但由于使用非线性逻辑函数来转换结果,因此有所不同。该函数可以表示为一条 S 形线,将真值与假值分开。

成功的要求与线性回归相同——删除相同值的输入样本并减少噪声量(低值数据)。这是一个非常简单的函数,可以相对快速地掌握,并且非常适合执行二元分类。

3、决策树

这是最古老、最常用、最简单且最高效的机器学习模型之一。它是一个经典的二叉树,每次分割都会做出“是” 或“否”的决定,直到模型到达结果节点。

在这一算法中,训练模型通过学习树表示(Tree representation)的决策规则来学习预测目标变量的值。树是由具有相应属性的节点组成的。在每个节点上,我们根据可用的特征询问有关数据的问题。左右分支代表可能的答案。最终节点(即叶节点)对应于一个预测值。

每个特征的重要性是通过自顶向下方法确定的。节点越高,其属性就越重要。

该模型简单易学,不需要数据标准化,常用于回归和分类任务。

4、朴素贝叶斯

朴素贝叶斯(Naive Bayes)是基于贝叶斯定理。它测量每个类的概率,每个类的条件概率给出 x 的值。这个算法用于分类问题,得到一个二进制“是 / 非”的结果。这是一种简单但非常强大的模型,用于解决各种复杂问题。它可以计算两种类型的概率:

  1. 各班级出场机会一次
  2. 假设有额外的x修饰符,则独立类的条件概率。

该模型被称为朴素模型,因为它的运行假设所有输入数据值彼此无关。虽然这在现实世界中不可能发生,但这种简单的算法可以应用于大量标准化数据流,以高度准确地预测结果。

5、支持向量机

支持向量机(Support Vector Machine,SVM)是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线,它们之间的边距最大。为此,我们将数据项绘制为 n 维空间中的点,其中,n 是输入特征的数量

在此基础上,支持向量机找到一个最优边界,称为超平面(Hyperplane),它通过类标签将可能的输出进行最佳分离。

超平面与最近的类点之间的距离称为边距。最优超平面具有最大的边界,可以对点进行分类,从而使最近的数据点与这两个类之间的距离最大化。

最好的超平面是具有最大正向量并分隔大部分数据节点的超平面。这是一个极其强大的分类机,可以应用于广泛的数据标准化问题。

6、K-最近邻

这是一个非常简单但非常强大的机器学习模型,使用整个训练数据集作为表示字段。结果值的预测是通过检查整个数据集中具有相似值的 K 个数据节点(所谓的邻居)并使用欧几里德数(可以根据值差异轻松计算)来确定结果值来计算的。结果值的预测是通过检查整个数据集中具有相似值的 K 个数据节点(所谓的邻居)并使用欧几里德数(可以根据值差异轻松计算)来确定结果值来计算的。

此类数据集可能需要大量计算资源来存储和处理数据,当存在多个属性时,会遭受准确性损失,并且必须不断进行整理。然而,它们的工作速度非常快,在大型数据集中查找所需值时非常准确且高效。

7、K- 均值

K- 均值(K-means)是通过对数据集进行分类来聚类的。例如,这个算法可用于根据购买历史将用户分组。它在数据集中找到 K 个聚类。K- 均值用于无监督学习,因此,我们只需使用训练数据 X,以及我们想要识别的聚类数量 K。

该算法根据每个数据点的特征,将每个数据点迭代地分配给 K 个组中的一个组。它为每个 K- 聚类(称为质心)选择 K 个点。基于相似度,将新的数据点添加到具有最近质心的聚类中。这个过程一直持续到质心停止变化为止。

8、随机决策森林或套袋

这个算法的基本思想是,许多人的意见要比个人的意见更准确。为了对新对象进行分类,我们从每个决策树中进行投票,并结合结果,然后根据多数投票做出最终决定。

随机决策森林由决策树组成,其中多个数据样本由决策树处理,并将结果聚合(就像将许多样本收集在一个袋子中)以找到更准确的输出值。

不是寻找一条最佳路线,而是定义多条次优路线,从而使整体结果更加精确。如果决策树解决了您所追求的问题,那么随机森林是该方法的一种调整,可以提供更好的结果。

9、降维

由于我们今天能够捕获的数据量之大,机器学习问题变得更加复杂。这就意味着训练极其缓慢,而且很难找到一个好的解决方案。这一问题,通常被称为“维数灾难”(Curse of dimensionality)。

降维(Dimensionality reduction)试图在不丢失最重要信息的情况下,通过将特定的特征组合成更高层次的特征来解决这个问题。主成分分析(Principal Component Analysis,PCA)是最流行的降维技术。

主成分分析通过将数据集压缩到低维线或超平面 / 子空间来降低数据集的维数。这尽可能地保留了原始数据的显著特征。

可以通过将所有数据点近似到一条直线来实现降维的示例。

10、深度神经网络

神经网络本质上是一组带有权值的边和节点组成的相互连接的层,称为神经元。它将上一层的输出特征作为下一层的输入进行特征学习,通过逐层特征映射后,将现有空间样本的特征映射到另一个特征空间,以此来学习对现有输入具有更好的特征表达。深度神经网络具有多个非线性映射的特征变换,可以对高度复杂的函数进行拟合。如果将深层结构看作一个神经元网络,则深度神经网络的核心思想可用三个点描述如下:

(1)每层网络的预训练均采用无监督学习;
(2)无监督学习逐层训练每一层,即将上一层输出作 下一层的输入;
(3)有监督学习来微调所有层(加上一个用于分类的分类器)。

深度神经网络与传统神经网络的主要区别在于训练机制。

为了克服传统神经网络容易过拟合及训练速度慢等不足,深度神经网络整体上采用逐层预训练的训练机制,而不是采用传统神经网络的反向传播训练机制。

优点:

  • 克服了人工设计特征费时、费力的缺点;
  • 通过逐层数据预训练得到每层的初级特征;
  • 分布式数据学习更加有效(指数级);
  • 相比浅层建模方式,深层建模能更细致高效的表示实际的复杂非线性问题。

DNN 是最广泛使用的人工智能和机器学习算法之一。基于深度学习的文本和语音应用程序、用于机器感知和 OCR 的深度神经网络、使用深度学习来增强强化学习和机器人运动以及 DNN 的其他杂项应用都有显着改进。

总结

正如您所看到的,人工智能算法和机器学习模型种类繁多。有些更适合数据分类,有些则在其他领域表现出色。没有一种算法适合所有领域,因此选择最适合您的情况的算法至关重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1292593.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Unity UGUI TextMeshPro实现输入中文和表情包(Emoji)表情

目录 实现中文显示 准备工作 1、打开Window——TextMeshPro——FontAssetCreator 2、把字体文件放入SourceFont中 3、把CharacterSet改为Characters from File 4、把字体库文件放入Characters File 5、设置好参数点击Generate Font Atlas等待完成后保存 6、把生成后保存…

代码随想录算法训练营第44天| 完全背包 518. 零钱兑换 II 377. 组合总和 Ⅳ

JAVA代码编写 52. 携带研究材料 题目描述 小明是一位科学家,他需要参加一场重要的国际科学大会,以展示自己的最新研究成果。他需要带一些研究材料,但是他的行李箱空间有限。这些研究材料包括实验设备、文献资料和实验样本等等,…

在Ascend昇腾硬件用npu加速paddleLite版本ocr(nnadapter)

在Ascend昇腾硬件用npu加速paddleLite版本ocr(nnadapter) 参考文档* nnadapter参考文档地址* 华为昇腾 NPU参考文档地址* PaddleLite的CAPI参考文档 一.确保cpu版本运行正常二.编译Ascend上npu加速库三.跑通npu加速版本Demo1.Demo下载地址2.参考手册网址…

Python 作业答疑

1. 哥德巴赫猜想 问题描述: 2000以内的不小于4的正偶数都能够分解为两个素数之和(即验证歌德巴赫猜想对2000以内的正偶数成立)。 问题分析: 根据问题描述,为了验证歌德巴赫猜想对2000以内的正偶数都是成立的&#…

html+css+js 三亚旅游网页设计与制作实例(6个页面)

一、作品介绍 HTMLCSSJS网页设计与制作,三亚旅游网页设计与制作实例, 本实例适合于初学HTMLCSSJS的同学。该案例里面有divcss的样式布局设置,这个实例比较全面,有一级页、二级页、详情页、输入表单等,共6个页面。本文…

(Gemini)双子座:一系列高能力多模态模型的前世今生

🌷🍁 博主猫头虎 带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 &a…

推荐一个开源的监控程序-Uptime

先放几张截图介绍一下 现场演示 尝试一下! 东京演示服务器:https://demo.uptime.kuma.pet(由 Uptime Kuma 赞助商 赞助) 这是一个临时的现场演示,所有数据将在10分钟后删除。使用距离您较近的一个,但我建…

《使用ThinkPHP6开发项目》 - 安装ThinkPHP框架

1.安装ThinkPHP6框架 这里我们使用的是composer安装的安装方式,请确保电脑已经安装了composer,如未安装可查看Composer 安装与使用 | 菜鸟教程 composer create-project topthink/think tp 上面命令安装的是稳定版的,也是最新的稳定版&…

Pygame游戏实战七:求解迷宫

介绍模块 本游戏使用的是由Pycharm中的pygame模块来实现的,也可以在python中运行。通过Pygame制作一个迷宫,迷宫可以自定义,出入口,通过移动来逃离迷宫,走到出口,看看这个是你小时候玩的游戏吗&#xff1f…

FFA 2023 明日开幕,Flink 智能诊断、小红书流批一体实践精彩来袭

近年来,流批一体的技术思想势头火热,即“将批处理和流处理相结合,实现更好的数据处理能力”,已成功从理论层面走进现实世界。Flink 是一款高吞吐量、低延迟的流处理引擎,具备统一接口、高性能、低延迟、容错性和可扩展…

软著项目推荐 深度学习验证码识别 - 机器视觉 python opencv

文章目录 0 前言1 项目简介2 验证码识别步骤2.1 灰度处理&二值化2.2 去除边框2.3 图像降噪2.4 字符切割2.5 识别 3 基于tensorflow的验证码识别3.1 数据集3.2 基于tf的神经网络训练代码 4 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 &#x…

@德人合科技 | 数据透明加密防泄密系统\文件文档加密\设计图纸加密|源代码加密防泄密软件系统,——防止内部办公终端核心文件数据/资料外泄!

一款专业的数据防泄密管理系统,它采用了多种加密模式,包括透明加密、半透明加密和落地加密等,可以有效地保护企业的核心数据安全。 PC端访问地址: https://isite.baidu.com/site/wjz012xr/2eae091d-1b97-4276-90bc-6757c5dfedee …

AWR1642 boost开发板支持的TI参考设计

打开radar_toolbox_1_30_00_05\source\ti\examples\examples_overview,通过输入“1642”查找AWR1642 BOOST支持的参考设计,通过筛选,支持AWR1642 BOOST的参考设计如下: 挑选出两个参考设计上手,一个是“nonos_oob_16xx",不带OS;另一个是”short range radar“,比较…

单月创作15个10w+作品,内容创作迎来新浪潮

据11月16日腾讯发布的Q3财报显示,本季度视频号总播放量同比增长超过50%,原创内容播放量增长强劲,视频号作为微信生态内最具增长潜力的产品之一,已然成为腾讯营收新动力。 为帮助大家更好地洞察视频号平台的内容趋势及创作风向&…

矿山数字孪生-只需要这几步就能快速构建智慧矿山管理系统

在万物互联、智慧协同的技术浪潮下,矿山日常管理及运营中使用到的智慧化平台越来越丰富,而各个管理子系统间往往独立,相互为数据孤岛。智慧矿山管理平台就是将各个孤岛中的数据及功能汇集起来,形成统一的、联动的管理门户。 智慧…

负债127万美元的【后羿国际】申请1亿美元纳斯达克IPO上市

来源:猛兽财经 作者:猛兽财经 猛兽财经获悉,总部位于深圳的后羿国际(HOUYI DIGITAL INTERNET INDUSTRY TECHNOLOGY CO., LTD)近期已向美国证券交易委员会(SEC)提交招股书,申请在纳斯…

LabVIEW使用单板RIO开发远程监控电源信号

LabVIEW使用单板RIO开发远程监控电源信号 设计和构建用于智能电网的本地功耗分析系统,主要服务于领先的电力监控设备设计者和制造商。随着智能电网投资的增加,对于能够有效处理替代电源(如太阳能和风能)间歇性功率水平的技术需求…

Swift 中 User Defaults 的读取和写入

文章目录 前言介绍 User Defaults共享 User DefaultsUser Defaults 存储数据类型响应更改监控 User Defaults 更改覆盖User Defaults 设置考虑的替代方案Keychain 用于安全性用于跨平台的 CloudKit 结论 前言 User Defaults 是 Swift 应用程序存储在应用启动之间保持的首选项的…

如何在 PyQt 中实现异步数据库请求

需求 开发软件的时候不可避免要和数据库发生交互,但是有些 SQL 请求非常耗时,如果在主线程中发送请求,可能会造成界面卡顿。这篇博客将会介绍一种让数据库请求变得和前端的 ajax 请求一样简单,且不会阻塞界面的异步请求方法。 实…

kepler.gl部署在线说明文档

1 概述 1.1 介绍 1、Kepler.gl 是一个强大的开源地理空间分析工具,用于大规模数据集的可视化。它由 Uber 的数据可视化团队开发,并且是基于 Web 技术构建的。Kepler.gl 涉及到以下几个主要技术领域: WebGL: Kepler.gl 通过 WebGL 进行渲染…