什么是机器学习,机器学习与人工智能的区别是什么(一)?

news2024/12/23 17:30:35

image.png

人工智能和计算机游戏领域的先驱阿瑟·塞缪尔(Arthur Samuel)创造了 "机器学习"一词。他将机器学习定义为 “一个让计算机无需明确编程即可学习的研究领域” 。通俗地说,机器学习(ML)可以解释为根据计算机的经验自动化和改进计算机的学习过程,而无需实际编程,即无需任何人工帮助。该过程首先提供高质量的数据,然后通过使用数据和不同算法构建机器学习模型来训练我们的机器(计算机)。算法的选择取决于我们拥有什么类型的数据以及我们想要自动化的任务类型。

什么是机器学习?

机器学习人工智能的一个分支,它通过学习数据集的隐藏模式来开发算法,并使用它来对新的相似类型数据进行预测,而无需为每个任务进行显式编程。

传统机器学习将数据与统计工具相结合来预测可用于形成可行见解的输出。

机器学习用于许多不同的应用,从图像和语音识别到自然语言处理、推荐系统、欺诈检测、投资组合优化、自动化任务等等。机器学习模型还用于为自动驾驶汽车、无人机和机器人提供动力,使它们更加智能并能够适应不断变化的环境。

强化学习是另一种类型的机器学习,可用于改进基于推荐的系统。在强化学习中,代理学习根据其环境的反馈做出决策,并且该反馈可用于改进向用户提供的建议。例如,系统可以跟踪用户观看推荐电影的频率,并使用此反馈来调整未来的推荐。

基于机器学习的个性化推荐在许多行业中越来越受欢迎,包括电子商务、社交媒体和在线广告,因为它们可以提供更好的用户体验并增加对平台或服务的参与度。

这一突破源于这样一种想法:机器可以从数据(即示例)中单独学习以产生准确的结果。

机器学习-Geeksforgeeks

机器学习与传统编程的区别

机器学习与传统编程的区别如下:

机器学习传统编程人工智能
机器学习是人工智能 (AI) 的一个子集,专注于从数据中学习以开发可用于进行预测的算法。在传统编程中,基于规则的代码是由开发人员根据问题陈述编写的。人工智能涉及使机器变得尽可能强大,以便它能够执行通常需要人类智能的任务。
机器学习使用数据驱动的方法,通常根据历史数据进行训练,然后用于对新数据进行预测。传统编程通常是基于规则的和确定性的。它没有机器学习和人工智能等自学习功能。人工智能可以涉及许多不同的技术,包括机器学习和深度学习,以及传统的基于规则的编程。
机器学习可以在大型数据集中找到人类可能难以发现的模式和见解。传统的编程完全依赖于开发人员的智慧。因此,它的能力非常有限。有时,人工智能会结合使用数据和预定义规则,这使其在以高精度解决复杂任务方面具有巨大优势,而这对于人类来说似乎是不可能的。
机器学习是人工智能的子集。现在它被用于各种基于人工智能的任务,如聊天机器人问答、自动驾驶汽车等。传统编程通常用于构建具有特定功能的应用程序和软件系统。人工智能是一个广泛的领域,包括许多不同的应用,包括自然语言处理、计算机视觉和机器人技术。

机器学习算法如何工作

机器学习以以下方式工作。

  • 前向传递: 在前向传递中,机器学习算法接收输入数据并产生输出。根据模型算法计算预测。
  • 损失函数: 损失函数也称为误差或成本函数,用于评估模型预测的准确性。该函数将模型的预测输出与实际输出进行比较,并计算它们之间的差异。这种差异称为错误或损失。模型的目标是通过调整其内部参数来最小化误差或损失函数。
  • 模型优化过程: 模型优化过程是调整模型内部参数以最小化误差或损失函数的迭代过程。这是使用优化算法(例如梯度下降) 来完成的。优化算法计算误差函数相对于模型参数的梯度,并使用该信息来调整参数以减少误差。该算法重复此过程,直到误差最小化到令人满意的水平。

一旦模型在训练数据上进行了训练和优化,它就可以用于对新的、看不见的数据进行预测。模型预测的准确性可以使用各种性能指标进行评估,例如准确度、精确度、召回率和 F1 分数。

机器学习生命周期:

机器学习项目的生命周期涉及一系列步骤,其中包括:

  1. 研究问题: 第一步是研究问题。此步骤涉及理解业务问题并定义模型的目标。

  2. 数据收集: 当问题明确后,我们就可以收集模型所需的相关数据。数据可能来自各种来源,例如数据库、API 或网络抓取。

  3. 数据准备

    收集与问题相关的数据时。那么最好正确检查数据并将其设置为所需的格式,以便模型可以使用它来查找隐藏的模式。这可以通过以下步骤完成:

    • 数据清洗
    • 数据转换
    • 解释性数据分析和特征工程
    • 拆分数据集以进行训练和测试。
  4. 模型选择: 下一步是选择适合我们问题的机器学习算法。此步骤需要了解不同算法的优点和缺点。有时我们使用多个模型并比较它们的结果并根据我们的要求选择最佳模型。

  5. 模型构建和训练

    选择算法后,我们必须构建模型。

    1. 在传统机器学习的情况下,构建模式很容易,只需进行一些超参数调整即可。
    2. 在深度学习的情况下,我们必须定义分层架构以及输入和输出大小、每层的节点数、损失函数、梯度下降优化器等。
    3. 使用预处理的数据集训练该模型之后。
  6. 模型评估: 模型训练完成后,可以使用分类报告、F1 分数、精度、召回率、ROC 曲线、均方误差、绝对误差等不同技术在测试数据集上对其进行评估,以确定其准确性和性能。

  7. 模型调优: 根据评估结果,可能需要对模型进行调优或优化以提高其性能。这涉及调整模型的超参数。

  8. 部署: 模型经过训练和调整后,可以将其部署在生产环境中以对新数据进行预测。此步骤需要将模型集成到现有的软件系统中或为模型创建一个新系统。

  9. 监控和维护: 最后,监控模型在生产环境中的性能并根据需要执行维护任务至关重要。这包括监控数据漂移、根据需要重新训练模型以及在新数据可用时更新模型。

机器学习的类型

  • 监督机器学习
  • 无监督机器学习
  • 强化机器学习

1.监督机器学习:

监督学习是机器学习的一种,其中算法在标记数据集上进行训练。它学习根据标记的训练数据将输入特征映射到目标。在监督学习中,算法提供输入特征和相应的输出标签,并学习从这些数据中进行泛化,以对新的、未见过的数据进行预测。

监督学习主要有两种类型:

  • 回归:回归是一种监督学习,算法学习根据输入特征预测连续值。回归中的输出标签是连续值,例如股票价格、房价。机器学习中不同的回归算法有:线性回归、多项式回归、岭回归、决策树回归、随机森林回归、支持向量回归等
  • 分类:分类是一种监督学习,算法学习根据输入特征将输入数据分配到特定类别或类别。分类中的输出标签是离散值。分类算法可以是二元的,其中输出是两个可能的类别之一,也可以是多类别的,其中输出可以是多个类别之一。机器学习中不同的分类算法有:逻辑回归、朴素贝叶斯、决策树、支持向量机(SVM)、K-最近邻(KNN)等.

2.无监督机器学习:

无监督学习是机器学习的一种类型,其中算法无需使用标记示例进行显式训练即可学习识别数据中的模式。无监督学习的目标是发现数据的底层结构或分布。

无监督学习主要有两种类型:

  • 聚类:聚类算法根据相似的数据点的特征将其分组在一起。目标是识别彼此相似但与其他组不同的数据点组或集群。一些流行的聚类算法包括 K-means、层次聚类和 DBSCAN。
  • 降维: 降维算法减少数据集中输入变量的数量,同时保留尽可能多的原始信息。这对于降低数据集的复杂性并使其更易于可视化和分析非常有用。一些流行的降维算法包括主成分分析 (PCA)、t-SNE 和自动编码器。

3. 强化机器学习

强化学习是一种机器学习,其中代理通过执行操作并根据其操作接收奖励或惩罚来学习与环境交互。强化学习的目标是学习一种策略,它是从状态到行动的映射,随着时间的推移最大化预期累积奖励。

强化学习主要有两种类型:

  • 基于模型的强化学习: 在基于模型的强化学习中,代理学习环境模型,包括状态之间的转换概率以及与每个状态-动作对相关的奖励。然后,代理使用该模型来规划其行动,以最大化其预期奖励。一些流行的基于模型的强化学习算法包括值迭代和策略迭代。
  • 无模型强化学习:在无模型强化学习中,智能体直接从经验中学习策略,而无需显式构建环境模型。代理与环境交互并根据收到的奖励更新其策略。一些流行的无模型强化学习算法包括 Q-Learning、SARSA 和深度强化学习。

机器学习的需求:

机器学习很重要,因为它允许计算机从数据中学习并提高其在特定任务上的性能,而无需显式编程。这种从数据中学习并适应新情况的能力使得机器学习对于涉及大量数据、复杂决策和动态环境的任务特别有用。

以下是使用机器学习的一些特定领域:

  • 预测建模: 机器学习可用于构建预测模型,帮助企业做出更好的决策。例如,机器学习可用于预测哪些客户最有可能购买特定产品,或者哪些患者最有可能患上某种疾病。
  • 自然语言处理: 机器学习用于构建能够理解和解释人类语言的系统。这对于语音识别、聊天机器人和语言翻译等应用非常重要。
  • 计算机视觉: 机器学习用于构建可以识别和解释图像和视频的系统。这对于自动驾驶汽车、监控系统和医学成像等应用非常重要。
  • 欺诈检测: 机器学习可用于检测金融交易、在线广告和其他领域的欺诈行为。
  • 推荐系统:机器学习可用于构建推荐系统,根据用户过去的行为和偏好向他们推荐产品、服务或内容。

总体而言,机器学习已成为许多企业和行业的重要工具,因为它使他们能够更好地利用数据,改进决策流程,并为客户提供更加个性化的体验。

机器学习的各种应用

  • 自动化:机器学习,在任何领域完全自主地工作,无需任何人工干预。例如,机器人在制造工厂中执行基本的流程步骤。
  • 金融行业:机器学习在金融行业越来越受欢迎。银行主要使用机器学习来查找数据内部的模式,同时也防止欺诈。
  • 政府组织:政府利用机器学习来管理公共安全和公用事业。以拥有大规模人脸识别的中国为例。政府使用人工智能来防止乱穿马路。
  • 医疗保健行业:医疗保健是最早使用机器学习和图像检测的行业之一。
  • 营销: 由于数据的丰富性,人工智能在营销中得到了广泛的应用。在海量数据时代之前,研究人员开发了贝叶斯分析等先进的数学工具来估计客户的价值。随着数据的蓬勃发展,营销部门依靠人工智能来优化客户关系和营销活动。
  • 零售行业:零售行业使用机器学习来分析客户行为、预测需求和管理库存。它还可以根据每位顾客过去的购买情况和偏好推荐产品,帮助零售商为每位顾客提供个性化的购物体验。
  • 交通运输:机器学习在交通运输行业中用于优化路线、减少燃料消耗并提高交通系统的整体效率。它还在自动驾驶汽车中发挥着作用,其中机器学习算法用于做出有关导航和安全的决策。

机器学习的挑战和局限性

机器学习的局限性:

  1. 机器学习的主要挑战是缺乏数据或数据集的多样性。
  2. 如果没有可用数据,机器就无法学习。此外,缺乏多样性的数据集会给机器带来困难。
  3. 机器需要具有异质性才能学习有意义的洞察力。
  4. 当没有变化或变化很少时,算法很少能提取信息。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

资源分享

图片

大模型AGI学习包

图片

图片

资料目录

  1. 成长路线图&学习规划
  2. 配套视频教程
  3. 实战LLM
  4. 人工智能比赛资料
  5. AI人工智能必读书单
  6. 面试题合集

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

1.成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

图片

2.视频教程

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩

图片

3.LLM

大家最喜欢也是最关心的LLM(大语言模型)

图片

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1877952.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

前端学习笔记(2406261):jquery使用checkbox控制页面自动刷新

文章目录 需求登录页面主页面 API用户登录login获取数据getdata 代码登录页面主页面 关于后端 需求 这是一个物联网的演示项目,web端能够实时显示后台数据的变化,其流程非常简单: 用户登录登录成功后显示主界面面主界面进入后自动显示数据数…

Java中的Checked Exception和Unchecked Exception的区别

在Java中,异常分为两大类:已检查异常(Checked Exception)和未检查异常(Unchecked Exception)。 已检查异常是在编译时必须被捕获或声明的异常。换句话说,如果你的方法可能会抛出某个已检查异常&…

古人的智慧结晶——水铳:揭秘明清时期的消防神器

明代的《奇器图说》是一本记录了当时各种奇巧机械的著作,而水铳则是书中记载的一项令人惊叹的发明,它不仅展示了古人对物理原理的深刻理解,更是早期消防技术的一个缩影。 水铳,这个名字听起来似乎有些陌生,但在古代&am…

Kafka~消息发送过程与ISR机制了解

消息发送过程 使用Kafka发送消息时,一般有两种方式分别是: 同步发送异步发送 同步发送时,可以在发送消息后,通过get方法等待消息结果,这种情况能够准确的拿到消息最终的发送结果,要么是成功、要么是失败…

AES加密算法及AES-CMAC原理白话版系统解析

本文框架 前言1. AES加密理论1.1 不同AES算法区别1.2 加密过程介绍1.2.1 加密模式和填充方案选择1.2.2 密钥扩展1.2.3分组处理1.2.4多轮加密1.2.4.1字节替换1.2.4.2行移位1.2.4.3列混淆1.2.4.4轮密钥加1.3 加密模式1.3.1ECB模式1.3.2CBC模式1.3.3CTR模式1.3.4CFB模式1.3.5 OFB模…

社团成员信息系统

ER实体关系图与数据库模型 DDL CREATE TABLE club (club_id int(11) NOT NULL AUTO_INCREMENT,club_name varchar(100) NOT NULL,president_name varchar(50) DEFAULT NULL,foundation_date date DEFAULT NULL,description text,PRIMARY KEY (club_id),KEY president_name (pr…

虚拟化技术(二)

目录 三、存储虚拟化(一)存储虚拟化的一般模型(二)存储虚拟化的实现方式(三)案例分析 四、网络虚拟化(一)核心层网络虚拟化(二)接入层网络虚拟化(…

生成独立的zedboard+ad9361起始项目

文件分享 链接:https://pan.baidu.com/s/17wB_9xVWjO7HhxNvmmZyuA 提取码:94zz 首先下载HDL和NO-OS项目 git clone --recursive https://github.com/analogdevicesinc/hdl git clone --recursive https://github.com/analogdevicesinc/no-OS下载…

L03_Redis知识图谱

这些知识点你都掌握了吗?大家可以对着问题看下自己掌握程度如何?对于没掌握的知识点,大家自行网上搜索,都会有对应答案,本文不做知识点详细说明,只做简要文字或图示引导。 Redis 全景图 Redis 知识全景图都包括什么呢?简单来说,就是“两大维度,三大主线”。 Redis …

基于springboot实现学生用品采购系统项目【项目源码+论文说明】

基于springboot实现学生用品采购系统演示 摘要 传统办法管理信息首先需要花费的时间比较多,其次数据出错率比较高,而且对错误的数据进行更改也比较困难,最后,检索数据费事费力。因此,在计算机上安装学生用品采购系统软…

STM32CubeMx的学习记录系列(2)- STM32G474RET6

最近有个小比赛,需要用到G4,不过找了一圈没有找到标准库的代码,只能使用hal,用CubeMX来生成配置代码。 共同特点 ARDUINO Uno V3 扩展连接器 ST morpho 扩展引脚接头,可完全访问所有 STM32 I/O 采用LQFP64或LQFP48封…

算法 —— 双指针

目录 移动零 复写零 快乐数 盛最多水的容器 有效三角形的个数 查找总价格为目标值的两个商品 三数之和 四数之和 移动零 下图以样例1为例,看下图如何做到保证非零元素相对顺序前提下,移动零元素。 代码实现如下: class Solution {…

1,Windows-本地Linux 系统(WSL)

目录 第一步电脑设置 第二步安装Ubuntu 第三文件传递 开发人员可以在 Windows 计算机上同时访问 Windows 和 Linux 的强大功能。 通过适用于 Linux 的 Windows 子系统 (WSL),开发人员可以安装 Linux 发行版(例如 Ubuntu、OpenSUSE、Kali、Debian、Arc…

如何有效保护生物医药企业隔离网数据导出的安全性?

生物医药企业的核心数据保护至关重要,企业为了保护内部的核心数据,会将网络进行物理隔离,将企业内⽹与外⽹隔离。⽹络隔离后,仍存在重要数据从内网导出至外网的隔离网数据导出需求。以下是一些需要特别保护的核心数据类型&#xf…

小米平板6系列对比

小米平板6系列目前有4款,分别为6、6 Pro、6 Max、6S Pro。具体对比如下表所示。 小米平板型号66 Pro6 Max6S Pro实物图发布时间2023年4月21日2023年4月21日2023年8月14日2024年2月22 日屏幕大小11英寸11英寸14英寸12.4英寸分辨率2.8K2.8K2.8K3K刷新率144Hz144Hz120…

EtherCAT笔记(四)——EtherCAT数据帧结构

EtherCAT数据包含2B的数据头和44~1948B的数据区。数据区由多个子报文组成。由于EtherCAT本身是通过以太网数据帧的形式传输,因此其协议帧中会携带以太网的帧头。 其中,解释如下: (1)以太网数据帧头:EtherC…

VSCode + GDB + J-Link 单片机程序调试实践

VSCode GDB J-Link 单片机程序调试实践 本文介绍如何创建VSCode的调试配置,如何控制调试过程,如何查看修改各种变量。 安装调试插件 在 VSCode 扩展窗口搜索安装 Cortex-Debug插件 创建调试配置 在 Run and Debug 窗口点击 create a launch.json …

C语言力扣刷题11——打家劫舍1——[线性动态规划]

力扣刷题11——打家劫舍1和2——[线性动态规划] 一、博客声明二、题目描述三、解题思路1、线性动态规划 a、什么是动态规划 2、思路说明 四、解题代码(附注释) 一、博客声明 找工作逃不过刷题,为了更好的督促自己学习以及理解力扣大佬们的解…

日志分析-windows系统日志分析

日志分析-windows系统日志分析 使用事件查看器分析Windows系统日志 cmd命令 eventvwr 筛选 清除日志、注销并重新登陆,查看日志情况 Windows7和Windowserver2008R2的主机日志保存在C:\Windows\System32\winevt\Logs文件夹下,Security.evtx即为W…

有哪些防爬虫的方法

防爬虫的方法有robots.txt文、user-agent过滤、ip限制、验证码、动态页面生成、频率限制、动态url参数和反爬虫技术等。详细介绍:1、robots.txt文件,用于告诉搜索引擎爬虫哪些页面可以访问,哪些页面禁止访问;2、ip限制&#xff0c…