机器学习--人工智能概述

news2024/11/18 10:27:51

人工智能概述

入门人工智能,了解人工智能是什么。为啥发展起来,用途是什么,是最重要也是最关键的事情。大致有以下思路。

  1. 人工智能发展历程
  2. 机器学习定义以及应用场景
  3. 监督学习,无监督学习
  4. 监督学习中的分类、回归特点
  5. 知道机器学习的开发流程

人工智能发展历程

  • 人工智能在现实生活中的应用
  • 人工智能发展必备三要素
  • 人工智能和机器学习、深度学习三者之间的关系

人工智能在现实生活中的应用

虽然人工智能在今天可能是一个流行词,但在明天,它可能会成为我们日常生活的标准一部分。事实上,它已经在这里了。

例如,自动驾驶汽车,学校门禁的人脸识别系统,手机语音助手,以及我们在各个平台上看视频的首页推荐。都是用到人工智能的。

人工智能发展必备三要素

  • 数据
  • 算法
  • 计算力
    • CPU,GPU,TPU

image-20240118183206567

  • 计算力之CPU、GPU对比:

    • CPU主要适合I\O密集型的任务

    • GPU主要适合计算密集型任务

CPU和GPU的区别:

http://www.sohu.com/a/201309334_468740

人工智能、机器学习和深度学习

image-20240118183437094

  • 人工智能和机器学习,深度学习的关系
    • 机器学习是人工智能的一个实现途径
    • 深度学习是机器学习的一个方法发展而来

发展历程

图灵测试

测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。多次测试(一般为5min之内),如果有超过**30%**的测试者不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能.

image-20240118183738033

人工智能主要分支

  • 计算机视觉
  • 语音识别
  • 文本挖掘/分类
  • 机器翻译
  • 机器人

机器学习定义以及应用场景

什么是机器学习

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。

image-20240118184021941

机器学习工作流程

image-20240118184109788

  • 机器学习工作流程总结
    • **1.**获取数据
    • **2.**数据基本处理
    • **3.**特征工程
    • 4.机器学习(模型训练)
    • **5.**模型评估

结果达到要求,上线服务

没有达到要求,重新上面步骤

获取到的数据集介绍

  • 数据简介

在数据集中一般:

一行数据我们称为一个样本

一列数据我们成为一个特征

有些数据有目标值(标签值),有些数据没有目标值

  • 数据类型构成:

数据类型一:特征值+目标值(目标值是连续的和离散的)

数据类型二:只有特征值,没有目标值

数据分割:

  • 机器学习一般的数据集会划分为两个部分:
    • 训练数据:用于训练,构建模型
    • 测试数据:在模型检验时使用,用于评估模型是否有效
  • 划分比例
    • 训练集:70% 80% 75%
    • 测试集:30% 20% 25%
特征工程

特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。

意义:会直接影响机器学习的效果

  • 注:业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

特征工程包含内容

  • 特征提取
  • 特征预处理
  • 特征降维

特征提取:例如将文字变成机器可以识别的语言

特征预处理:通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程

特征降维:指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程。;例如将3D图像变换成2D图像的过程。

机器学习算法分类

根据数据集组成不同,可以把机器学习算法分为:

  • 监督学习
  • 无监督学习
  • 半监督学习
  • 强化学习

监督学习

  • 输入数据是由输入特征值和目标值所组成。
    • 函数的输出可以是一个连续的值(称为回归),
    • 或是输出是有限个离散值(称作分类)。
回归

例如:预测房价,根据样本集拟合出一条连续曲线。

image-20240118185708552

分类

例如:根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”,是离散的。

image-20240118185726060

无监督学习

  • 输入数据是由输入特征值组成,没有目标值
    • 输入数据没有被标记,也没有确定的结果。样本数据类别未知;
    • 需要根据样本间的相似性对样本集进行类别划分。

image-20240118185828504

半监督学习

训练集同时包含有标记样本数据和未标记样本数据。

他与监督学习,无监督学习的区别就是模型在训练时需要人工标注的标签信息,监督学习利用大量的标注数据来训练模型,使模型最终学习到输入和输出标签之间的相关性;半监督学习利用少量有标签的数据和大量无标签的数据来训练网络;而无监督学习不依赖任何标签值,通过对数据内在特征的挖掘,找到样本间的关系,比如聚类。

监督学习:image-20240118190114710

半监督学习:

image-20240118190135101

强化学习

实质是make decisions 问题,即自动进行决策,并且可以做连续决策

举例:(学下棋)

小孩想要走路,但在这之前,他需要先站起来,站起来之后还要保持平衡,接下来还要先迈出一条腿,是左腿还是右腿,迈出一步后还要迈出下一步。

小孩就是 agent,他试图通过采取行动(即行走)来操纵环境(行走的表面),并且从一个状态转变到另一个状态(即他走的每一步),当他

完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃),并且当他不能走路时,就不会给巧克力。

主要包含五个元素:agent, action, reward, environment, observation;

强化学习的目标就是获得最多的累计奖励。

image-20240118190330019

监督学习强化学习
反馈映射输出的是之间的关系,可以告诉算法什么样的输入对应着什么样的输出。输出的是给机器的反馈 reward function,即用来判断这个行为是好是坏。
反馈时间做了比较坏的选择会立刻反馈给算法。结果反馈有延时,有时候可能需要走了很多步以后才知道以前的某一步的选择是好还是坏。
输入特征输入是独立同分布的。面对的输入总是在变化,每当算法做出一个行为,它影响下一次决策的输入。

模型评估

模型评估是模型开发过程不可或缺的一部分。它有助于发现表达数据的最佳模型和所选模型将来工作的性能如何。

按照数据集的目标值不同,可以把模型评估分为分类模型评估和回归模型评估。

  • 准确率
    • 预测正确的数占样本总数的比例。
  • 其他评价指标:精确率、召回率、F1-scoreAUC指标等

拟合

模型评估用于评价训练好的的模型的表现效果,其表现效果大致可以分为两类:过拟合、欠拟合。

在训练过程中,你可能会遇到如下问题:

训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢?

当算法在某个数据集当中出现这种情况,可能就出现了拟合问题。

欠拟合:模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来。

过拟合:所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳。

Azure机器学习模型搭建实验

可以进行很简便的图形化训练。

Azure Machine Learning(简称“AML”)是微软在其公有云Azure上推出的基于Web使用的一项机器学习服务,机器学习属人工智能的一个分支,它技术借助算法让电脑对大量流动数据集进行识别。这种方式能够通过历史数据来预测未来事件和行为,其实现方式明显优于传统的商业智能形式。

微软的目标是简化使用机器学习的过程,以便于开发人员、业务分析师和数据科学家进行广泛、便捷地应用。

这款服务的目的在于“将机器学习动力与云计算的简单性相结合”。

AML目前在微软的Global Azure云服务平台提供服务,用户可以通过站点:https://studio.azureml.net/ 申请免费试用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1396436.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

产品经理学习-产品运营《用户运营策略》

⽤户画像与⽤户运营策略 什么是用户画像 对产品运营而言,用户画像就是对用户的各种特征贴上标签通过这些标签将用户分成不同的用户群体 为用户提供有针对性的服务。 制作用户画像是为了专注和精准 使产品的服务对象更加聚焦,更加专注;根据产…

NIFI 2.0.0版本HTTPS访问部署

1. 相关环境 服务器:centos JDK:jdk21 NIFI: nifi-2.0.0-M1 2. 下载NIFI 下载NIFI https://nifi.apache.org/download/ 将文件上传至服务器指定目录,解压缩 修改 bin 目录下的脚本文件 ​ 注意: nifi 2.0.0 版本需要jdk21,所…

C++ 二叉树OJ题

目录 1、606. 根据二叉树创建字符串 2、102. 二叉树的层序遍历 3、107. 二叉树的层序遍历 II 4、236. 二叉树的最近公共祖先 5、JZ36 二叉搜索树与双向链表 6、105. 从前序与中序遍历序列构造二叉树 7、106. 从中序与后序遍历序列构造二叉树 8、144. 二叉树的前序遍历…

pdf怎么查看?6个不能错过的软件!

PDF,作为一种常用的文件格式,已经成为了我们工作、学习中的必备工具。然而,对于许多新手来说,如何查看和编辑PDF文件却是一个不小的挑战。今天,我们就来为大家详细介绍一下如何查看和编辑PDF文件,以及一些必…

从法律的角度看待项目前期可行性研究的必要性

前言 在司法实践中,很多纠纷展现出来的问题是项目提供方没有按照合同约定履行发生违约的情况,例如逾期交付、项目不符合约定标准等等,但是这些情况发生的原因是各不相同的,其中有一类纠纷的发生却是从一开始就埋下了风险的种子&a…

2.0-学成在线内容管理

内容管理模块 1.需求 1.1 业务流程 内容管理的业务由教学机构人员和平台的运营人员共同完成。 教学机构人员的业务流程如下: 1、登录教学机构。 2、维护课程信息,添加一门课程需要编辑课程的基本信息、上传课程图片、课程营销信息、课程计划、上传课程…

深入详解使用 RabbitMQ 过程中涉及到的多个细节问题(面试可用)

目录 1、基础类问题 2、cluster 相关问题 3、综合性问题 4、参考资料 C软件异常排查从入门到精通系列教程(专栏文章列表,欢迎订阅,持续更新...)https://blog.csdn.net/chenlycly/article/details/125529931C/C基础与进阶&…

OB OCP工具

文章目录 OCP产品架构OCP核心功能集群管理-集群拓扑图告警管理 OCP OCP(OceanBase Cloud Platform)是企业级数据库管理平台OceanBase 云平台(OceanBase Cloud Platform,OCP)是以 OceanBase 为核心的企业级数据库管理平…

外汇天眼:加拿大监管机构提出了关于持有加密资产的公共投资基金的规定

加拿大证券管理局(CSA)是由加拿大各省金融市场监管机构组成的国家机构。他们已发布了一组旨在征求意见的拟议监管要求,适用于寻求投资加密资产的公共投资基金。 Stan Magidson,CSA主席兼艾伯塔证券委员会主席兼首席执行官表示&…

无货源跨境电商到底应该怎么做,新手必看

如今,跨境电商无疑已经成为了一个热门的创业领域,但对于一些新手来说,面临的一个主要挑战是如何处理产品的货源问题。下面我就和大家分享一下无货源跨境电商的基本概念以及一些新手可以采取的策略和步骤,帮助大家在这个领域取得成…

UE4 添加按键输入事件 并在蓝图中使用按键输入节点

绑定按键 选择Edit/ProjectSettings/Engine/Input 在bindings中可以选择添加ActionMappings或则AxisMappings ActionMappings:按键事件,有按下和抬起两个事件,需要分别用两个键触发AxisMappings:输入事件,返回值为float,对于键盘…

突破划片机技术瓶颈,博捷芯BJX3352助力晶圆切割行业升级

随着半导体行业的快速发展,晶圆切割作为半导体制造过程中的重要环节,对于切割设备的性能和精度要求越来越高。为了满足市场需求,提高生产效率,国产划片机企业博捷芯推出了新一代划片机BJX3352,成功突破了技术瓶颈&…

(设置非自定义Bean)学习Spring的第六天

一 . 获取Bean的方法详解 , 如下图 : 二 . Spring配置非自定义bean----DruidDatasource 我们举个例子 : 配置Druid数据源交由Spring管理 首先导入在pom文件Druid坐标 然后考虑 : 被配置的Bean的实例化方式是什么 : 无参构造 被配置的Bena是否要注入必要属性 : 四个基本信息…

msvcp140_atomic_wait.dll文件缺失的解决方法指南,如何快速修复

在处理计算机软件时,我们经常遭遇一些阻碍程序运行的错误,尤其是那些与动态链接库(DLL)文件相关的。msvcp140_atomic_wait.dll是一个常见的DLL文件,它在Windows操作系统中扮演了重要角色。本文将讨论msvcp140_atomic_wait.dll文件的作用&…

小程序导出excel

先上个图&#xff0c;这个是在电脑上测试导出来的表 大致远离就是用的原生td&#xff0c;tr去导出的&#xff0c; 代码 <template><view><button click"tableToExcel">导出一个表来看</button></view> </template><script&g…

《Python数据分析技术栈》第01章 02 Jupyter入门(Getting started with Jupyter notebooks)

02 Jupyter入门&#xff08;Getting started with Jupyter notebooks&#xff09; 《Python数据分析技术栈》第01章 02 Jupyter入门&#xff08;Getting started with Jupyter notebooks&#xff09; Before we discuss the essentials of Jupyter notebooks, let us discuss…

C语言编译和链接

翻译环境和运行环境 在ANSI C的任何一种实现中&#xff0c;存在两个不同的环境 .第一种是翻译环境&#xff0c;在这个环境中源代码被转换为可执行的机器指令 .第二种是执行环境&#xff0c;它用于实际执行代码 翻译环境 翻译环境是由编译和链接两个大过程组成&#xff0c;而…

仿真机器人-深度学习CV和激光雷达感知(项目2)day03【机器人简介与ROS基础】

文章目录 前言机器人简介机器人应用与前景机器人形态机器人的构成 ROS基础ROS的作用和特点ROS的运行机制ROS常用命令 前言 &#x1f4ab;你好&#xff0c;我是辰chen&#xff0c;本文旨在准备考研复试或就业 &#x1f4ab;本文内容是我为复试准备的第二个项目 &#x1f4ab;欢迎…

RT-Thread 瑞萨 智能家居网络开发:RA6M3 HMI Board 以太网+GUI技术实践

不用放大了&#xff0c; 我在包里找到张不小的…… 以太网HMI线下培训-环境准备 名字虽然叫技术培训&#xff1a; 其实是由两部分组成&#xff1a;板子网关 先介绍周六的培训是啥&#xff0c;然后再介绍一下要准备的一些东西 R A 6 M 3 H M I − B o a r d \textcolor{#41…