01 机器学习概述

news2024/12/23 18:29:34

目录

1. 基本概念

2. 机器学习三要素

3. 参数估计的四个方法

3.1  经验风险最小化

3.2  结构风险最小化

3.3  最大似然估计

3.4  最大后验估计

4. 偏差-方差分解

5. 机器学习算法的类型

6. 数据的特征表示

7.  评价指标


1. 基本概念

        机器学习Machine LearningML就是研究如何让计算机从数据中进行自动学习,得到某种知识(或规律)并利用学习到的规律(模型)对未知或无法观测的数据进行预测

        机器学习的任务,比如光学字符识别、语音识别、人脸识别等.这些任务的特点是,对于我们人类而言很容易完成,但我们不知道自己是如何做到的,因此也很难人工设计一个计算机程序来完成这些任务。比如:下图中的手写数字识别,对人来说认识0~9很简单,但对计算机来说却十分困难.。

        在计算机中,一切皆数据,包括声音、图片或视频,均会被计算机转换为数组读取!

2. 机器学习三要素

3. 参数估计的四个方法

       关于参数分布及先验后验的一些概念,可参看一下文章: 

https://zhuanlan.zhihu.com/p/506449599icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/506449599

3.1  经验风险最小化

       这种方法用于求解线性回归参数时,也叫 最小二乘法 Least Square Method LSM ): 

       由于这种方法要求(XX^T) 必须有逆矩阵(满秩),而实际情况是(XX^T)并不一定满秩,这会导致参数\textbf{w}^*有多个解.。因此,一般会对数据预处理,比如通过主成分分析消除不同特征之间的相关性,使其满秩。

3.2  结构风险最小化

        如果数据量大且特征非常多,那么特征间可能存在多重共线性,即使预处理了数据,也会使得最小二乘法计算结果不稳定。为了解决这个问题,Hoerl等人提出了岭回归(Ridge Regression),也就是给(XX^T)的对角线元素都加上一个常数\lambda,使(XX^T+\lambda I)满秩,这种方法表现在风险函数上即为(相较经验风险函数)增加了一个正则项:

3.3  最大似然估计

        最大似然估计 Maximum Likelihood Estimation MLE 是指找到一组参数使似然函数的值最大,也等价于对数似然函数的值最大。最大似然估计参数方法如下:

 可以看出最大似然估计的解和最小二乘法的解相同。

3.4  最大后验估计

        最大似然估计的一个缺点是当训练数据比较少时会发生过拟合,估计的参数可能不准确.为了避免过拟合我们可以给参数加上一些先验知识,即基于经验对要估计的参数加上一定的限制,这样得到的参数称为最大后验估计,计算方法如下:

可以看出,最大后验概率等价于平方损失的结构风险最小化,其中正则化系数\lambda =\sigma ^2/\nu ^2

由于贝叶斯求解复杂,最大后验概率是贝叶斯学派的一种近似手段,最大后验估计和最大似然估计很像,只是多了一项先验分布,它体现了贝叶斯认为参数也是随机变量的观点,在实际运算中通常通过超参数给出先验分布

最大似然估计和贝叶斯估计可以分别看作频率学派和贝叶斯学派对需要估计参数的不同解释。

4. 偏差-方差分解

      关于偏差(bias)和方差(Variance)的概念可参看下面这篇文章:

偏差(bias)和方差(Variance)icon-default.png?t=N7T8https://blog.csdn.net/nanhuaibeian/article/details/102658419?ops_request_misc=&request_id=&biz_id=102&utm_term=%E5%81%8F%E5%B7%AE%E5%92%8C%E6%96%B9%E5%B7%AE&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-102658419.nonecase&spm=1018.2226.3001.4187

      针对于高偏差和高方差的解决措施,可参看我之前的文章:

《吴恩达机器学习 第二课 week3 学习算法(模型)进阶》icon-default.png?t=N7T8https://blog.csdn.net/weixin_43490087/article/details/139709608?spm=1001.2014.3001.5501

     偏差方差分解,是一种重要的分析技术,‌用于解释学习算法泛化能力。‌

     偏差方差分解将学习算法的期望误差分解为三个非负项的和,‌即样本真实噪声、‌偏差方差。‌这种分解帮助我们从统计学派的视角看待模型复杂度,‌提供了一种理解模型泛化性能的方法。‌如下:

5. 机器学习算法的类型

6. 数据的特征表示

       在实际应用中,数据的类型多种多样,比如文本、音频、图像、视频等,不同类型的数据,其原始特征(Raw Feature)的空间也不相同。而很多机器学习算法要求输入的样本特征是数学上可计算的,因此在机器学习之前我们需要将这些不同类型的数据转换为向量表示。

      (也有一些机器学习算法(比如决策树)不需要向量形式的特征)

 图像特征:表示为 𝑀 × 𝑁 维的向量,为了提高模型准确率,会经常加入一个额外的特征比如直方图宽高比、笔画数纹理特征边缘特征等。

文本特征:从文本形式转为向量形式一种简单的方式是使用词袋Bag-of-WordsBoW)模型,比如两个文本我 喜欢 读书我 讨厌 读书中共有”“喜欢”“”“读书四个词它们的BoW表示分别为[1 1 0 1]和[1 0 1 1]。

词袋模型将文本看作词的集合不考虑词序信息不能精确地表示文本信

一种改进方式是使用N元特征N-Gram Feature),即每𝑁 个连续词构成一个基本单元然后再用词袋模型进行表示以最简单的二元特征即两个词的组合特征)为例上面的两个文本中共有”“我喜欢”“我讨厌”“喜欢读书”“厌读书”“读书六个特征单元,随着 𝑁 的增长N 元特征的数量会指数上升,因此,在实际应用中,文本特征维数通常在十万或百万级别以上

特征工程(Feature Engineering)是指通过人工方式进行提取特征。一个成功的机器学习系统通常需要尝试大量的特征。

让机器自动地学习出有效的特征的研究内容,称为特征学习(Feature Learning),也叫表示学习Representation Learning)。

7.  评价指标

     (1)准确率(所有类别整体性能的平均

         最常用的评价指标为 准确率 Accuracy ):

     (2)错误率

       和准确率相对应的就是错误率Error Rate):

      (3)精确率和召回率(单个类进行性能估计

        准确率是所有类别整体性能的平均 如果希望对每个类都进行性能估计, 就需要计算 精确率 Precision 召回率 Recall ):

 

        精确率Precision),也叫精度查准率

        召回率 Recall ), 也叫 查全率:

        F F Measure 是一个综合指标 为精确率和召回率的调和平均

其中𝛽 用于平衡精确率和召回率的重要性一般取值为1𝛽 = 1时的F值称为F1 值。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1931147.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AdobeInDesign ID软件三网下载+Id教程

简介: InDesign还可以结合其他产品发布适合平板设备的内容。平面设计师和生产艺术家是主要用户,创作和布局期刊出版物、海报和印刷媒体。它还支持导出到EPUB和SWF格式,以创建电子书和数字出版物,包括数字杂志,以及适合…

【linux高级IO(三)】初识epoll

💓博主CSDN主页:杭电码农-NEO💓   ⏩专栏分类:Linux从入门到精通⏪   🚚代码仓库:NEO的学习日记🚚   🌹关注我🫵带你学更多操作系统知识   🔝🔝 Linux高级IO 1. 前言2. 初识e…

【python】PyQt5的窗口界面的各种交互逻辑实现,轻松掌控图形化界面程序

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

H3C Intelligent Management Center无线认证新增设备如何配置

目录 前提条件 一、IPsec VPN配置 二、IMC平台的配置 1.组网 ​编辑 2.核心设备配置 3.AAA服务器侧配置 4.创建认证的用户 5.登录测试 三、AC无线控制器图形界面配置 1.认证配置 1.1 新增ISP域 ​编辑​编辑 1.2新增 RADIUS 1.3 Portal认证配置​编辑​编辑​编…

Rust编程-crates.io

发布配置和开发配置: [profile.dev]: > cargo build opt-level0 [profile.release]: > cargo build --release opt-level3 发布到crates.io 文档注释: 三斜线(///),使用markdown语法来格式化内容 可以为函数…

fatal: read error: Connection reset by peer

参考文章:https://www.cnblogs.com/sisimi/p/7910272.html 问题: 首先确认是否可以访问外网: ping www.baidu.com如果可以访问外网,把 git: 修改为 http: 即可:

高职院校人工智能人才培养成果导向系统构建、实施要点与评量方法

一、引言 近年来,人工智能技术在全球范围内迅速发展,对各行各业产生了深远的影响。高职院校作为培养高技能人才的重要基地,肩负着培养人工智能领域专业人才的重任。为了适应社会对人工智能人才的需求,高职院校需要构建一套科学、…

Java学习 - spring Bean 详解

Bean 的别名配置 接着上一篇文章中的 <bean> 配置&#xff0c;其中配置了 id 属性&#xff0c;通过 id 属性我们就可以获取到对象。其实 <bean> 配置也提供了 name 属性&#xff0c;它是用于定义 Bean 的别名&#xff0c;一个 Bean 的别名是可以有多个的&#xff…

[C++]——同步异步日志系统(7)

同步异步日志系统 一、日志器管理模块&#xff08;单例模式&#xff09;1.1 对日志器管理器进行设计1.2 实现日志器管理类的各个功能1.3. 设计一个全局的日志器建造者1.4 测试日志器管理器的接口和全局建造者类 二、宏函数和全局接口设计2.1 新建一个.h,文件,文件里面放我们写的…

视图库对接系列(GA-T 1400)十九、视图库对接系列(级联)注册

背景 在上一章视图库对接系列(GA-T 1400)十八、视图库对接系列(级联)代码生成中我们已经把代码生成了,那怎么实现级联? 我们可以抓包看设备是怎么注册到我们平台的, 那我们就怎么实现就可以了。 实现 先看设备注册到我们服务端的包 步骤 注册我们可以参考视图库对接系列(…

Data类中的常用方法

Calender类 java.util.Calendar是一个抽象的基类&#xff0c;创建对象需要使用静态方法Calendar.getInstance()完成。通过Calendar对象可以获得详细的日历信息&#xff0c;例如年、月、日、小时、分和秒&#xff0c;Calendar的子类可以实现特定的日历系统。 当前时间 Calenda…

CV每日论文--2024.7.16

1、Radiance Fields from Photons 中文标题&#xff1a;光子的辐射场 简介&#xff1a;神经辐射场(NeRFs)已成为从多个视角捕获的图像进行高质量视图合成的事实标准方法。然而,在野外环境下捕获图像时,仍存在许多挑战,例如低光、高动态范围或快速运动导致的模糊重建和明显的伪…

【MySQL进阶篇】索引

1、索引概述 索引&#xff08;Index&#xff09;是帮助MySQL高效获取数据的数据结构&#xff08;有序&#xff09;。在数据之外&#xff0c;数据库系统还维护着满足特定查找算法的数据结构&#xff0c;这些数据结构以某种方式引用&#xff08;指向&#xff09;数据&#xff0c…

高职院校专业群的生成机制研究

摘要&#xff1a;本研究针对我国产业转型升级背景下高职院校专业群的生成机制进行了深入探讨。运用案例分析法&#xff0c;从生成决策、生成目标、生成规则三个维度出发&#xff0c;对专业群的生成机制进行了系统分析。研究发现&#xff0c;高职院校专业群的生成是一个与产业环…

容器之Harbor

Harbor 是一个开源的企业级 Docker 镜像仓库&#xff0c;用于存储、签名和扫描 Docker 镜像。它由 VMware 开发&#xff0c;旨在增强用户在容器化环境中的安全性和效率。以下是对 Harbor 的详细介绍&#xff1a; 主要功能 1. 镜像管理 镜像存储&#xff1a;提供高效的存储管理…

誉天教育与武汉晴川学院携手开展鸿蒙实训营,共筑鸿蒙生态新篇章!

在数字经济蓬勃发展的今天&#xff0c;鸿蒙系统作为华为自主研发的操作系统&#xff0c;正逐步构建起一个开放、协同、共赢的生态体系。为了进一步推动鸿蒙生态的繁荣发展&#xff0c;培养更多具备鸿蒙原生应用开发能力的专业人才&#xff0c;誉天教育与武汉晴川学院强强联合&a…

苹果公司等科技巨头涉嫌违规使用 YouTube 视频训练 AI|TodayAI

YouTube 强调&#xff0c;使用其平台内容训练人工智能违反服务条款&#xff0c;苹果公司&#xff08;Apple&#xff09;、Anthropic 等科技巨头却涉嫌违规 根据 Proof News 和 Wired 合作的一项调查报告&#xff0c;超过 17 万个 YouTube 视频成为了苹果公司、Anthropic、Nvid…

2024年大数据高频面试题(中篇)

文章目录 Kafka为什么要用消息队列为什么选择了kafkakafka的组件与作用(架构)kafka为什么要分区Kafka生产者分区策略kafka的数据可靠性怎么保证ack应答机制(可问:造成数据重复和丢失的相关问题)副本数据同步策略ISRkafka的副本机制kafka的消费分区分配策略Range分区分配策略…

单链表算法 - 环形链表I

. - 力扣&#xff08;LeetCode&#xff09;. - 备战技术面试&#xff1f;力扣提供海量技术面试资源&#xff0c;帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode.cn/problems/linked-list-cycle/description/思路: 代码: /*** Definition for sin…

Docker的数据管理和网络通信

目录 一、Docker 的数据管理 1&#xff0e;数据卷 2&#xff0e;数据卷容器 二、端口映射 三、容器互联&#xff08;使用centos镜像&#xff09; 四、*Docker 镜像的创建 1&#xff0e;基于现有镜像创建 2&#xff0e;基于本地模板创建 3&#xff0e;基于Dockerfile 创…