【机器学习】科学库使用第2篇:机器学习概述,学习目标【附代码文档】

news2024/11/24 10:40:37

机器学习(科学计算库)完整教程(附代码资料)主要内容讲述:机器学习(常用科学计算库的使用)基础定位、目标,机器学习概述定位,目标,学习目标,学习目标。机器学习概述,1.3 人工智能主要分支学习目标,学习目标,1 主要分支介绍,2 小结。机器学习概述,1.5 机器学习算法分类学习目标,学习目标,1 监督学习,2 无监督学习。机器学习概述,1.7 Azure机器学习模型搭建实验学习目标,学习目标,Azure平台简介,学习目标。Matplotlib,3.2 基础绘图功能 — 以折线图为例学习目标,学习目标,1 完善原始折线图 — 给图形添加辅助功能,2 在一个坐标系中绘制多个图像。Matplotlib,3.3 常见图形绘制学习目标,学习目标,1 常见图形种类及意义,2 散点图绘制。Numpy,4.2 N维数组-ndarray学习目标,学习目标,1 ndarray的属性,2 ndarray的形状。Numpy,4.3 基本操作学习目标,学习目标,1 生成数组的方法,2 数组的索引、切片。Numpy,4.4 ndarray运算学习目标,学习目标,问题,1 逻辑运算。Numpy,4.6 数学:矩阵学习目标,学习目标,1 矩阵和向量,2 加法和标量乘法。Pandas,5.1Pandas介绍学习目标,学习目标,1 Pandas介绍,2 为什么使用Pandas。Pandas,5.3 基本数据操作学习目标,学习目标,1 索引操作,2 赋值操作。Pandas,5.6 文件读取与存储学习目标,学习目标,1 CSV,2 HDF5。Pandas,5.8 高级处理-数据离散化学习目标,学习目标,1 为什么要离散化,2 什么是数据的离散化。Pandas,5.12 案例学习目标,学习目标,1 需求,2 实现。

全套笔记资料代码移步: 前往gitee仓库查看

感兴趣的小伙伴可以自取哦,欢迎大家点赞转发~


全套教程部分目录:


部分文件图片:

机器学习概述

学习目标

  • 了解人工智能发展历程
  • 了解机器学习定义以及应用场景
  • 知道机器学习算法监督学习与无监督学习的区别
  • 知道监督学习中的分类、回归特点
  • 知道机器学习的开发流程

1.5 机器学习算法分类

学习目标

  • 了解机器学习常用算法的分类

根据数据集组成不同,可以把机器学习算法分为:

  • 监督学习

  • 无监督学习

  • 半监督学习

  • 强化学习

1 监督学习

  • 定义:

  • 输入数据是由输入特征值和目标值所组成。

    • 函数的输出可以是一个连续的值(称为回归),
    • 或是输出是有限个离散值(称作分类)。

1.1 回归问题

例如:预测房价,根据样本集拟合出一条连续曲线。

房价预测

1.2 分类问题

例如:根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”,是离散的。

肿瘤预测

2 无监督学习

  • 定义:

  • 输入数据是由输入特征值组成,没有目标值

    • 输入数据没有被标记,也没有确定的结果。样本数据类别未知;
    • 需要根据样本间的相似性对样本集进行类别划分。

举例:

image-20190218141011486

  • 有监督,无监督算法对比:

3 半监督学习

  • 定义:

  • 训练集同时包含有标记样本数据和未标记样本数据。

举例:

  • 监督学习训练方式:

image-20190218141132463

  • 半监督学习训练方式

image-20190218141154743

4 强化学习

  • 定义:

  • 实质是make decisions 问题,即自动进行决策,并且可以做连续决策。

举例:

小孩想要走路,但在这之前,他需要先站起来,站起来之后还要保持平衡,接下来还要先迈出一条腿,是左腿还是右腿,迈出一步后还要迈出下一步。

小孩就是 agent,他试图通过采取行动(即行走)来操纵环境(行走的表面),并且从一个状态转变到另一个状态(即他走的每一步),当他完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃),并且当他不能走路时,就不会给巧克力。

主要包含五个元素:agent, action, reward, environment, observation;

image-20190218141450790

强化学习的目标就是获得最多的累计奖励

监督学习和强化学习的对比

||监督学习|强化学习| |---|---|---| |反馈映射|输出的是之间的关系,可以告诉算法什么样的输入对应着什么样的输出。|输出的是给机器的反馈 reward function,即用来判断这个行为是好是坏。| |反馈时间|做了比较坏的选择会立刻反馈给算法。|结果反馈有延时,有时候可能需要走了很多步以后才知道以前的某一步的选择是好还是坏。| |输入特征|输入是独立同分布的。|面对的输入总是在变化,每当算法做出一个行为,它影响下一次决策的输入。|

拓展概念:什么是独立同分布

独立同分布概念

拓展阅读:Alphago进化史 漫画告诉你Zero为什么这么牛:

[

5 小结

||In|Out|目的|案例| |---|---|---|---|---| |监督学习(supervised learning)|有标签|有反馈|预测结果|猫狗分类 房价预测| |无监督学习(unsupervised learning)|无标签|无反馈|发现潜在结构|“物以类聚,人以群分”| |半监督学习(Semi-Supervised Learning)|部分有标签,部分无标签|有反馈|降低数据标记的难度|| |强化学习(reinforcement learning)|决策流程及激励系统|一系列行动|长期利益最大化|学下棋|

1.6 模型评估

学习目标

  • 目标

  • 了解机器学习中模型评估的方法

  • 知道过拟合、欠拟合发生情况

模型评估是模型开发过程不可或缺的一部分。它有助于发现表达数据的最佳模型和所选模型将来工作的性能如何。

按照数据集的目标值不同,可以把模型评估分为分类模型评估和回归模型评估。

1 分类模型评估

  • 准确率
  • 预测正确的数占样本总数的比例。

  • 其他评价指标:精确率、召回率、F1-score、AUC指标等

2 回归模型评估

均方根误差(Root Mean Squared Error,RMSE)
  • RMSE是一个衡量回归模型误差率的常用公式。 不过,它仅能比较误差是相同单位的模型。

image-20190312193846308

举例:

python 假设上面的房价预测,只有五个样本,对应的 真实值为:100,120,125,230,400 预测值为:105,119,120,230,410

那么使用均方根误差求解得: R M S E = [ ( 1 0 0 − 1 0 5 ) 2 + ( 1 2 0 − 1 1 9 ) 2 + 5 2 + 0 2 + 1 0 2 ] 5 2 = 5 . 4 9 5 RMSE=\sqrt[2]{\frac{[(100-105)^2+(120-119)^2+5^2+0^2+10^2]}{5}} =5.495 RMSE=25[(100105)2+(120119)2+52+02+102]=5.495

其他评价指标:相对平方误差(Relative Squared Error,RSE)、平均绝对误差(Mean Absolute Error,MAE)、相对绝对误差(Relative Absolute Error,RAE)

3 拟合

模型评估用于评价训练好的的模型的表现效果,其表现效果大致可以分为两类:过拟合、欠拟合。

在训练过程中,你可能会遇到如下问题:

训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢?

当算法在某个数据集当中出现这种情况,可能就出现了拟合问题。

3.1 欠拟合

image-20190312213119759

因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。

欠拟合(under-fitting)模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来

3.2 过拟合

过拟合

机器已经基本能区别天鹅和其他动物了。然后,很不巧已有的天鹅图片全是白天鹅的,于是机器经过学习后,会认为天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会认为那不是天鹅。

过拟合(over-fitting):所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳

  • 上问题解答:

  • 训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢?

4 小结

  • 分类模型评估【了解】

  • 准确率

  • 回归模型评估【了解】

  • RMSE -- 均方根误差

  • 拟合【知道】

  • 举例 -- 判断是否是人

  • 欠拟合

    • 学习到的东西太少
    • 模型学习的太过粗糙
  • 过拟合

    • 学习到的东西太多
    • 学习到的特征多,不好泛化

未完待续, 同学们请等待下一期

全套笔记资料代码移步: 前往gitee仓库查看

感兴趣的小伙伴可以自取哦,欢迎大家点赞转发~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1531722.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机设计大赛 题目: 基于深度学习的疲劳驾驶检测 深度学习

文章目录 0 前言1 课题背景2 实现目标3 当前市面上疲劳驾驶检测的方法4 相关数据集5 基于头部姿态的驾驶疲劳检测5.1 如何确定疲劳状态5.2 算法步骤5.3 打瞌睡判断 6 基于CNN与SVM的疲劳检测方法6.1 网络结构6.2 疲劳图像分类训练6.3 训练结果 7 最后 0 前言 🔥 优…

初识HOOK框架frida

hook是什么 hook框架是一种技术,用于在运行时拦截和修改应用程序的行为,通过hook,可以劫持应用程序的方法调用、修改参数、篡改返回值等,以达到对应用程序的修改、增强或调试的目的。 常见的hook框架有哪些 Xposed Framework&am…

算法体系-11 第十一节:二叉树基本算法(上)

一 两链表相交 1.1 题目描述 给定两个可能有环也可能无环的单链表,头节点head1和head2。请实现一个函数,如果两个链表相交,请返回相交的 第一个节点。如果不相交,返回null 【要求】 如果两个链表长度之和为N,时间复杂…

什么是GPU云服务器?2024腾讯云GPU云服务器全解析!

腾讯云GPU服务器是提供GPU算力的弹性计算服务,腾讯云GPU服务器具有超强的并行计算能力,可用于深度学习训练、科学计算、图形图像处理、视频编解码等场景,腾讯云百科txybk.com整理腾讯云GPU服务器租用价格表、GPU实例优势、GPU解决方案、GPU软…

名词【语法笔记】

1.名词分为几大类 2.每一类,又有几个小类,以及所需要注意什么

python中字典相关知识点总结

1.字典的定义 字典:在Python中,字典是一系列键-值对。每个键都与一个值相关联,程序员可以通过键来访问与之相关联的值。 实际举例: student{name:xincun,age:18} 通过实例我们可以发现,键-值对是两个相关联的值。指…

3.20作业

1.创建一个工人信息库,包含工号(主键),姓名,年龄,薪资 CREATE TABLE work (id int, name char, age int,money float); 2.添加三条工人信息(可以完整信息,也可以非完整信息&#xff…

Twincat实现电机控制

不仅是控制系统的核心部分,而且能够将任何基于PC的系统转换为一个带有PLC、NC、CNC和机器人实时操作系统的实时控制系统。TwinCAT软件在工业自动化领域具有广泛的应用,特别是在机器人关节电机控制方面!!! 在机器人关节电机控制方面,TwinCAT通…

【C语言基础篇】字符串处理函数(二)strcpy的介绍及模拟实现

目录 一、strcpy介绍 函数原型: 函数功能: 函数参数: 函数返回值: 二、strcpy模拟实现 代码: 测试: 个人主页: 倔强的石头的博客 系列专栏 :C语言指南 C语言刷题系列…

JeePlus低代码开发平台存在SQL注入漏洞

漏洞描述 JeePlus低代码开发平台存在SQL注入漏洞 fofa语句 app"JeePlus" 漏洞复现 打开页面 构造payload GET /a/sys/user/validateMobile?mobile1%27and1%3D%28updatexml%281%2Cconcat%280x7e%2C%28selectmd5%281%29%29%2C0x7e%29%2C1%29%29and%271%27%3D%271…

六、循环结构

在python当中有两类循环结构:for循环和while循环 一、遍历for循环 for循环首先判断遍历对象中是否有元素,在依次遍历 for循环常与range()函数使用 for i in range(1,10,):#range()函数依次遍历1~10但不包括10print(i,end ) p…

账号+密码+图片验证码认证

账号密码图片验证码认证 实现步骤 实现账号密码认证,执行流程如下 第一步: 对于验证码服务工程的生成验证码图片的接口在网关处需要放行,否则页面无法获取生成的验证码图片 /**临时放行所有请求 /auth/**认证服务地址 /content/open/**内容管理公开访问文件接口 …

【计算机视觉】Gaussian Splatting源码解读补充(二)

第一部分 目录 三、前向传播(渲染):submodules/diff-gaussian-rasterization/cuda_rasterizer/forward.cu预备知识:CUDA编程基础 三、前向传播(渲染):submodules/diff-gaussian-rasterization/c…

软件工程导论画图题汇总:期末+复试

文章目录 一、数据模型:实体联系图(E-R图)二、行为模型:状态转换图三、功能模型:数据流图四、数据字典五、系统流程图六、层次图七、HIPO图八、结构图九、程序流程图十、盒图十一、PAD图十二、判定表、判定树 一、数据…

Vue2(四):Vue监测数据的原理

一、先来看一个问题 添加一个按钮点击更新马冬梅的信息&#xff1a; <button click"gengxin">点击更新马冬梅的信息</button> methods:{gengxin(){this.person[1].name马老师,this.person[1].age50,this.person[1].sex男}} 下面这种方式就不能奏效&a…

数据库系统概论-第5章 数据库完整性

5.1 实体完整性 5.2 参照完整性 5.3 用户定义完整性 5.4 完整性约束命名子句 5.5 域中的完整性限制 5.6 断言 5.7 触发器 5.8 小结

STM32CubeIDE基础学习-EXTI外部中断实验

STM32CubeIDE基础学习-EXTI外部中断实验 文章目录 STM32CubeIDE基础学习-EXTI外部中断实验前言第1章 硬件介绍第2章 工程配置2.1 工程外设配置部分2.2 生成工程代码部分 第3章 代码编写第4章 实验现象总结 前言 中断概念&#xff1a;让CPU打断正在执行的程序&#xff0c;进而去…

第8关:删除P表中所有的记录

任务描述 删除P表中所有的记录 相关知识 零件表P由零件代码&#xff08;PNO&#xff09;、零件名(PNAME)、颜色(COLOR)、重量(WEIGHT)组成&#xff1b; P表如下图&#xff1a; 现已构建P表&#xff0c;结构信息如下&#xff1a; 开始你的任务吧&#xff0c;祝你成功 USE my…

spring MVC是如何找到html文件并返回的?

Spring MVC 搜索路径 启动一个SpringBoot项目时&#xff0c;访问http://localhost:8080&#xff0c;对于SpringMVC&#xff0c;它会默认把这段url看成http://localhost:8080/index.html&#xff0c;所以这两个url是等价的。 .html, .css, .js, .img …都是静态资源文件&#x…

直播预约丨《袋鼠云大数据实操指南》No.1:从理论到实践,离线开发全流程解析

近年来&#xff0c;新质生产力、数据要素及数据资产入表等新兴概念犹如一股强劲的浪潮&#xff0c;持续冲击并革新着企业数字化转型的观念视野&#xff0c;昭示着一个以数据为核心驱动力的新时代正稳步启幕。 面对这些引领经济转型的新兴概念&#xff0c;为了更好地服务于客户…