《零基础学机器学习》读书笔记一

news2024/12/24 21:23:08

《零基础学机器学习》读书笔记一

一、机器学习快速上手路径

1.1 机器学习的家族谱

人工智能,可以被简单地定义为努力将通常由人类完成的智力任务自动化
AI效应的2个阶段:
(1)AI将新技术、新体验带进人类的生活,完成了一些原本需要人类智慧才能完成的工作,此时舆论会对AI期待极高,形成一种让人觉得“真正的”AI时代麻黄素那个就要到来的氛围。
(2)一旦大家开始习惯这些新技术,就又开始认为这些技术没什么了不起,根本代表不了真正的人类智慧,此时又形成一种对AI的现状十分失望的氛围。
机器学习是AI的分支,而深度学习是机器学习的技术之一
AI的发展离不开数据和硬件:
(1)数据。数据是燃料,有了算法所需要的海量数据,机器才能够运转。
(2)硬件。存储能力、计算能力的增强,以及云服务、GPU等。
技术的可达性和实用性,才是机器学习和深度学习的真正价值所在。

1.1.1 入门机器学习

在入门阶段,需要一些数学基础,包括函数、概率统计,线性代数和微积分最基础的内容。机器学习中的数学内容重在理解,不重在公式的推演
机器学习,注重模型的选择、整合、参数的调试。这要求的主要是逻辑分析与判断能力,再加上点直觉和运气。

1.1.2 机器学习就是从数据中发现规律

使用正确的特征来构建正确的模型,以完成既定的任务。
——Peter Flach《机器学习》

机器学习的关键内涵之一在于利用计算机的运算能力从大量的数据中发现一个“函数”或:“模型”,并通过它来模拟现实世界事物间的关系,从而实现预测或判断的功能
这个过程的关键是建立一个正确的模型。
特征:自变量(x1,x2,x3,…xn);
标签:因变量y。
训练数据集 training dataset,测试数据集 test dataset。
机器学习,就是在已知数据集的基础上,通过反复的计算,选择最贴切的函数去描述数据集中自变量(x1,x2,x3,…xn)和因变量y之间的关系。
从数据中发现关系,归纳成函数,以实现从A到B的推断。

机器学习的另外一个特质是从错误中学习。
机器找到一个函数去拟合(fit)它要解决的问题,一直到找到相对最为合适的函数为止,机器通过机器学习算法自己摸索出来。机器从已知数据中不断试错之后,归纳出规则。
训练步骤:
(1)选定模型的类型,也就是算法;
(2)通过fit方法来训练机器,进行函数的拟合;
(3)预测验证集的y值;
(4)计算验证集中预测值和真值之间的差异,评估预测结果;
拟合意味着找到最优的函数去模拟训练集中的输入特征和目标标签的关系,确定模型的参数。
要比较不同的模型,都应采用相同的评估指标,在同样的标准下,哪个分数更高,就说明哪个模型更好。
学习重点在于解释这些算法,并应用它们建立机器学习模型(函数)来解决具体问题

1.1.3 机器学习的类别

最常见的分类为 监督学习无监督学习半监督学习
监督学习的训练需要标签数据,而无监督学习不需要标签数据,半监督学习介于两者之间。
半监督学习使用大量的无标签数据,同时使用部分有标签数据来进行建模。
另一种分类方式,监督学习、无监督学习和强化学习。

1.1.4 机器学习的重要分支

深度学习,是根据机器学习的模型或训练机器时所采用的算法进行分类。
监督学习或无监督学习,着眼点在于数据即问题的本身;
传统机器学习还是深度学习,着眼点在于解决问题的方法。
人工神经网络,是数据结构和算法形成的机器学习模型,由大量的所谓人工神经元相互联结而成,这些神经元都具有可以调整的参数,可以实现监督学习或无监督学习。
现在把层数较多、结构比较复杂的神经网络的机器学习技术叫作深度学习
深度学习的另一大好处是对数据特征的要求降低,自动地实现非结构化数据的结构化,无须手工获取特征,减少特征工程。
特征工程是指对数据特征的整理和优化工作,让它们更易于被机器所学习。
数据结构化的目标:使数据变得**“计算机友好”**。
深度学习通过神经网络把特征提取和分类任务一并解决了。

1.1.5 机器学习新热点

强化学习研究的目标是智能体如何基于环境而做出行动反应,以取得最大化的累积奖励。智能体通过所得到的奖励(或惩罚)、环境反馈回来的状态以及动作与环境互动。
强化学习和普通机器学习的差异在于:普通机器学习是在开放的环境中学习;而强化学习的环境是封闭的。
强化学习和监督学习的差异在于:监督学习是从数据中学习,而强化学习是从环境给它的奖惩中学习。监督学习中数据的标签就是答案,强化学习得到惩罚后,没人告诉它具体哪里做错了,所以它调整策略的时候需要的智能更强,要求它的思路也更加广阔、更为长远。智能体不一定每次都明确地选择最优动作,而是要在探索(未知领域)和利用(当前知识)之间找到平衡。
其他机器学习方法(算法),例如集成学习、在线学习、迁移学习等。

1.1.6 机器学习的两大应用场景

回归和分类是两种最常见的机器学习问题类型。
回归问题通常用来预测一个值,其标签的值是连续的。常见的回归算法是线性回归算法以及深度学习中的神经网络等。
分类问题是将事物标记一个类别标签,结果为离散值,也就是类别中的一个选项。分类有二元分类和多元分类,每类的最终正确结果只有一个。
分类是机器学习的经典应用领域,很多种机器学习算法都可以用于分类,包括最基础的逻辑回归算法、经典的决策树算法,以及深度学习中的神经网络等。

1.1.7 机器学习的其他应用场景

无监督学习中最常见的聚类问题是在没有标签的情况下,把数据按照其特征的性质分成不同的簇(数据分类);还有一种无监督学习是关联规则,通过它可以找到特征之间的影响关系。
时间序列,指在内部结构随时间呈规律性变化的数据集,如趋势性数据、随季节变化的数据等。时间序列问题其实就是和时间、周期紧密关联的回归问题。
结构化输出,通常机器学习都是输出一个答案或者选项,而有时需要通过学习输出一个结构。
生成式学习,比如AI画画。
当机器学习的目标是做出决定时,叫决策性问题。决策性问题本质上仍然是分类问题,因为每一个决策实际上还是在用最适合的行为对环境的某一个状态进行分类。在很多决策性问题中,机器必须学习哪些决策是有效的、可以带来回报的,哪些是无效的、会带来负回报的,以及哪些是对长远目标有利的。因此,强化学习是这种情况下的常用技术。
机器学习的诀窍在于要了解自己的问题,并针对自己的问题选择最佳的机器学习方法(算法),也就是找到哪一种技术最有可能适合这种情况。
机器学习分类

机器学习不是万能的,它只能作用于和已知数据集类似的数据,不能抽象推广。机器的优势仍在于计算量、速度和准确性,尚无法形成类似人类的智力思维模式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/164840.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux环境安装mysql5.7版本

目录 一、下载准备阶段 二、安装运行阶段 linux环境安装mysql是我们工程师必备的技能之一,今天我们实战分享一下安装流程: 一、下载准备阶段 1、查看linux系统是否已经安装mysql rpm -qa|grep -i mysql 显示没有 如果安装过,可以删除&…

DFS排列组合与连通性

目录 一、前言 二、DFS与排列组合 1、DFS:自写排列算法1 (1)基础模板 (2)基于(1)输出前n个数任意m个都全排列 2、DFS:自写排列算法2(这个写法更常见) (1&#xff…

Java安装详细教程

这里写自定义目录标题Java安装详细教程1.下载Java2,找到jdk8进行下载3.安装jdk4.配置环境变量5.查看是否已经成功安装Java安装详细教程 换了新电脑了,需要安装Java,如果对你也有帮助就点个赞吧~~ 文章目录Java安装详细教程1.下载Java2&#…

一阶低通滤波器学习

导读:电压型磁链观测器由于物理概念清晰、简单易用而备受关注。然而电压型磁链观测器包含一纯积分项,被积项的初始相位与直流偏置都会影响积分结果。所以对传统电压型磁链观测器的改进措施有很多,本期文章主要介绍采用一阶低通滤波器来替换掉…

Java程序设计实验2 | Java语言基础

*本文是博主对Java各种实验的再整理与详解,除了代码部分和解析部分,一些题目还增加了拓展部分(⭐)。拓展部分不是实验报告中原有的内容,而是博主本人自己的补充,以方便大家额外学习、参考。 目录 一、实验…

微信小程序使用npm包、全局数据共享和分包

文章目录导航路线使用 npm 包小程序对 npm 的支持与限制Vant Weapp1. 什么是 Vant Weapp2. 安装 Vant 组件库3. 使用 Vant 组件4. 定制全局主题样式5. 定制全局主题样式API Promise化1. 基于回调函数的异步 API 的缺点2. 什么是 API Promise 化3. 实现 API Promise 化4. 调用 P…

鸣人的影分身(动态规划 | DP | 整数划分模型)[《信息学奥赛一本通》]

题目如下: 在火影忍者的世界里,令敌人捉摸不透是非常关键的。 我们的主角漩涡鸣人所拥有的一个招数——多重影分身之术——就是一个很好的例子。 影分身是由鸣人身体的查克拉能量制造的,使用的查克拉越多,制造出的影分身越强。…

6.R语言【频数、频率统计函数】一维、二维、三维

b站课程视频链接: https://www.bilibili.com/video/BV19x411X7C6?p1 腾讯课堂(最新,但是要花钱,我花99😢😢元买了,感觉讲的没问题,就是知识点结构有点乱,有点废话)&…

PostgreSQL数据库FDW——Parquet S3 MultifileMergeExecutionStateBaseS3

MultifileMergeExecutionStateBaseS3和SingleFileExecutionStateS3、MultifileExecutionStateS3类不同,reader成员被替换为ParquetReader *类型的readers vector。新增slots_initialized布尔变量指示slots成员是否已经初始化。slots成员是Heap类,Heap用于…

重装系统Windows10纯净版操作步骤(微pe)

目录 前言 操作步骤 第一步:格式化硬盘 第二步:硬盘重新分区 固态硬盘分区 机械硬盘分区 完成效果展示 第三步:把ISO镜像文件写入固态硬盘 第四步:关机拔u盘 第五步:开机重装系统成功 前言 1.要重装系统&am…

Webpack提取页面公共资源

1. 利用html-webpack-externals-plugin 分离基础库 在做React开发时,经常需要引入react和react-dom基础库,这样在打包的时候速度就会比较慢,这种情况下我们可以将这些基础库忽略掉,将它们通过CDN的方式直接引入,而不打…

apache和IIS区别?内网本地服务器项目怎么让外网访问?

Apache和IIS是比较常用的搭建服务器的中间件,它们之间还是有一些区别差异的,下面就详细说说 Apache和IIS有哪些区别,以及如何利用快解析实现内网主机应用让外网访问。 1.安全性 首先说说apache和IIS最基本的区别。Apache运行的操作系统通常为…

Python数学建模问题总结(3)数据可视化Cookbook指南·下

概括总结:五、样式:优化图表、数据可视1.形状:形状的精确程度;2.颜色:区分类别、表示数量、突出特定数据、表示含义;3.线:点划线或不同的不透明度;4.文字排版:应用于图表…

IOC/DI配置管理第三方bean及注解开发。

目录 一、IOC/DI 配置管理第三方bean 1、配置第三方bean 2、加载properties 文件 3、核心容器 二、注解开发 1、注解开发定义bean 2、纯注解开发模式 3、注解开发bean作用范围与生命周期管理 4、注解开发依赖注入 三、IOC/DI注解开发管理第三方bean 1、注解开发管…

深度学习中有哪些从数学模型或相关理论出发, 且真正行之有效的文章?

自深度学习兴起后,深层网路对图像进行特征学习,将低层次的基础特征聚合成更高级的语义特征,取得突出的识别效果,在图像识别、分割及目标检测三大领域得到了众多应用。深度学习算法基本上是由多个网络层搭建,每个网络层…

SpringBoot自动装配

前言 Spring翻译为中文是“春天”,的确,在某段时间内,它给Java开发人员带来过春天,但是随着我们项目规模的扩大,Spring需要配置的地方就越来越多,夸张点说,“配置两小时,Coding五分…

Open3D Usage

Open3D UsageWhat is open3Dopen3D 核心功能包括:python quick start交互指令显示点云**read_point_cloud** ParametersReturnPointCloud的属性:加载ply点云:显示单帧点云:批量单帧显示点云可视化**draw_geometries** Parameters含…

Uniswap v3 详解(三):交易过程

交易过程 v3 的 UniswapV3Pool 提供了比较底层的交易接口,而在 SwapRouter 合约中封装了面向用户的交易接口: exactInput:指定交易对路径,付出的 x token 数和预期得到的最小 y token 数(x, y 可以互换)e…

Studio One2023新版本更新功能介绍

Studio One 6是一款非常专业的音乐创作编辑软件。为用户提供了所有一切你所需要创作的功能,包括所有的歌曲、项目、仪表板等动能,而且还自定义添加配置文件,良好的界面交互和丰富的功能板块,再结合优秀的性能,能够满足…

基于SpringBoot的SSMP整合(数据层)

模块创建 新建&#xff1a; 添加依赖项&#xff1a; 由于parent没有版本维护&#xff0c;还需在pom.xml文件再次添加&#xff1a; <dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-boot-starter</artifactId><version…