《机器学习》- 习题解析 - 第一章

news2025/1/13 10:32:39

《机器学习》- 习题 - 第一章


文章目录

  • 《机器学习》- 习题 - 第一章
  • 一、示例-计算表1.1中的版本空间
  • 二、习题 1 - 计算题目中的版本空间
  • 三、单个合取式&析合范式的概念
  • 四、习题 2 - 计算题目中假设空间的规模大小


一、示例-计算表1.1中的版本空间

首先从概念上理解版本空间的定义;

版本空间: 从假设空间 删除掉正例不一致 和与 反例一致 的假设后,剩余的假设所组成的集合。它可以看成是对正例的最大泛化。

下图是书中的表1.1 西瓜数据集:
在这里插入图片描述

表1.1的训练数据集对应的假设空间如下:一共有49种 ;

“色泽” “根蒂” “敲声” 分别有 2、3、3种可能取值;则 面临的假设空间规模大小为 3 ∗ 4 ∗ 4 + 1 = 49 3 * 4 * 4 + 1 = 49 344+1=49

将假设都列出来如下,为了便于理解,将不同的类型用分割线做了划分;

1 色泽=*,根蒂=*,敲声=*


2 色泽=青绿,根蒂=*,敲声=*
3 色泽=乌黑,根蒂=*,敲声=*


4 色泽=*,根蒂=蜷缩,敲声=*
5 色泽=*,根蒂=硬挺,敲声=*
6 色泽=*,根蒂=稍蜷,敲声=*


7 色泽=*,根蒂=*,敲声=浊响
8 色泽=*,根蒂=*,敲声=清脆
9 色泽=*,根蒂=*,敲声=沉闷


10 色泽=青绿,根蒂=蜷缩,敲声=*
11 色泽=青绿,根蒂=硬挺,敲声=*
12 色泽=青绿,根蒂=稍蜷,敲声=*


13 色泽=乌黑,根蒂=蜷缩,敲声=*
14 色泽=乌黑,根蒂=硬挺,敲声=*
15 色泽=乌黑,根蒂=稍蜷,敲声=*


16 色泽=青绿,根蒂=*,敲声=浊响
17 色泽=青绿,根蒂=*,敲声=清脆
18 色泽=青绿,根蒂=*,敲声=沉闷


19 色泽=乌黑,根蒂=*,敲声=浊响
20 色泽=乌黑,根蒂=*,敲声=清脆
21 色泽=乌黑,根蒂=*,敲声=沉闷


22 色泽=*,根蒂=蜷缩,敲声=浊响
23 色泽=*,根蒂=蜷缩,敲声=清脆
24 色泽=*,根蒂=蜷缩,敲声=沉闷


25 色泽=*,根蒂=硬挺,敲声=浊响
26 色泽=*,根蒂=硬挺,敲声=清脆
27 色泽=*,根蒂=硬挺,敲声=沉闷


28 色泽=*,根蒂=稍蜷,敲声=浊响
29 色泽=*,根蒂=稍蜷,敲声=清脆
30 色泽=*,根蒂=稍蜷,敲声=沉闷


31 色泽=青绿,根蒂=蜷缩,敲声=浊响
32 色泽=青绿,根蒂=蜷缩,敲声=清脆
33 色泽=青绿,根蒂=蜷缩,敲声=沉闷


34 色泽=青绿,根蒂=硬挺,敲声=浊响
35 色泽=青绿,根蒂=硬挺,敲声=清脆
36 色泽=青绿,根蒂=硬挺,敲声=沉闷


37 色泽=青绿,根蒂=稍蜷,敲声=浊响
38 色泽=青绿,根蒂=稍蜷,敲声=清脆
39 色泽=青绿,根蒂=稍蜷,敲声=沉闷


40 色泽=乌黑,根蒂=蜷缩,敲声=浊响
41 色泽=乌黑,根蒂=蜷缩,敲声=清脆
42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷


43 色泽=乌黑,根蒂=硬挺,敲声=浊响
44 色泽=乌黑,根蒂=硬挺,敲声=清脆
45 色泽=乌黑,根蒂=硬挺,敲声=沉闷


46 色泽=乌黑,根蒂=稍蜷,敲声=浊响
47 色泽=乌黑,根蒂=稍蜷,敲声=清脆
48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷


49 ∅ \varnothing

在这里插入图片描述


按照上述过程进行学习:[ 删除 与正例不一致 与反例一致 的 假设 ]

对于编号为 1 的 样例来说:

(1,(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜)

可以删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49 ;


对于编号为 2 的 样例来说:

(2,(色泽=乌黑、根蒂=蜷缩、敲声=浊响),好瓜)

可以删除剩余假设空间中的2、10、16、31 ;


对于编号为 3 的 样例来说:

(3,(色泽=青绿、根蒂=硬挺、敲声=清脆),坏瓜)

可以删除剩余假设空间中的 1 ;


对于编号为 4 的 样例来说:

(4,(色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜)

剩余假设空间中无可删除的假设;


学习过后剩余的假设为:

4 色泽=*,根蒂=蜷缩,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
22 色泽=*,根蒂=蜷缩,敲声=浊响
这就是最后的 “ 假设集合 ”,也就是 “ 版本空间 ” 。

在这里插入图片描述


二、习题 1 - 计算题目中的版本空间

在这里插入图片描述

习题1. 在表1.1 中 若只包含编号为1和4的两个样例,试给出相应的版本空间。

在上文一中示例的基础上,分析习题1中的问题:


按照上文一中示例进行学习:[ 删除 与正例不一致 与反例一致 的 假设 ]

对于编号为 1 的 样例来说:

(1,(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜)

可以删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49 ;


对于编号为 4 的 样例来说:

(4,(色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜)

剩余假设空间中的 1 ;


学习过后剩余的假设为:

剩下的假设有为:2、4、7、10、16、22、31 ;
2 色泽=青绿,根蒂=*,敲声=*
4 色泽=*,根蒂=蜷缩,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
10 色泽=青绿,根蒂=蜷缩,敲声=*
16 色泽=青绿,根蒂=*,敲声=浊响
22 色泽=*,根蒂=蜷缩,敲声=浊响
31 色泽=青绿,根蒂=蜷缩,敲声=浊响

这就是最后的 “ 假设集合 ”,也就是 “ 版本空间 ” 。


三、单个合取式&析合范式的概念

析合范式(disjunctive normal form) 亦称 析取范式一种析取式。是若干简单合取式析取式。(在《离散数学》这门课程中有学到过这个概念。)

析取范式是一种逻辑表达式,它包含两个子句,它们之间用""连接。
析取范式的典型形式是"P 或 Q",其中P和Q都可以是真实的或不真实的声明,
而该范式的结果将取决于P或Q或两者 是真实的。

合取范式则是另一种逻辑表达式,它包含两个子句,它们之间用“”连接。
合取范式的典型形式是"P 且 Q",其中P和Q都可以是真实的或不真实的声明,而该范式的结果将取决于P和Q 是真实的。


首先要明白 简单析取式简单合取式 的定义。

定义:我们将命题变项及其否定统称作 文字 \red{文字} 文字
简单析取式 \red{简单析取式} 简单析取式是仅由有限个文字构成的析取式。
简单合取式 \red{简单合取式} 简单合取式简单合取式是仅由有限个文字构成的合取式。
注意:一个简单文字既是简单析取式,又是简单合取式。

例如:

  • p , ¬ q p , ¬q p,¬q既是一个简单析取式,又是一个简单合取式
  • p ∨ ¬ q , p ∨ r p \vee¬q , p \vee r p¬q,pr 均是有两个文字的简单析取式
  • p ∧ q ∧ r , ¬ p ∧ q ∧ ¬ q p \wedge q \wedge r , ¬ p \wedge q \wedge ¬q pqr,¬pq¬q 均是有三个文字的简单合取式

定义:

  • 由有限个 简单合取式 \red{简单合取式} 简单合取式构成的 析取式 \red{析取式} 析取式被称为 析取范式 \red{析取范式} 析取范式.
  • 由有限个 简单析取式 \red{简单析取式} 简单析取式构成的 合取式 \red{合取式} 合取式被称为 合取范式 \red{合取范式} 合取范式.
  • 析取范式与合取范式统称为 范式 \red{范式} 范式.

在这里插入图片描述
性质:

一个文字既是一个析取范式又是一个合取范式
一个析取范式为矛盾式,当且仅当它的每一个简单合取式都是矛盾式
一个合取范式是重言式,当且仅当它的每一个简单析取式都是重言式


范式存在定理 \red{范式存在定理} 范式存在定理:任一命题公式都存在着与之等值的析取范式与合取范式。

在这里插入图片描述
此处参考博客 第一章 命题逻辑 1.4 析取范式与合取范式


如下图中,分别为析取范式和合取范式的示例:
在这里插入图片描述


在这里插入图片描述
依照上述的步骤解题2:
在这里插入图片描述
解:
在这里插入图片描述


四、习题 2 - 计算题目中假设空间的规模大小

在这里插入图片描述
1.2 与使用单个合取式来进行假设表示相比,使 用 “析合范式”将使得假设空间具有更强的表示能力. 例如
好瓜 ⇔ ( ( 色泽 = ∗ ) ∧ ( 根蒂 = 蜷缩 ) ∧ ( 敲声 = ∗ ) ) ∨ ( ( 色泽 = 乌黑 ) ∧ ( 根蒂 = ∗ ) ∧ ( 敲声 = 沉闷 ) ) , 好瓜 \Leftrightarrow ((色 泽 = *) \land (根蒂= 蜷缩) \land (敲声= *)) \lor ((色泽=乌黑) \land (根蒂= *) \land (敲声= 沉闷)), 好瓜((色泽=)(根蒂=蜷缩)(敲声=))((色泽=乌黑)(根蒂=)(敲声=沉闷)),
会 把 “ ( 色泽 = 青绿 ) ∧ ( 根蒂 = 蜷缩 ) ∧ ( 敲声 = 清脆 ) (色泽=青绿) \land (根蒂= 蜷缩) \land (敲声=清脆) (色泽=青绿)(根蒂=蜷缩)(敲声=清脆)”以 及 “ ( 色泽 = 乌黑 ) ∧ ( 根蒂 = 硬挺 ) ∧ ( 敲声 = 沉闷 ) (色泽=乌黑) \land (根蒂= 硬挺) \land (敲声=沉闷) (色泽=乌黑)(根蒂=硬挺)(敲声=沉闷)”都分类为 “好瓜”. 若使用最多包含 k k k合取式析合范式来表达表1.1西瓜分类问题的假设空间,试估算共有多少种可能的假设。

注:析合范式即多个合取式的析取.
提示:注意冗余情况,如 ( A = a ) V ( A = ∗ ) (A = a) V (A = *) (A=a)V(A=) ( A = ∗ ) (A = *) (A=)等价.


由题1.1知,共有49种假设,其中:

全部不泛化 2 ∗ 3 ∗ 3 = 18 2 ∗ 3 ∗ 3 = 18 233=18种假设;
一个属性泛化: 2 ∗ 3 + 3 ∗ 3 + 2 ∗ 3 = 21 2 ∗ 3 + 3 ∗ 3 + 2 ∗ 3 = 21 23+33+23=21 种假设;
两个属性泛化: 2 + 3 + 3 = 8 2 + 3 + 3 = 8 2+3+3=8 种假设;
三属性泛化:1种假设
空集:1种假设
不考虑空集,则有48种假设,所以k的最大值为48。

而组成的析合范式是这48种假设的排列组合,展开序列为(即杨辉三角【二项式系数在三角形中的一种几何排列】 的一排):
在这里插入图片描述
在这里插入图片描述

( 1 、 48 、 1128 、 … 、 1128 、 48 、 1 ) (1、48、1128、… 、1128、48、1) (14811281128481)共49个数,
左边的1表示:一个假设都没选,右边的1表示:全部假设都被选。

如果 k = 48 k=48 k=48,就是说最多采用 48 48 48 种合取式来组成析合范式,排除一种都不选的情况,就是 2 48 − 1 2^{48} - 1 2481种。( 2 48 2^{48} 248是根据二项式系数之和得的);

如果 0 < k < 48 0<k<48 0<k<48,那就把展开序列的前 k + 1 k+1 k+1(因为展开序列从 0 开始数)项全部加起来再减1 ;

如果指定了 k k k 的个数,那就是展开序列的第 k + 1 k+1 k+1(因为展开序列从 0 开始数)项的数 ;

但是,这个结果得去重才行,因为 泛化是对若干种假设的包含(包容),它本身不是某种假设。

把泛化的 ∗ * 展开后,就是若干种具体的假设。如果此题采取 48 48 48,那么把 ∗ * 展开后,假设集合中一定有重复,而且一种具体假设还不止重复一次。
此题应该采用18种具体假设来计算, 即: 2 18 − 1 2^{18} - 1 2181


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/379456.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一起玩转开源数据库!OceanBase DevCon 之开源生态全景解析

​ 2023 年 3 月 25 日&#xff0c;首次 OceanBase 开发者大会将在北京举办&#xff0c;OceanBase 首席科学家阳振坤与 OceanBase CTO 杨传辉领携众多技术专家&#xff0c;将与开发者共同探讨单机分布式、云原生、HTAP 等数据库前沿趋势&#xff0c;OceanBase 开源技术全景生…

数据库——1.数据库设计的三大范式

这篇文章我们主要来讲一下数据库设计的三大范式&#xff0c;这个还是很有用的。 目录 1.概述 2.第一范式 3.第二范式 4.第三范式 5.小结 1.概述 为了建立冗余较小、结构合理的数据库&#xff0c;设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范…

Python每日一练(20230301)

目录 1. 只出现一次的数字 2. 以特殊格式处理连续增加的数字 3. 最短回文串 1. 只出现一次的数字 给定一个非空整数数组&#xff0c;除了某个元素只出现一次以外&#xff0c;其余每个元素均出现两次。找出那个只出现了一次的元素。 说明&#xff1a; 你的算法应该具有线性…

「TCG 规范解读」基础设施架构和协议 (2)

可信计算组织&#xff08;Ttrusted Computing Group,TCG&#xff09;是一个非盈利的工业标准组织&#xff0c;它的宗旨是加强在相异计算机平台上的计算环境的安全性。TCG于2003年春成立&#xff0c;并采纳了由可信计算平台联盟&#xff08;the Trusted Computing Platform Alli…

有什么好用的在线统计表单吗?

有什么好用的在线统计表单吗&#xff1f;最好是免费的&#xff1f;市面上这样的表单工具其实很多&#xff0c;先来看看题主的需求&#xff1a; 收集信息&#xff0c;数据统计数据分析&#xff0c;报表展示 以简道云在线表单为例&#xff0c;能完美实现题主这两个需求—— http…

携程面经1

面经 HDFS读写流程 1.读流程 客户端向NameNode发起读请求&#xff08;如果存在&#xff09;NameNode返回一批block地址客户端与第一个block的拓扑距离最近的节点建立连接以packet&#xff08;64kb&#xff09;的单位读取数据块。一个block读取完成后客户端会断开与该DataNod…

算法训练营 day59 动态规划 两个字符串的删除操作 编辑距离

算法训练营 day59 动态规划 两个字符串的删除操作 编辑距离 两个字符串的删除操作 583. 两个字符串的删除操作 - 力扣&#xff08;LeetCode&#xff09; 给定两个单词 word1 和 word2 &#xff0c;返回使得 word1 和 word2 相同所需的最小步数。 每步 可以删除任意一个字符…

DBeaver连接mysql数据库图文教程

文章目录前言一、DBeaver连接mysql数据库二、文档下载地址前言 DBeaver是免费、开源、通用数据库工具&#xff0c;是许多开发开发人员和数据库管理员的所选。下面详细介绍Dbeaver连接mysql数据库的过程。 一、DBeaver连接mysql数据库 1、 打开Dbeaver后&#xff0c;按下图操…

【Unity】P4 脚本文件(基础)

Unity脚本文件&#xff08;基础&#xff09;适配的C#代码编辑器如何添加一个脚本文件获取蘑菇当前位置基础代码改变物体位置帧与帧更新前言 上一篇博文主要围绕Unity Inspector部分&#xff0c;围绕组件&#xff0c;资源文件&#xff0c;父子节点部分做介绍。 链接&#xff1a;…

阿里黑客入门学习资料流出来了!!

各位粉丝朋友大家好&#xff0c;最近看到很多粉丝朋友给我留言&#xff0c;希望我给大家找一些学习内容。前段时间整理了我平时常看的一些黑客相关的技术书籍&#xff0c;这些内容从未对外公开&#xff0c;今天分享给大家 &#xff01; 内容非常详细且全面&#xff0c;覆盖了W…

5分钟轻松拿下Java枚举

文章目录一、枚举(Enum)1.1 枚举概述1.2 定义枚举类型1.2.1 静态常量案例1.2.2 枚举案例1.2.3 枚举与switch1.3 枚举的用法1.3.1 枚举类的成员1.3.2 枚举类的构造方法1&#xff09;枚举的无参构造方法2&#xff09;枚举的有参构造方法1.3.3 枚举中的抽象方法1.4 Enum 类1.4.1 E…

c++系列12:使用vscode进行编译

1. 入门 1.1 操作方法 1&#xff09;下载安装vscode 2&#xff09;在扩展中搜索c/c extension pack并安装&#xff08;或者直接打开cpp文件&#xff0c;会自动提示进行安装&#xff09; 3&#xff09;创建项目目录&#xff0c;会自动生成.vscode文件夹&#xff0c;里面是编译…

虹科分享 | Domo零售行业商业智能白皮书:《从零售企业的数据中获取价值》

市场因素、技术创新和不断增长的客户期望&#xff0c;给电子商务带来了新的机遇&#xff0c;与此同时也给传统零售行业带来了压力。零售业正面临着新的挑战&#xff1a;不断变化的需求模式和渠道、不断变化的服务期望、复杂的库存以及交付问题。为了解决这些问题&#xff0c;零…

Linux系统介绍及熟悉Linux基础操作

一、什么是Liunx Linux&#xff0c;全称GNU/Linux&#xff0c;是一种免费使用和自由传播的类UNIX操作系统&#xff0c;其内核由林纳斯本纳第克特托瓦兹&#xff08;Linus Benedict Torvalds&#xff09;于1991年10月5日首次发布&#xff0c;它主要受到Minix和Unix思想的启发&am…

机器学习知识总结 —— 21. 什么是主成分分析

文章目录什么是PCA&#xff08;Principal Component Analysis&#xff09;协方差矩阵什么是协方差协方差矩阵特征值与特征向量PCA降维什么是PCA&#xff08;Principal Component Analysis&#xff09; 在机器学习中&#xff0c;PCA&#xff08;Principal Component Analysis&a…

除了Confluence,还有哪些好用的文档管理软件?测评

在早期&#xff0c;文档管理软件主要是为了将企业内部海量的电子文档集中存储、管理&#xff0c;通过设置共享权限进行内部员工的文档分发&#xff0c;有些甚至可能要提供API接口&#xff0c;便于将ERP、OA等系统的文档纳入其中&#xff0c;形成企业文档管理中心。而随着时间的…

window下的快捷程序链怎么设置环境变量|cmd直接运行快捷方式

对于需要在命令行执行的程序&#xff0c;每次都需要设置环境变量很是麻烦&#xff0c;而且也会导致非必要的文件也在环境变量里并且如果多版本共存软件也会导致只能一个存在环境变量里不然会冲突&#xff0c;这时候如果可以通过快捷方式那不就完美解决了么&#xff1f; 快捷方…

一文带你入门Docker

目录一、什么是Docker&#xff1f;1、背景2、Docker三要素3、Docker四个组成部分二、Docker安装步骤1、VM虚拟机下载2、centrOS 8下载3、安装docker4、配置阿里云镜像加速器5、docker run 执行顺序6、docker和虚拟机比较三、docker常用命令四、docker镜像分层一、什么是Docker&…

运维语言、bash特性、history命令

P4 浅谈运维和编程语言 shell简述 shell C语言开发&#xff0c;和同是C开发的操作系统更兼容。因此shell效率肯定大于其他工具。 shell语言类型 其他运维语言 shell优势 P5 Bash特性 bash是什么 命令历史 -c 清楚存放的历史命令 -r 回复删除的历史命令 &#xff01;历史id…

0基础怎么入门黑客?

" 有一群人大声嚷嚷着自己是黑客&#xff0c;但他们不是。他们&#xff08;主要是正值青春的少年&#xff09;是一些蓄意破坏计算机和电话系统的人。真正的黑客把这些人叫做“骇客”(cracker)&#xff0c;并不屑与之为伍。多数真正的黑客认为骇客们又懒又不负责任&#x…