数据仓库作业五:第8章 关联规则挖掘

news2024/12/25 1:17:01

目录

    • 第8章 关联规则挖掘
      • 作业题


第8章 关联规则挖掘

作业题

1、设4-项集 X = { a , b , c , d } X=\{a,b,c,d\} X={a,b,c,d},试求出由 X X X 导出的所有关联规则。

解:

首先生成项集的所有非空真子集。这包括:
{ a } , { b } , { c } , { d } \{a\},\{b\},\{c\},\{d\} {a},{b},{c},{d}
{ a , b } , { a , c } , { a , d } , { b , c } , { b , d } , { c , d } \{a,b\},\{a,c\},\{a,d\},\{b,c\},\{b,d\},\{c,d\} {a,b},{a,c},{a,d},{b,c},{b,d},{c,d}
{ a , b , c } , { a , b , d } , { a , c , d } , { b , c , d } \{a,b,c\},\{a,b,d\},\{a,c,d\},\{b,c,d\} {a,b,c},{a,b,d},{a,c,d},{b,c,d}

对于每个非真空子集,生成相应的关联规则。一般地,对于子集 { A } \{A\} {A},关联规则的形式是 { X } ⇒ { X − A } \{X\}\Rightarrow\{X-A\} {X}{XA},其中 X − A X-A XA 表示项集 X X X 中不包含在 A A A 中的项。

下面是所有可能的关联规则:

{ a } ⇒ { b , c , d } , { b } ⇒ { a , c , d } , { c } ⇒ { a , b , d } , { d } ⇒ { a , b , c } , \{a\}\Rightarrow\{b,c,d\},\{b\}\Rightarrow\{a,c,d\},\{c\}\Rightarrow\{a,b,d\},\{d\}\Rightarrow\{a,b,c\}, {a}{b,c,d},{b}{a,c,d},{c}{a,b,d},{d}{a,b,c},

{ a , b } ⇒ { c , d } , { a , c } ⇒ { b , d } , { a , d } ⇒ { b , c } , { b , c } ⇒ { a , d } , { b , d } ⇒ { a , c } , { c , d } ⇒ { a , b } , \{a,b\}\Rightarrow\{c,d\},\{a,c\}\Rightarrow\{b,d\},\{a,d\}\Rightarrow\{b,c\},\{b,c\}\Rightarrow\{a,d\},\{b,d\}\Rightarrow\{a,c\},\{c,d\}\Rightarrow\{a,b\}, {a,b}{c,d},{a,c}{b,d},{a,d}{b,c},{b,c}{a,d},{b,d}{a,c},{c,d}{a,b},

{ a , b , c } ⇒ { d } , { a , b , d } ⇒ { c } , { a , c , d } ⇒ { b } , { b , c , d } ⇒ { a } \{a,b,c\}\Rightarrow\{d\},\{a,b,d\}\Rightarrow\{c\},\{a,c,d\}\Rightarrow\{b\},\{b,c,d\}\Rightarrow\{a\} {a,b,c}{d},{a,b,d}{c},{a,c,d}{b},{b,c,d}{a}

这些规则代表了项集导出的所有可能的关联规则。

2、设有交易数据库如下表1所示,令MinS=0.3,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid顾客id购买商品购买日期
t 1 t_1 t1 c 01 c_{01} c01 { a , b } \{a,b\} {a,b}2015.03.01
t 2 t_2 t2 c 02 c_{02} c02 { c , b , d } \{c,b,d\} {c,b,d}2015.03.01
t 3 t_3 t3 c 01 c_{01} c01 { c } \{c\} {c}2015.03.03
t 4 t_4 t4 c 02 c_{02} c02 { b , d } \{b,d\} {b,d}2015.03.03

解:

因为最小支持度 M i n S = 0.3 MinS=0.3 MinS=0.3,事务数据库有4条记录, M i n S p t N = 0.3 × 4 = 1.2 MinSptN=0.3\times4=1.2 MinSptN=0.3×4=1.2,所以最小支持数 M i n S p t N = 2 MinSptN=2 MinSptN=2

如下表,候选频繁1-项集 C 1 C_1 C1和频繁1-项集 L 1 L_1 L1

在这里插入图片描述
如下表,候选频繁2-项集 C 2 C_2 C2和频繁2-项集 L 2 L_2 L2

在这里插入图片描述
得所有的频繁项集为 L = L 2 = { { b , d } } L=L_2=\{\{b,d\}\} L=L2={{b,d}}

3、对如表1所示的交易数据库,令MinC=0.6,试在习题2所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度 M i n C = 0.6 MinC=0.6 MinC=0.6
C o n f i d e n c e ( { b } ⇒ { d } ) = S u p p o r t ( { b , d } ) S u p p o r t ( { b } = 2 3 ≈ 0.67 > 0.6 Confidence(\{b\}\Rightarrow\{d\})=\frac{Support(\{b,d\})}{Support(\{b\}}=\frac{2}{3}\approx0.67>0.6 Confidence({b}{d})=Support({b}Support({b,d})=320.67>0.6 C o n f i d e n c e ( { d } ⇒ { b } ) = S u p p o r t ( { b , d } ) S u p p o r t ( { d } = 2 2 = 1 > 0.6 Confidence(\{d\}\Rightarrow\{b\})=\frac{Support(\{b,d\})}{Support(\{d\}}=\frac{2}{2}=1>0.6 Confidence({d}{b})=Support({d}Support({b,d})=22=1>0.6

所以 { b } ⇒ { d } \{b\}\Rightarrow\{d\} {b}{d} { d } ⇒ { b } \{d\}\Rightarrow\{b\} {d}{b} 都是强关联规则。

4、设有交易数据库如表2所示,令MinS=0.3,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid顾客id购买商品购买日期
t 1 t_1 t1 c 01 c_{01} c01 { a , b , e } \{a,b,e\} {a,b,e}2015.03.01
t 2 t_2 t2 c 02 c_{02} c02 { b , d } \{b,d\} {b,d}2015.03.01
t 3 t_3 t3 c 03 c_{03} c03 { b , c } \{b,c\} {b,c}2015.03.01
t 4 t_4 t4 c 01 c_{01} c01 { a , b , d } \{a,b,d\} {a,b,d}2015.03.03
t 5 t_5 t5 c 02 c_{02} c02 { a , c } \{a,c\} {a,c}2015.03.03
t 6 t_6 t6 c 03 c_{03} c03 { b , c } \{b,c\} {b,c}2015.03.03
t 7 t_7 t7 c 01 c_{01} c01 { a , c } \{a,c\} {a,c}2015.03.05
t 8 t_8 t8 c 03 c_{03} c03 { a , b , c , e } \{a,b,c,e\} {a,b,c,e}2015.03.05
t 9 t_9 t9 c 03 c_{03} c03 { a , b , c } \{a,b,c\} {a,b,c}2015.03.06

解:

因为最小支持度 M i n S = 0.3 MinS=0.3 MinS=0.3,事务数据库有9条记录, M i n S p t N = 0.3 × 9 = 2.7 MinSptN=0.3\times9=2.7 MinSptN=0.3×9=2.7,所以最小支持数 M i n S p t N = 3 MinSptN=3 MinSptN=3

如下表,候选频繁1-项集 C 1 C_1 C1和频繁1-项集 L 1 L_1 L1

在这里插入图片描述
如下表,候选频繁2-项集 C 2 C_2 C2和频繁2-项集 L 2 L_2 L2

在这里插入图片描述
如下表,候选频繁3-项集 C 3 C_3 C3

在这里插入图片描述
得所有的频繁项集为 L = L 2 = { { a , b } , { a , c } , { b , c } } L=L_2=\{\{a,b\},\{a,c\},\{b,c\}\} L=L2={{a,b},{a,c},{b,c}}

5、对如表2所示的交易数据库,令MinC=0.6,试在习题4所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度 M i n C = 0.6 MinC=0.6 MinC=0.6
C o n f i d e n c e ( { a } ⇒ { b } ) = S u p p o r t ( { a , b } ) S u p p o r t ( { a } = 4 6 ≈ 0.67 > 0.6 Confidence(\{a\}\Rightarrow\{b\})=\frac{Support(\{a,b\})}{Support(\{a\}}=\frac{4}{6}\approx0.67>0.6 Confidence({a}{b})=Support({a}Support({a,b})=640.67>0.6 C o n f i d e n c e ( { b } ⇒ { a } ) = S u p p o r t ( { a , b } ) S u p p o r t ( { b } = 4 7 ≈ 0.57 < 0.6 Confidence(\{b\}\Rightarrow\{a\})=\frac{Support(\{a,b\})}{Support(\{b\}}=\frac{4}{7}\approx0.57<0.6 Confidence({b}{a})=Support({b}Support({a,b})=740.57<0.6 C o n f i d e n c e ( { a } ⇒ { c } ) = S u p p o r t ( { a , c } ) S u p p o r t ( { a } = 4 6 ≈ 0.67 > 0.6 Confidence(\{a\}\Rightarrow\{c\})=\frac{Support(\{a,c\})}{Support(\{a\}}=\frac{4}{6}\approx0.67>0.6 Confidence({a}{c})=Support({a}Support({a,c})=640.67>0.6 C o n f i d e n c e ( { c } ⇒ { a } ) = S u p p o r t ( { a , c } ) S u p p o r t ( { c } = 4 6 ≈ 0.67 > 0.6 Confidence(\{c\}\Rightarrow\{a\})=\frac{Support(\{a,c\})}{Support(\{c\}}=\frac{4}{6}\approx0.67>0.6 Confidence({c}{a})=Support({c}Support({a,c})=640.67>0.6 C o n f i d e n c e ( { b } ⇒ { c } ) = S u p p o r t ( { b , c } ) S u p p o r t ( { b } = 4 7 ≈ 0.57 < 0.6 Confidence(\{b\}\Rightarrow\{c\})=\frac{Support(\{b,c\})}{Support(\{b\}}=\frac{4}{7}\approx0.57<0.6 Confidence({b}{c})=Support({b}Support({b,c})=740.57<0.6 C o n f i d e n c e ( { c } ⇒ { b } ) = S u p p o r t ( { b , c } ) S u p p o r t ( { c } = 4 6 ≈ 0.67 > 0.6 Confidence(\{c\}\Rightarrow\{b\})=\frac{Support(\{b,c\})}{Support(\{c\}}=\frac{4}{6}\approx0.67>0.6 Confidence({c}{b})=Support({c}Support({b,c})=640.67>0.6

所以 { a } ⇒ { b } \{a\}\Rightarrow\{b\} {a}{b} { a } ⇒ { c } \{a\}\Rightarrow\{c\} {a}{c} { c } ⇒ { a } \{c\}\Rightarrow\{a\} {c}{a} { c } ⇒ { b } \{c\}\Rightarrow\{b\} {c}{b} 是强关联规则。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1611420.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java测试编程题

题目1 1.创建5个线程对象 线程名设置为&#xff08;Thread01&#xff0c;Thread02&#xff0c;Thread03&#xff0c;Thread04&#xff0c;Thread05&#xff09;使用 代码实现5个线程有序的循环打印&#xff0c;效果如下&#xff1a; Thread01正在打印1 Thread02正在打印2 Threa…

【做一名健康的CSDNer】

程序员由于工作性质&#xff0c;常常需要长时间面对电脑&#xff0c;这可能对身心健康带来挑战。以下是一些实用的建议&#xff0c;帮助程序员保持身心健康&#xff1a; 规律生活&#xff1a;建立健康的生活习惯&#xff0c;包括规律的作息时间和固定的饮食时间&#xff0c;保证…

2024 年选择安全运营中心 (SOC) 工具指南

安全运营中心 (SOC) 是对抗网络威胁的前线。他们使用各种安全控制措施来监控、检测和快速响应任何网络威胁。这些控制措施对于确保信息系统全天候安全至关重要。 大型组织中的现代 SOC 与各种安全供应商合作&#xff0c;处理 75 到 100 种不同的工具。让我们探讨一下您可能遇到…

操作教程丨MaxKB+Ollama:快速构建基于大语言模型的本地知识库问答系统

2024年4月12日&#xff0c;1Panel开源项目组正式对外介绍了其官方出品的开源子项目——MaxKB&#xff08;github.com/1Panel-dev/MaxKB&#xff09;。MaxKB是一款基于LLM&#xff08;Large Language Model&#xff09;大语言模型的知识库问答系统。MaxKB的产品命名内涵为“Max …

二维图像的双线性插值

1. 原理 见下图,假设原图为单通道的灰度图,想求图像中某点Q(x,y)的灰度值。 2. 代码实现 #include <iostream> #include <stdio.h> #include <stdint.h> #include <string> #include<opencv2/opencv.hpp> #include<opencv2/core.hpp>…

C++ 程序的内存分配

C 程序的内存分配 C 程序的内存分配栈堆数据区程序代码区参考 C 程序的内存分配 一个 C 编译的程序占用内存分为以下几个部分&#xff08;从高地址到低地址&#xff09;&#xff1a; 内核空间&#xff1a;由操作系统创建并控制&#xff0c;用户代码不能读写。栈&#xff1a;由…

政安晨:【深度学习神经网络基础】(十二)—— 深度学习概要

目录 概述 深度学习的概况 深度学习的组成部分 部分标记的数据 修正线性单元 卷积神经网络 神经元Dropout GPU训练 政安晨的个人主页&#xff1a;政安晨 欢迎 &#x1f44d;点赞✍评论⭐收藏 收录专栏: 政安晨的机器学习笔记 希望政安晨的博客能够对您有所裨益&#xf…

在Java中使用XxlCrawler时防止被反爬的几种方式

目录 前言 一、常见的反爬措施 1、User-Agent识别 2、Referer识别 3、频率限制 4、IP限制 二、XxlCrawer的应对之道 1、User-Agent应对 2、频率限制 3、IP限制 三、XxlCrawler执行解析 1、XxlCrawler对象 2、启动对象 3、信息爬取线程 总结 前言 众所周知&#x…

Parade Series - CoreAudio Loopback

Scenario 鉴于业务场景需要&#xff0c; 经过技术路径探索&#xff0c; 发现 comtypes 兼容性过于混乱&#xff0c;故而考虑整合一个 CoreAudio 的轮子dll来解决实际问题&#xff01;std::StringStream ⇒ std::ios::binary ⇒ std::ofstream Loopback.dll #ifndef _DLL_C…

第63天:服务攻防-框架安全CVE 复现DjangoFlaskNode.JSJQuery

目录 思维导图 案例一&#xff1a;JavaScript-开发框架安全-Jquery&Node node.js目录穿越 CVE-2021-21315命令执行 Jquery CVE-2018-9207 案例二&#xff1a;Python-开发框架安全-Django&Flask django cve_2019_14234 CVE-2021-35042 flask ssti 思维导图 案…

LeetCode刷题实战4:寻找两个正序数组的中位数

题目内容 给定两个大小分别为 m 和 n 的正序&#xff08;从小到大&#xff09;数组 nums1 和 nums2。请你找出并返回这两个正序数组的 中位数 。 算法的时间复杂度应该为 O(log (mn)) 。 示例 1&#xff1a; 输入&#xff1a;nums1 [1,3], nums2 [2] 输出&#xff1a;2.0…

Three.js--》探秘虚拟现实VR展厅的视觉盛宴

今天简单实现一个three.js的小Demo&#xff0c;加强自己对three知识的掌握与学习&#xff0c;只有在项目中才能灵活将所学知识运用起来&#xff0c;话不多说直接开始。 目录 项目搭建 初始化three代码 camera-controls控制器使用 添加画框 画框处理事件 添加机器人模型 …

一文学会 ts 构建工具 —— tsup

文章目录 能打包什么&#xff1f;安装用法自定义配置文件条件配置在 package.json 中配置多入口打包生成类型声明文件sourcemap生成格式自定义输出文件代码分割产物目标环境支持 es5编译的环境变量对开发命令行工具友好监听模式 watch提供成功构建的钩子 onSuccess压缩产物 min…

LLMs之Llama3:Llama 3的简介、安装和使用方法、案例应用之详细攻略

LLMs之Llama3&#xff1a;Llama 3的简介、安装和使用方法、案例应用之详细攻略 导读&#xff1a;2024年4月18日&#xff0c;Meta 重磅推出了Meta Llama 3&#xff0c;本文章主要介绍了Meta推出的新的开源大语言模型Meta Llama 3。模型架构 Llama 3 是一种自回归语言模型&#x…

gdb 调试常用命令

运行命令 run简写r 运行程序&#xff0c;当遇到断点后&#xff0c;程序会在断点处停止运行continue简写c 运行到下一个断点next简写n 执行下一步语句&#xff0c;不进入函数step简写s 执行下一步语句until运行到循环体结束until 行数运行到某一行call 函数(参数)调用函数finis…

Windows10安装配置nodejs环境

一、下载 下载地址&#xff1a;https://nodejs.cn/download/ ​ 二、安装 1、找到node-v16.17.0-x64.msi安装包, 根据默认提示安装, 过程中间的弹窗不勾选 2、安装完成后, 打开powershell(管理员身份) ​ 3、命令行输入 node -v 和 npm -v 如下图所示则nodejs安装成功 ​ 三…

人大金仓参与编写《通信行业信息技术应用创新发展白皮书(2024年)》正式发布...

近日&#xff0c;由中国信息通信研究院技术与标准研究所主办的通信行业信创发展分论坛在京成功举办&#xff0c;人大金仓受邀分享行业信创实践经验及成果。论坛上正式发布了人大金仓参与编写的《通信行业信息技术应用创新发展白皮书&#xff08;2024年&#xff09;》。 本次论坛…

pycharm创建的项目

pycharm生成django templates删出 settings.py

解锁ApplicationContext vs BeanFactory: 谁更具选择性?

目录 一、聚焦源码回顾 &#xff08;一&#xff09;源码分析和理解 &#xff08;二&#xff09;简短的回顾对比建议 二、ApplicationContext vs BeanFactory特性对比 &#xff08;一&#xff09;主要特性总结 &#xff08;二&#xff09;直接建议 三、案例简单说明 &am…

21.组件组成

组件组成 组件最大的优势就是可复用性 当使用构建步骤时&#xff0c;我们一般会将 Vue 组件定义在一个单独的 .vue 文件中&#xff0c;这被叫做单文件组件(简称 SFC) 组件组成结构 <template><div>承载标签</div> </template> <script> expor…