第四章 数据关联分析方法

news2025/1/10 23:29:52

基本概念和方法

关联规则和算法应用

基本概念和术语

关联规则算法应用:

一个关联规则分析的例子—————超市购物篮分析

 

 不要看

后面数字看不懂

 

 

 项集:是指项的集合。包含k个项的项集称为k-项集

支持度:若A是一个项集,则A的支持度表示在所有事务T中同时出现A项集的概率

置信度:A出现的次数除以A和B同时出现的次数。

 频繁项集:支持度满足最小支持度阈值的项集称为频繁项集。通常k-项集如果满足最小支持度阈值,称为频繁集,记作Lk。

关联规则(Association Rule):可以表示为一个蕴含式。

如:X=>Y,X和Y分别称为关联规则的前件和后件。

关联规则是否可用,需要考察他的支持度和置信度(可信度)两个指标。

 可以通过以下实例来理解:

 置信度等于两者出现的支持度和前者出现的支持度之比。

  

 

 

 经典的Apriori关联规则算法

 Apriori关联规则算法基本思想

Apriori的基本思想:频繁项集的任何非空子集也一定是频繁的。

核心思想:扫描数据获得所有的频繁1项集L1,利用L1查找频繁2项集,如此循环直到不再有新的频繁集被找到为止。而获取不同长度的频繁项集之前,都需要先查找到候选集(支持度满足最小支持度阈值的项集)。

 如何生成候选集呢?

 先自连接再进行修剪。

这个例子非常重要,比较容易理解。

支持度(sup)就是数出在数据集D中itemset出现的次数

{1,2,3}.{1,2,3,5},{1,3,5},{2,3,5}再进行修剪,他们的子集都必须在L2里面。

去除{1,2,3},{1,2,3,5},{1,3,5}

得到C3{2,3,5}

Apriori算法的缺点:

多次扫描数据库,产生巨大数量的候选集,繁琐的支持度计算。

下面我们来讲解FP-Growth算法

FP-Growth算法不产生候选项集,而是采用分而治之的策略。

(1)构建FP树:压缩数据库,并将频繁项放入频繁模式树(FP树),他仍然保留项集的关联信息。

(2)从FP树中挖掘频繁项集:
1.从FP中获得条件模式基

2.利用条件模式基,构建一个条件FP树

3.根据条件FP树,进行排列组合,挖掘出频繁项。

以下示例较为简单:重点理解

 设定最小支持度为2,得到频繁集,并按照大小重新排列。

 第二次扫描排序后的数据库。并且构建FP树。

开始从FP树中进行挖掘——频繁项集

 那什么是条件模式基呢?

 为什么每个条件模式基的计数为1呢?
由于i5的计数为1,最终到达i5的重复次数也只能为1,所以条件模式基的计数是根据路径中的结点的最小计数来决定的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/482687.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue3 +TypeScript 引入 BabylonJs(Vue3实现3D)【一篇文章精通系列】

本文主要介绍如何使用Vue3和TypeScript引入BabylonJs技术实现3D效果。结合实际案例,详细讲解了如何在Vue3项目中引入BabylonJs,并了解其相关知识。通过本文的学习,相信读者可以轻松掌握Vue3实现3D效果以及BabylonJs的相关知识。 Vue3 TypeS…

天梯赛L1-001 ~ 010

👂 White Lie - Jhameel - 单曲 - 网易云音乐 👂 丁丁猫儿 - 施鑫文月 - 单曲 - 网易云音乐 今年蓝桥 / 天梯都陪跑,希望明年,蓝桥杯省一(CA组60分),天梯赛国三(180分)…

详细的实用技巧,让你轻松成为WEB自动化测试大师

目录 一、什么是WEB自动化测试 二、WEB自动化测试工具 三、SeleniumPython环境搭建 1. 安装Python解释器 2. 安装Selenium库 3. 下载浏览器驱动程序 4. 配置环境变量 四、WEB自动化测试实战 1. 编写测试脚本 2. 使用Page Object模式 3. 使用数据驱动测试 五、总结 …

【PowerDesigner】一款超好用的E-R图工具,快速构建出高质量的数据库结构,提高开发效率和代码质量

博主简介:努力学习的大一在校计算机专业学生,热爱学习和创作。目前在学习和分享:数据结构、Go,Java等相关知识。博主主页: 是瑶瑶子啦所属专栏: Mysql从入门到精通 近期目标:写好专栏的每一篇文章 文章目录…

IPsec IKE第一阶段主模式和野蛮模式

国密标准GMT 0022-2014 IPSec VPN 技术规范,IPsec IKE过程中交换类型的定义将主模式Main mode分配值为2,快速模式-quick mode分配值为32。标准中并没有提现分配值为4的交换类型。在实际应用中,IKE第一阶段经常会出现交换类型为4的情况&#x…

留守儿童爱心网站

摘要 随着留守儿童爱心管理的不断发展,留守儿童爱心网站在现实生活中的使用和普及,留守儿童爱心管理成为近年内出现的一个热门话题,并且能够成为大众广为认可和接受的行为和选择。设计留守儿童爱心网站的目的就是借助计算机让复杂的管理操作…

【C++】-关于类和对象的默认成员函数(中)-拷贝构造函数和赋值运算符重载函数

💖作者:小树苗渴望变成参天大树 ❤️‍🩹作者宣言:认真写好每一篇博客 💨作者gitee:gitee 💞作者专栏:C语言,数据结构初阶,Linux,C 如 果 你 喜 欢 作 者 的 文 章 ,就 给 作 者 点…

带你玩转单向链表(学习必备)

本文概要 本篇文章主要介绍数据结构中单向链表各种操作,适合有C语言基础的同学,文中描述和代码示例很详细,干货满满,感兴趣的小伙伴快来一起学习吧! 🌟🌟🌟个人简介🌟&…

Redis入门到实战(实战篇)

Redis基础篇 实战篇Redis 开篇导读 亲爱的小伙伴们大家好,马上咱们就开始实战篇的内容了,相信通过本章的学习,小伙伴们就能理解各种redis的使用啦,接下来咱们来一起看看实战篇我们要学习一些什么样的内容 短信登录 这一块我们会使…

携程:一个被严重低估了的在线旅游平台?

来源:猛兽财经 作者:猛兽财经 携程和旅游行业面临的不利因素依然存在 在疫情期间,由于全球范围内的旅行受到了限制,所以整个旅游行业都受到了巨大打击。休闲旅游和商务旅行也陷入了停顿,此后一直在缓慢恢复。 而当疫情…

Java8流式操作——最终操作

什么是最终操作? 当我们通过最终方法对流对象进行操作,说明stream流操作也完成,最后我们将对象汇总成一个结果(总数、对象、集合……) 方法 collect:将Stream中的元素汇总(转化)成…

探索三维世界【2】:Three.js 的 Texture 纹理

缤纷三维世界大揭秘:探索 Three.js 的 Texture 纹理 1、Texture纹理2、TextureLoader 纹理加载器2.1、创建纹理加载器2.2、纹理属性设置2.3、设置纹理渲染2.4、打光 3、完整代码与展示 1、Texture纹理 Texture 是 three.js 中的“纹理”概念。纹理是指将一张图像映…

ESP8266基于Lua开发使用U8g2模块驱动 i2c ssd1306 OLED显示

ESP8266基于Lua开发使用U8g2模块驱动 i2c ssd1306 OLED显示 📍相关篇《ESP8266基于Lua开发点灯示例》 📖U8g2对应的API接口函数:https://nodemcu.readthedocs.io/en/release/modules/u8g2/ 📺驱动显示效果: &#…

Winform从入门到精通(38)——StatusStrip(史上最全)更新中

一、属性 1、Name 获取StatusStrip控件对象 2、AllowDrop 允许用户拖拽数据到控件上 3、AllowItemReorder 当用于按下alt键时,是否允许对项进行排列,如下图: 4、AllowMerge 5、Anchor 6、AutoSize 7、BackColor 设置StatusStrip的背景色 8、BackgroundImage 设置背…

解决wordpress 没有“add new“按钮

文章目录 问题描述解决方案两个参数的详细解释DISALLOW_FILE_EDITDISALLOW_FILE_MODS 问题描述 新安装的wordpress发现没有“add new“按钮,很奇怪。 解决方案 修改wp-config.php文件,增加如下两行即可修复问题: define(‘DISALLOW_FILE_E…

【实战详解】如何快速搭建接口自动化测试框架?:Python + Requests

摘要: 本篇文章将介绍如何基于Python和Requests库快速搭建一个简单而高效的接口自动化测试框架。您将会了解到设计测试用例、准备测试数据、编写自动化脚本等步骤,以及如何使用断言来检查测试结果,并最终构建一个可重用、易扩展的自动化测试…

【前端每日一问002】jquery中each与data方法的用法与概念

在 jQuery 中,.each() 方法和 .data() 方法都是常用的工具。这两个方法的用法和概念如下: 🌙一、.each() 方法: .each() 方法是 jQuery 对象的方法,用于遍历匹配元素集合中的所有元素,并对每个元素执行一个…

【LeetCode】1000题挑战(225/1000)

1000题挑战 没有废话,直接开刷! 目录 1000题挑战 没有废话,直接开刷! 第一题:202. 快乐数 - 力扣(Leetcode) 题目接口: 解题思路: 代码: 过过过过啦…

基于W1R3S的渗透测试

您被雇来对W1R3S做渗透测试,他们要求您获得root权限并找到标志(位于/root目录中)。 目标:得到root权限&找到flag.txt 目录 1、信息收集 (1)定位靶机IP (2)端口扫描 (3)脚本…

【HTMLCSSJS】写实验发现的一些注意点

🎊专栏【 前端易错合集】 🍔喜欢的诗句:更喜岷山千里雪 三军过后尽开颜。 🎆音乐分享【如愿】 大一同学小吉,欢迎并且感谢大家指出我的问题🥰 目录 🚥innerHtml和innerText的区别 &#x1f3f…