【SCAU数据挖掘】数据挖掘期末总复习题库应用题及解析

news2025/1/16 17:37:52

1.

给定圆的半径为e ,令 MinPts=3,考虑下面两幅图。


(1)哪些对象是核心对象?       

        m,p,o,r(因为这些核心对象在半径e的范围内都至少包含MinPts=3个对象)


(2)哪些对象是直接密度可达的?        

        对象q是从m直接密度可达的。对象m从p直接密度可达的。


(3)哪些对象是密度可达的?

        对象q是从p(间接)密度可达的(因为q从m直接密度可达,m从p直接密度可达。)

        r和s是从o密度可达的


(4)哪些对象是密度相连的?

        r和s是从o密度可达的,所以r和s是密度相连的。

核心对象:如果一个对象的ε-邻域内至少包含MinPts个对象,则该对象为核心对象。在这里,ε是邻域半径,MinPts是给定的最小点数。
直接密度可达:如果对象p在对象q的ε-邻域内,且q是核心对象,那么对象p从对象q出发是直接密度可达的。

密度可达:如果存在一个对象链p1, p2, ..., pn,其中p1=q,pn=p,且pi+1从pi关于ε和MinPts直接密度可达,那么对象p从对象q出发是密度可达的。
密度相连:如果对象集合D中存在一个对象o,使得对象p和q都是从o关于ε和MinPts密度可达的,那么对象p和q是关于ε和MinPts密度相连的。

2.相异性计算

给定两个元组(22,1,42,10)和(20,0,36,8):
(1)计算这两个对象之间的欧几里得距离。
(2)计算这两个对象之间的曼哈顿距离。
(3)使用q=3,计算这两个对象之间的闵可夫斯基距离。
(4)计算这两个对象之间的上确界距离。

欧几里得距离(Euclidean Distance):两点之间的直线距离
曼哈顿距离(Manhattan Distance):是两点在标准坐标系上的绝对轴距总和
上确界距离(Supremum Distance):是两点在各维度上距离的最大值

(1)

d=sqrt((22-20)^2+(1-0)^2+(42-36)^2+(10-8)^2)=sqrt(45)

(2)

d=∣22−20∣+∣1−0∣+∣42−36∣+∣10−8∣=2+1+6+2=11

(3)d=max(|p-q|)=6

(4)

d=max(∣22−20∣,∣1−0∣,∣42−36∣,∣10−8∣)=max(2,1,6,2)=6

3.

对于数据:{12,9,7,6,20,100,35,21,11,18,25,37},完成以下任务:

(1)计算它的平均值,20%的截断均值和中位数,并说明这三个统计特征在描述数据集方面的特点。

(2)使用最小-最大规范方法将其中的6,100,35转换到[0,1]。

(1)

平均值 = (12 + 9 + 7 + 6 + 20 + 100 + 35 + 21 + 11 + 18 + 25 + 37) / 12 = 25.08

平均值反应了数据集的平均水平,容易受到极端值的影响。

20%截断均值:丢弃高端和低端(20/2)%的数据,即丢弃最大和最小的12×0.1=1.2向上取整到2个的数据
首先将数据从小到大排序: {6, 7, 9, 11, 12, 18, 20, 21, 25, 35, 37, 100}
去掉最小的2个和最大的2个
{9, 11, 12, 18, 20, 21, 25, 35}
20%截断均值 = (9 + 11 + 12 + 18 + 20 + 21 + 25 + 35) / 8 = 18.875

截断均值通过去掉一部分极端值来减少极端值对平均值的影响,更能反映大多数数据的中心趋势。

中位数(18+20)/2=19

中位数将数据集分为两半,对于偏态分布的数据集,中位数更能代表数据的中心位置。

(2)

最小-最大规范化:将待转换数据减去最小值,再除以极差(最大值-最小值)
原数据集中最小值为6,最大值为100
极差 = 100 - 6 = 94

6的规范化值 = (6 - 6) / 94 = 0
100的规范化值 = (100 - 6) / 94 = 1
35的规范化值 = (35 - 6) / 94 = 0.3085
所以6、100、35分别规范化为0、1、0.3085
 

4.

对于如下的前馈神经网络,假设现在有一个训练样本,X={1,0,1},其对应的类标号(标签)为1,节点4、5、6的激活函数为sigmoid函数,结构如下图所示:

网络的初始输入、权值(w)和偏置值(4、5、6节点分别为)如下表所示:

(1)请计算节点4、5、6的净输入和输出


(2)请计算节点4、5、6的误差


(3)假设学习率为0.9,请计算上表中所有权值和偏置的一次更新。


(4)请问什么是梯度消失?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1848425.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

node: /lib64/libm.so.6: version `GLIBC_2.27‘ not found (required by node)

node: /lib64/libm.so.6: version GLIBC_2.27‘ not found 错误信息解决方案操作步骤:1、下载node版本2、上传服务器3、解压4、将文件名改短5、脚本新增6、重新加载环境变量source /etc/profile7、配置阿里云镜像仓库8、服务器打包完成 错误信息 这个错误信息表示…

论文解读:Pandora: 朝着结合自然语言动作与视频状态的通用世界模型发展

论文《Pandora: 朝着结合自然语言动作与视频状态的通用世界模型发展》探索了构建一个高度集成的AI系统,旨在理解自然语言指令并在视频所代表的视觉环境中执行相应操作,从而推进对复杂动态场景的建模与预测能力。以下是该论文的关键点和贡献的详细解读&am…

聊聊JSON

引言 JSON的概念 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它基于JavaScript的一个子集,但独立于语言,这意味着它可以被许多编程语言轻松解析。JSON的简洁性和易读性使其成为Web开发中数据交换的…

煤矿智能巡检机器人:推动煤矿行业变革的关键力量

目前我国煤炭资源总量达到了2078.85亿吨,已探明储量为1432亿吨,煤矿能源现阶段还是我国重要的基础能源。而煤矿生产作业存在巨大危险,主要包括高温、高压、燃爆和有毒气体等环境因素,同时机械设备运转过程中潜藏着重大风险。这些危…

MySQL 核心模块揭秘 | 21 期 | 行锁 (1) 快速加锁

行锁有两种加锁逻辑,这一期我们聊聊其中之一的快速加锁。 作者:操盛春,爱可生技术专家,公众号『一树一溪』作者,专注于研究 MySQL 和 OceanBase 源码。 爱可生开源社区出品,原创内容未经授权不得随意使用&a…

【深海王国】小学生都能做的APP?AppInventor、BLE蓝牙、Arduino联合开发你的第一个手机远程控制程序(7)

Hi~ (o^^o)♪, 各位深海王国的同志们,早上下午晚上凌晨好呀~ 辛勤工作的你今天也辛苦啦(/≧ω) 今天大都督依旧为大家带来小学生都能学会的APP制作教程,帮你一周内快速开发一款可以和单片机无线通讯的手机蓝牙APP,let’s go! &a…

Python13 时间格式转换

在Python中,时间格式转换通常指的是将日期和时间数据从一种表示形式转换成另一种。这种转换经常使用Python的datetime和time模块来实现。这些模块提供了多种工具,可以帮助用户将时间表示为字符串、时间戳,或是更加结构化的datetime对象等多种…

Android-Framework:Handler全解析,看完这篇还不懂请给我寄刀片

//【1】拿到队列头部 Message p mMessages; boolean needWake; //【2】如果消息不需要延时&#xff0c;或者消息的执行时间比头部消息早&#xff0c;插到队列头部 if (p null || when 0 || when < p.when) { // New head, wake up the event queue if blocked. msg.next…

下班时间如何安排?

随着互联网的飞速发展和数字化时代的来临&#xff0c;越来越多的人开始探索除了主业以外的赚钱途径&#xff0c;以增加收入来源。本文将为您介绍几种当前热门的高薪副业项目&#xff0c;包括网络任务赚钱、开设个人网店、电商导购推广、在线辅导教学、技能变现服务、视频创作分…

探索C嘎嘎的奇妙世界:第十六关---STL(vector的练习)

1.只出现一次的数字 我们可以使用异或运算来解决这个问题&#xff1a; 异或运算有一个重要的性质&#xff1a;两个相同的数进行异或运算结果为 0&#xff0c;任何数与 0 异或结果为其本身。对于数组中的元素&#xff0c;依次进行异或运算&#xff0c;出现两次的元素异…

任务调度框架革新:TASKCTL在Docker环境中的高级应用

Docker&#xff1a;轻量级容器化技术的魅力 Docker 作为一款开源的轻量级容器化技术&#xff0c;近年来在 IT 界掀起了一股热潮。它通过封装应用及其运行环境&#xff0c;使得开发者可以快速构建、部署和运行应用。Docker 的优势在于其轻量级、可移植性和可扩展性&#xff0c;它…

店员顾客起纠纷?EasyCVR+AI视频监控管理平台,助力连锁门店安全运营

近日&#xff0c;某品牌咖啡店店员与顾客起冲突登上了新闻热搜&#xff0c;一时间引发大量关注。随着门店完整的监控视频录像公开&#xff0c;大家才了解事情的原委&#xff0c;而并非网传的那样。 随着社会的进步和科技的发展&#xff0c;视频监控已成为各行各业不可或缺的安全…

教你开发一个适合外贸的消息群发工具!

在全球化日益加速的今天&#xff0c;外贸业务已经成为许多企业不可或缺的一部分&#xff0c;而在外贸业务中&#xff0c;高效的消息群发工具则扮演着至关重要的角色。 它能够帮助企业快速、准确地传达产品信息、促销活动等重要内容&#xff0c;从而提升业务效率和客户满意度&a…

vben admin BasicTable表格基本使用

vben admin是一款强大的后台管理系统&#xff0c;广泛应用于各种项目中。本文将为您详细介绍如何使用 便您更快地上手并充分发挥其功能。 Table 表格 | Vben Admin一个开箱即用的前端框架https://jeesite.com/front/vben-admin/docs/components/table.html#usage 1.register:…

用类来实现输入和输出时间(时:分:秒)

编写程序&#xff1a; 运行结果&#xff1a; 程序分析&#xff1a; 这是一个很简单的例子。类Time中只有数据成员&#xff0c;而且它们被定义为公用的&#xff0c;因此可以在类的外面对这些成员进行操作。t1被定义为Time类的对象。在主函数中向t1对象的数据成员输入用户…

【ai】tx2-nx:Yolo V4 直接安装与 测试

Yolo V4环境搭建 git clone https://github.com/AlexeyAB/darknet.gitcuda版本和路径也要改成我们的实际版本和路径,否则会编译失败 编译 sudo make nvidia@tx2-nx:~/twork/02_yolov4/darknet$ vi Makefile nvidia@tx2-nx:~/twork/02_yolov4/darknet$ sudo make [sudo

从起心动念上,做个好人,好人好自己(阳明心学)

人心中的天理终究不会泯灭&#xff0c;每个人心中本来就有良知&#xff0c;良知是与生俱来的。 起心动念决定了意识、语言和行为&#xff0c;而这些意识、语言和行为又决定了事事物物&#xff0c;事事物物连接起来就是我们的人生。 让自己不断产生更好的念头&#xff0c;坚持…

拿下PostgreSQL中级认证PCP,现在它是我简历上的亮点了!

作者&#xff1a;IT邦德 中国DBA联盟(ACDU)成员&#xff0c;10余年DBA工作经验&#xff0c; Oracle、PostgreSQL ACE CSDN博客专家及B站知名UP主&#xff0c;全网粉丝10万 擅长主流Oracle、MySQL、PG、高斯及Greenplum备份恢复&#xff0c; 安装迁移&#xff0c;性能优化、故障…

小红书点赞评论收藏【更新版本】

小红书作为社交媒体的一个亮点&#xff0c;其点赞、评论和收藏的功能形成了一种特有的交流机制。点赞简直就是一枚迷你奖章&#xff0c;为创作者带去信心与动力。一次点赞&#xff0c;表达的是你心中无言的喜好和认可&#xff1b;它如明亮的灯塔&#xff0c;在汪洋大海中为创作…

史上最全的整合Harbor安装教程,哈哈哈哈

一、安装docker 下载地址&#xff1a;https://download.docker.com/linux/static/stable/x86_64/docker-23.0.4.tgz 1.1 解压二进制包 wget https://download.docker.com/linux/static/stable/x86_64/docker-23.0.4.tgz tar zxvf docker-23.0.4.tgz mv docker/* /usr/bin1.2…