1. 方法概述
1.1 定义
粗糙集是波兰理工大学Z.pawlak教授提出用来研究不完整数据,不精确知识的表达、学习,归纳等的一套理论。它是一种新的处理模糊和不确定性问题的数学工具,已被广泛应用于知识发现、机器学习、决策支持、模式识别、专家系统及归纳推理等领域。
粗糙集理论的特点是能够分析隐藏在数据中的事实,又不需要关于数据附加信息。其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。
从数学的角度看,粗糙集是研究集合的;从编程的角度看,粗糙集的研究对象是矩阵,只不过是一些特殊的矩阵;从人工智能的角度来看,粗糙集研究的是决策表。
1.2 案例
假设有如下的信息表
可以看出,在信息系统中,有很多的对象,它们有着各种各样的属性其中不同的对象有着不同或者相同的条件属性,使得每个对象有着不同的特征,这些条件属性会影响到决策属性,决策属性不同,将决定着这个信息系统能被分成几类显然决策属性值的不同直接受条件属性的影响,可以说每一个条件属性都可能成为决定决策属性值的潜在影响因素。进而决定着信息系统中的对象会被划分到哪一类去。但是,我们也知道,影响事物的潜在因素会有很多,有些会显著影响结果,有些会有一些影响,而有些因素却是可有可无的。
粗糙集理论是可用于分析不确定(包括模糊)系统的许多方法之一,尽管与概率、统计学、熵和Demp