关于邻域粗糙集的性质及定理理解
以上是邻域粗糙集的一些基本定义。HU 等人提出了 NRS,是基于经典的在粗糙集模型提出的,该模型基于邻域关系而非等价关系,模型是建立在邻域结构上的,可以直接应用在连续型数据集上。
下面主要是对定理2.1 到2.3的自我理解:
这是胡在文章中的提到的三个定理。 (邻域符号有点不一致), δ B 2 ( x ) \delta_{B_2}(x) δB2(x) 表示样本x在条件属性集B2的邻域子集, δ B 1 ( x ) \delta_{B_1}(x) δB1(x) 表示样本x在条件属性集B1的邻域子集。
先看定理2.3:
若 B 1 B_1 B1小于 B 2 B_2 B2, 计算p范数空间,样本之间的距离。
Δ B 2 ( x , x i ) = ( ∑ j = 1 s ∣ g ( x , a j ) − g ( x i , a j ) ∣ p ) 1 p = ( ∑ j = 1 t ∣ g ( x , a j ) − g ( x i , a j ) ∣ p + ∑ j = t + 1 s ∣ g ( x , a j ) − g ( x i , a j ) ∣ p ) 1 p ≥ ( ( ∑ j = 1 t ∣ g ( x , a j ) − g ( x i , a j ) ∣ p ) 1 p = Δ B 1 ( x , x i ) . \begin{aligned} \Delta_{B_2}(x,x_i)& =(\sum_{j=1}^s|g(x,a_j)-g(x_i,a_j)|^p)^{\frac1p} \\ &=(\sum_{j=1}^t|g(x,a_j)-g(x_i,a_j)|^p+\sum_{j=t+1}^s|g(x,a_j)-g(x_i,a_j)|^p)^{\frac{1}{p}} \\ &\geq((\sum_{j=1}^t|g(x,a_j)-g(x_i,a_j)|^p)^{\frac{1}{p}} \\ &=\Delta_{B_1}(x,x_i). \end{aligned} ΔB2(x,xi)=(j=1∑s∣g(x,aj)−g(xi,aj)∣p)p1=(j=1∑t∣g(x,aj)−g(xi,aj)∣p+j=t+1∑s∣g(x,aj)−g(xi,aj)∣p)p1≥((j=1∑t∣g(x,aj)−g(xi,aj)∣p)p1=ΔB1(x,xi).
在B2下,点与点之间的距离始终比在B1的属性下要大。即在图上表示为点与点越稀疏。
若 B 1 B_1 B1小于 B 2 B_2 B2, 当邻域半径不变,当只有 B 1 B_1 B1时,这圆圈假设圈住了X2,x3,x4。
当是 B 2 B_2 B2时,虽然点与点的分布特征变了。根据公式,点的距离变大,距离会变得更稀疏。当半径不变时,这个圆圈圈得更少。可能只圈住X2。
δ B 2 ( x ) \delta_{B_2}(x) δB2(x) 含义为在B2属性下,x的邻域样本集合。
则证明 δ B 2 ( x ) \delta_{B_2}(x) δB2(x)小于 δ B 1 ( x ) \delta_{B_1}(x) δB1(x).
定理得证。
定理2.1 和 2.2理解
δ B 2 ( x ) \delta_{B_2}(x) δB2(x)小于 δ B 1 ( x ) \delta_{B_1}(x) δB1(x) , δ B ( x ) \delta_{B}(x) δB(x) 集合一定包含自己 ,在 B 1 B_1 B1下,若x是正域样本,在 B 2 B_2 B2下x一定是正域样本。(大的集合属于U,那么小的集合肯定属于U) 。
若x在 B 1 B_1 B1不是正域样本,若邻域样本减少后,在 B 2 B_2 B2下可能是正域样本。
即证明 P o s B 1 Pos_{B1} PosB1小于 P o s B 2 Pos_{B2} PosB2.
定理2.1同理。
参考文献
HU Q, YU D, LIU J, et al. Neighborhood rough set based heterogeneous feature subset
selection[J]. Information Science, 2008, 178(18): 3577-3594.