K 近邻图(KNN - graph)和局部线性嵌入图(LLE - graph)是用于构建数据点之间关系图的两种方法。
1. k近邻图(knn-graph)
-
核心思想:k近邻图通过计算样本之间的距离来构建图。具体来说,对于每个样本,找到其最近的 k 个邻居,并用边连接这些邻居。
-
图的表示:在k近邻图中,图的边权重通常表示样本之间的距离关系。例如,两个样本之间的距离越小,它们之间的边权重越大。
-
特点:
-
直接基于样本之间的距离构建图。
-
图的边权重反映了样本之间的物理距离。
-
2. 局部线性嵌入图(LLE-graph)
-
核心思想:局部线性嵌入图通过线性表示来构建图。具体来说,对于每个样本,找到其最近的 k 个邻居,并用这些邻居的线性组合来表示该样本。
-
图的表示:在LLE-graph中,图的边权重表示样本之间的表示能力或贡献。例如,一个样本在表示另一个样本时的线性组合系数越大,表示它对后者的贡献越大。
-
特点:
-
基于样本之间的线性表示关系构建图。
-
图的边权重反映了样本之间的表示关系,而不是直接的物理距离。
-
3. 两者的相似性
-
共同目标:knn-graph和LLE-graph都用于捕捉数据的局部几何结构。它们都假设数据在局部区域内具有一定的结构(例如,局部线性或局部平滑)。
-
共同方法:两者都使用距离度量来找到每个样本的最近邻(即 k 个最近的样本)。
4. 两者的区别
-
knn-graph:
-
图的边权重表示样本之间的距离关系。
-
直接基于样本之间的距离构建图。
-
例如,如果样本 i 和样本 j 之间的距离很小,那么它们之间的边权重会很大。
-
-
LLE-graph:
-
图的边权重表示样本之间的表示能力或贡献。
-
基于样本之间的线性表示关系构建图。
-
例如,如果样本 i 在表示样本 j 时的线性组合系数很大,那么它们之间的边权重会很大。
-
5. 总结
-
knn-graph:基于样本之间的距离关系构建图,边权重表示距离。
-
LLE-graph:基于样本之间的线性表示关系构建图,边权重表示表示能力或贡献。
两者的共同点是都使用距离度量来捕捉数据的局部几何结构,但它们在表示样本之间关系的方式上有所不同。