论文阅读笔记《Common Visual Pattern Discovery via Spatially Coherent Correspondences》

news2026/2/11 4:04:10

核心思想

两组点集中共有的匹配区域通常具备两个特点：1.局部的特征相似；2.特征点在空间上的分布也相似。作者将候选匹配点对作为图的节点，将两种相似性统一到边的权重来表示。通过寻找图中稠密连接的子图来寻找两个点集中的匹配区域，如下图所示
在这里插入图片描述

实现过程

首先，利用SIFT等算法分别从两幅图像中提取特征点集 $P, Q$ ，其中的特征点 $p$ 包含两个特征信息 $p_d,p_c$ ， $p_d$ 表示由SIFT提取的局部特征向量， $p_c$ 表示特征点的坐标。内积空间 $C=P\times Q$ 表示所有可能的对应关系，每组对应点 $c_i$ 都由一对点 $(i, i^{'})$ 表示，其中 $i\in P, i'\in Q$ 。每组对应点的局部特征相似得分 $S_{c_i}=f_1(i_d,i'_d)$ ，由于匹配点通常局部特征都比较相似，因此仅保留相似得分较大的对应点 $M=\{c|c\in C, S_{c}>\epsilon \}$ 。
在这里插入图片描述

对于两组对应点 $c_i=(i,i')$ 和 $c_j=(j,j')$ ，设第一幅图中的点 $i$ 和 $j$ 之间的距离为 $l_{ij}$ ，第二幅图中的点 $i^{'}$ 和 $j^{'}$ 之间的距离为 $l_{i'j'}$ 。如果它们是两组匹配点，那么我们应该可以通过对第二幅图放缩 $l_{ij}/l_{i'j'}$ 倍，来使两组点对齐。同理，如果两个公共的匹配区域包含 $n$ 组对应点，那么他们两两之间构成的匹配关系应该有较为接近的放缩系数，而噪点或离群点通常不具备这样的特点。两组对应点之间的几何一致性得分 $S_{c_ic_j}(s)=f_2(|l_{ij}-sl_{i'j'}|)$ ， $s$ 表示放缩系数。 $f_2(x)$ 是一个非负单调递减函数，本文中取
在这里插入图片描述
假设一个对应点集 $M$ 包含 $m$ 组对应点， $M=\{c_1, c_2...c_m\}$ 。可以构建一个包含 $m$ 个节点的图 $G$ ，每个节点都表示一组对应点，这个图称之为动态对应图（dynamic correspondence graph）。节点 $i$ 和 $j$ 之间的边的权重 $w_{ij}$ 可表示为
在这里插入图片描述
该权重与放缩系数 $s$ 有关，则加权邻接矩阵 $A (s)$ 可定义为

$A (s)$ 是一个对称的非负矩阵。
对于一个由 $n$ 个特征点构成的共同匹配区域，当选择正确的放缩系数 $s_0$ 时，对应点之间的局部特征相似得分和几何一致性得分应该都很高，即边的权重会较大，那么就对应图 $G$ 中的一个稠密子图 $T$ 。这个稠密子图具备较高的平均类内相似性得分（average intra-cluster affinity score） $S_{av}(s_0)=\frac{1}{n^2}\sum_{i\in T,j\in T}A(i,j)(s_0)$ 。如果使用指示向量 $y$ 来表示 $T$ ，即如果 $i\in T$ ， $y (i) = 1$ 否则为 $0$ 。则 $S_{av}(s_0)$ 可表示为 $S_{av}(s_0)=\frac{1}{n^2}y^TA(s_0)y=x^TA(s_0)x$ ，其中 $x = y / n$ 。由于 $\sum_iy(i)=n$ ，则 $\sum_ix(i)=1$ 。
根据Motzkin-Straus定理，下式中的局部极大值点就对应图中的一个最大团
在这里插入图片描述
其中

简而言之，作者将寻找图 $G$ 中稠密子图 $T$ 的问题转化为了求解目标函数 $f (x)$ 的局部极大值点的问题。
给定一个放缩系数 $s_0$ ，优化目标函数 $f (x)$ 可能包含许多的局部极大值点，极值点的值越大越有可能对应正确的公共匹配区域。给定一个初始的 $x (1)$ ，则 $f (x)$ 的局部极大值点 $x^*$ 可通过模仿者等式（Replicator Equation）得到
在这里插入图片描述
通过迭代计算上述等式，当数值收敛于稳定点时，则对应于 $f (x)$ 的一个局部极大值点。
为了找到全部的局部最大值点 ${x^*\}$ ，可以提供多个初始化 $x (1)$ 分别进行迭代计算。由于局部最大值点 $x^*$ 对应于共同匹配区域，因此它具备两个特性：

局部性，对于图 $G$ 中每个节点 $v$ ，包含 $v$ 在内的共同匹配区域是 $N(v)\cup v$ 的子集， $N (v)$ 表示 $v$ 的邻域。因此只需要对图 $G$ 中每个节点 $v$ 的邻域中对 $x (1)$ 进行初始化。
非交叉性，两个不同的共同匹配区域通常不会包含公共的顶点。这意味这两个局部极大值点 $x^*,y^*$ ，其对应两个不同的共同匹配区域，应满足 $x^{*T}y^*\approx 0$ 。

利用上述特性，可以对图 $G$ 中的每个节点及其邻域分别进行初始化，然后通过模仿者等式寻找到该初始化对应的局部极大值点。将所有的局部极大值点进行降序排列，并将极值较小的点舍去。最后，根据 $x^{*T}y^*$ 是否大于 $\eta$ 来将局部极大值点进行合并，从而求得最终要保留的局部极大值点，如算法1所示
在这里插入图片描述
得到局部极大值点还要将其恢复到对应的共同匹配区域， $x^*$ 中的每个点 $x_i^*$ 表示对应点 $i$ 是正确匹配点的概率，可以通过算法2得到共同匹配区域

在实际应用中，放缩系数 $s$ 通常属于一个范围 $R=[s_0,s_1]$ ，因此可以通过在该范围内均匀采样得到 $s$ ，然后分别计算不同放缩系数条件下对应的共同匹配区域，如算法3所示
在这里插入图片描述