文章目录
- 🧡🧡实验流程🧡🧡
- SIFT算法原理总结:
- 实现SIFT特征检测和匹配
- 通过RANSAC 实现图片拼接
- 更换其他图片再次测试效果(依次进行SIFT特征提取、RANSAC 拼接)
- 🧡🧡全部代码🧡🧡
🧡🧡实验流程🧡🧡
SIFT算法原理总结:
1.创建尺度空间:
高斯模糊去除噪声,强调了图像的重要特征
根据原图创建不同比例的新图像
2.采用高斯差异DOG增强特征
如下,对于某一比例的5张不同模糊程度的图像,进行差分
3.关键点定位(尺度不变性)
找出局部最大值和最小值(这里“局部”的含义:它不仅包括该图像的周围像素(像素所在的像素),还包括八度中上一张和下一张图像的九个像素)
这意味着将每个像素值与其他26个像素值进行比较,以确定是否为局部最大值/最小值。例如,在下图中,从第一个八度获得了三个图像。将标记为x的像素与相邻像素(绿色)进行比较,如果它是相邻像素中最高或最低的像素,则将其选择为关键点:
关键点的筛选
消除对比度低或非常靠近边缘的关键点:
采用二阶泰勒展开消除对比度低或非常靠近边缘的关键点、采用二阶Hessian矩阵来识别具有高边缘度但对少量噪点无鲁棒性的关键点
4.关键点方向分配(旋转不变性)
对于每个关键点和其周围的像素,都执行如下操作:
根据梯度计算幅度和方向,如下Gx=9,Gy=14则
随后创建大小和方向的柱状图
5.生成描述符
已经通过3、4生成了具有尺度不变性和旋转不变性的关键点,对于每个关键点,使用相邻像素,它们的方向和大小为该关键点生成一个唯一的指纹,称为“描述符”。
6.关键点匹配
使用描述子之间的距离或相似度度量来匹配不同图像中的关键点,通常采用最近邻或 k近邻方法来进行匹配。
(在opencv中,BFMatcher.match() 和BFMatcher.knnMatch(),第一个返回最佳匹配,第二个返回前k个最佳的匹配,k值由用户指定。)
实现SIFT特征检测和匹配
原始图像如下:
截出两个图像(分别截取前宽度的4/5和后4/5部分)
画出关键点
SIFT匹配(总共529个匹配,按连线长度升序,画出全部线)
为方便观察,画出按连线长度前100匹配的连线
将右侧图片旋转90度,重复上述步骤
将右侧图片旋转15度,并缩放到原图0.8倍,重复上述步骤
通过RANSAC 实现图片拼接
右侧图片正放
拼接结果:
右侧图片旋转90度
拼接结果:
右侧图片旋转15度并缩放到0.8倍
拼接结果:
更换其他图片再次测试效果(依次进行SIFT特征提取、RANSAC 拼接)
🧡🧡全部代码🧡🧡
import numpy as np
import cv2
from matplotlib import pyplot as plt
def cv_show(title,img):
cv2.imshow(title, img)
cv2.waitKey(0)
cv2.destroyAllWindows()
"""
SIFT 图像特征连接+ RANSAC拼接
"""
def check_and_draw_KeyPoint(img1,img2):
img1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY)
img2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
# Sift
sift = cv2.SIFT_create()
kp1, des1 = sift.detectAndCompute(img1,None)
kp2, des2 = sift.detectAndCompute(img2,None)
# len(kp1), len(kp2)
# Draw KeyPoint
imgShow1 = cv2.drawKeypoints(img1,kp1,None,color=(255,0,255)) #画出特征点,并显示为红色圆圈
imgShow2 = cv2.drawKeypoints(img2,kp2,None,color=(255,0,255)) #画出特征点,并显示为红色圆圈
cv_show("KeyPoint", np.hstack((imgShow1, imgShow2)))
return img1,img2,kp1,kp2,des1,des2
def match_KeyPoint(img1,img2,kp1,kp2,des1,des2,show_line_num=100):
# Feature Matching
bf = cv2.BFMatcher(cv2.NORM_L1, crossCheck=True)
matches = bf.match(des1,des2)
matches =sorted(matches, key=lambda x:x.distance)
# print(len(matches))
imgShow = cv2.drawMatches(img1, kp1, img2, kp2, matches[0:show_line_num], None, flags=2)
cv_show("Match",imgShow)
def concat_Image(img1,img2,kp1,kp2,des1,des2):
# 匹配特征,并返回透视变换矩阵
matcher = cv2.BFMatcher()
rawMatches = matcher.knnMatch(des2, des1, 2)
matches = []
for m in rawMatches:
if len(m) == 2 and m[0].distance < m[1].distance * 0.75:
matches.append((m[0].trainIdx, m[0].queryIdx))
kp1 = np.float32([kp.pt for kp in kp1])
kp2 = np.float32([kp.pt for kp in kp2])
if len(matches) > 4:
ptsA = np.float32([kp2[i] for (_, i) in matches])
ptsB = np.float32([kp1[i] for (i, _) in matches])
(H, status) = cv2.findHomography(ptsA, ptsB, cv2.RANSAC, 4.0)
result = cv2.warpPerspective(img2, H, (img2.shape[1] + img1.shape[1], img2.shape[0]))
result[0:img1.shape[0], 0:img1.shape[1]] = img1
cv_show("Concat Image",result)
if __name__=="__main__":
# Read Original Image
image = cv2.imread('img/test2_Sift.jpg')
height, width, _ = image.shape
image = cv2.resize(image,(int(width*4/6),int(height*4/6))) # 图片有点宽,缩放一下
height, width, _ = image.shape
# 截取前4/5部分和后4/5部分
img1 = image[:, 0 : int(width * 4 / 5)]
img2 = image[:, int(width / 5) : width]
img1 = cv2.imread("img/test2_river1.png")
img2 = cv2.imread("img/test2_river2.png")
# 可注释)图像转变2:img2旋转90度
# img2 = cv2.rotate(img2, cv2.ROTATE_90_CLOCKWISE) # 旋转90度
# img2 = cv2.resize(img2,(img2.shape[1], img1.shape[0]))
# 可注释)图像转变3:img2旋转15度,并且缩放到0.9倍,同时img1设置跟img2同样高度,并且宽度按比例变换
# center=(width/2,height/2)
# angle=15
# scale=0.8
# M=cv2.getRotationMatrix2D(center,angle,scale)
# img2=cv2.warpAffine(img2,M,(int(width),int(1.1*height)))
# img1=cv2.resize(img1,(int(img1.shape[1]*img2.shape[0]/img1.shape[0]), img2.shape[0]))
cv_show("spilt", np.hstack((img1, img2))) #拼接显示原图
# 调用自定义函数
img1,img2,kp1,kp2,des1,des2=check_and_draw_KeyPoint(img1,img2) # 检测并画出关键点
match_KeyPoint(img1,img2,kp1,kp2,des1,des2, show_line_num=100) # 连接关键点
concat_Image(img1,img2,kp1,kp2,des1,des2) # 拼接图像