OpenCV-Python(43):姿势估计

news2025/4/20 15:13:34

目标

学习了解calib3D 模块
学习在图像中创建3D效果

calib3D模块

OpenCV-Python的calib3D模块是OpenCV库中的一个重要模块，用于摄像头标定和三维重建等计算机视觉任务。该模块提供了一些函数和类，用于摄像头标定、立体视觉和三维重建等方面的操作。

下面是一些calib3D模块常用的函数和类的介绍：

1.findChessboardCorners()：用于在一张图片中查找棋盘格角点的函数。可以用于摄像头标定。

2.calibrateCamera()：用于摄像头标定的函数。根据一系列已知世界坐标和对应的图像坐标，计算出相机内参数和畸变系数。

3.undistort()：用于去除图像畸变的函数。根据相机内参数和畸变系数，对图像进行去畸变处理。

4.stereoCalibrate()：用于立体标定的函数。根据一系列已知的立体对应点对，计算出两个相机的内参数、外参数和立体校正参数。

5.stereoRectify()：用于立体校正的函数。根据相机的内参数、外参数和立体校正参数，对两个输入图像进行立体校正，以便进行立体匹配。

6.stereoSGBM()：用于立体匹配的函数。根据两个校正后的图像，进行视差计算并生成视差图。

摄像头标定步骤

使用calib3D模块进行摄像头标定的基本步骤如下：

准备一系列棋盘格图像，保证棋盘格在各个位置、角度和距离上都有充分的变化。
对每张图像，使用findChessboardCorners()函数查找棋盘格角点，并将角点的图像坐标和对应的世界坐标存储起来。
使用calibrateCamera()函数对所有的角点进行摄像头标定，得到相机的内参数和畸变系数。
使用undistort()函数对图像进行去畸变处理，得到校正后的图像。

立体视觉步骤

使用calib3D模块进行立体视觉的基本步骤如下：

准备一系列立体对应点对，包括左右图像的图像坐标和世界坐标。
使用stereoCalibrate()函数对立体对应点对进行立体标定，得到两个相机的内参数、外参数和立体校正参数。
使用stereoRectify()函数对输入图像进行立体校正，得到校正后的图像。
使用stereoSGBM()函数对校正后的图像进行立体匹配，得到视差图。

姿势估计基础

在上一节的摄像机标定中，我们已经得到了摄像机矩阵，畸变系数等。有了这些信息我们就可以估计图像中图案的姿势，比如目标对象是如何摆放，如何旋转等。对一个平面来说，我们可以假 Z=0，这样问题就转化成摄像机在空间中是如何摆放(然后拍摄)的。所以，如果我们知道对象在空间中的姿势，我们就可以在图像中绘制一些2D 的线条来产生3D 的效果。我们来看一下怎么做吧。

我们的问题是，在棋盘的第一个角点绘制3D 坐标(X,Y,Z轴)。X轴为蓝色，Y 轴为绿色，Z 轴为红色。在视觉效果上来看，Z 轴应该是垂直与棋盘平面的。

首先我们要加载前面结果中摄像机矩阵和畸变系数。

import cv2
import numpy as np
import glob

# Load previously saved data
with np.load('B.npz') as X:
    mtx, dist, _, _ = [X[i] for i in ('mtx','dist','rvecs','tvecs')]

现在创建一个函数:draw,它的参数有棋盘上的角点(使用cv2.findChessboardCorners() 得到)和要绘制的3D 坐标轴上的点。

def draw(img, corners, imgpts):
    corner = tuple(corners[0].ravel())
    img = cv2.line(img, corner, tuple(imgpts[0].ravel()), (255,0,0), 5)
    img = cv2.line(img, corner, tuple(imgpts[1].ravel()), (0,255,0), 5)
    img = cv2.line(img, corner, tuple(imgpts[2].ravel()), (0,0,255), 5)
    return img

和前面一样，我们要设置终止条件，对象点(棋盘上的3D角点）和坐标轴点。3D 空间中的坐标轴点是为了绘制坐标轴。我们绘制的坐标轴的长度为3。所以X 轴从（0,0,0）绘绘制到(3,0,0),Y 轴也是。Z 轴从（0,0,0）绘制到（0,0,-3）。负值表示它是朝着（垂直于）摄像机方向。

criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001)
objp = np.zeros((6*7,3), np.float32)
objp[:,:2] = np.mgrid[0:7,0:6].T.reshape(-1,2)
axis = np.float32([[3,0,0], [0,3,0], [0,0,-3]]).reshape(-1,3)

很通常一样我们需要加载图像。搜寻7x6 的格子，如果发现，我们就把它优化到亚像素级。然后使用函数:cv2.solvePnPRansac() 来计算旋转和变换。当我们有了变换矩阵之后，我们就可以利用它们将这些坐标轴点映射到图像平面中去。简单来说，我们在图像平面上找到了与3D 空间中的点（3,0,0）,(0,3,0),(0,0,3) 相对应的点。然后我们就可以使用我们的函数draw() 从图像上的第一个角点开始绘制连接这些点的直线了。搞定！！！

for fname in glob.glob('left*.jpg'):
    img = cv2.imread(fname)
    gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    ret, corners = cv2.findChessboardCorners(gray, (7,6),None)
    if ret == True:
        corners2 = cv2.cornerSubPix(gray,corners,(11,11),(-1,-1),criteria)
        # Find the rotation and translation vectors.
        rvecs, tvecs, inliers = cv2.solvePnPRansac(objp, corners2, mtx, dist)
        # project 3D points to image plane
        imgpts, jac = cv2.projectPoints(axis, rvecs, tvecs, mtx, dist)
        img = draw(img,corners2,imgpts)
        cv2.imshow('img',img)
        k = cv2.waitKey(0) & 0xff
        if k == 's':
            cv2.imwrite(fname[:6]+'.png', img)
cv2.destroyAllWindows()

结果如下，看到了没，每条坐标轴的长度都是3 个格子的长度。

渲染一个立方体

如果你想绘制一个立方体的话要对draw() 函数进行如下修改，修改后的draw() 函数：

def draw(img, corners, imgpts):
    imgpts = np.int32(imgpts).reshape(-1,2)
    # draw ground floor in green
    img = cv2.drawContours(img, [imgpts[:4]],-1,(0,255,0),-3)
    # draw pillars in blue color
    for i,j in zip(range(4),range(4,8)):
        img = cv2.line(img, tuple(imgpts[i]), tuple(imgpts[j]),(255),3)
    # draw top layer in red color
    img = cv2.drawContours(img, [imgpts[4:]],-1,(0,0,255),3)
return img

修改后的坐标轴点。它们是3D 空间中的一个立方体的8 个角点：

axis = np.float32([[0,0,0], [0,3,0], [3,3,0], [3,0,0],
[0,0,-3],[0,3,-3],[3,3,-3],[3,0,-3] ])

结果如下:

如果你对计算机图形学感兴趣的话，为了增加图像的真实性，你可以使用OpenGL 来渲染更复杂的图形。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1391670.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！