一、计算机视觉中的测距任务
测距是计算机视觉中的一项关键任务,涉及测量物体和相机之间的距离。这些信息可用于多种应用,包括机器人、自动驾驶汽车和增强现实。测距技术有很多种,包括主动式和被动式,每种技术都有自己的优点和局限性。主动测距技术,例如飞行时间、结构光和激光三角测量,涉及将图案投影到物体上并测量图案返回相机所需的时间。被动测距技术,例如立体视觉、光度立体和阴影形状,依赖于使用从不同视点拍摄的多个图像来计算深度。
主动测距技术包括将图案投影到物体上,并测量图案返回相机所需的时间。
一种流行的主动测距技术是飞行时间(ToF),它包括发射光脉冲并测量脉冲返回相机所需的时间。结构光(Structured light)是另一种活跃的技术,包括将一系列图案投影到对象上,并使用图案的变形来推断深度。激光三角测量(Laser triangulation)是另一种活跃的技术,包括将激光线投影到物体上,并测量反射线与相机平面相交的角度。
另一方面,被动测距技术依赖于使用从不同视点拍摄的多幅图像来计算深度。
一种流行的被动技术是立体视觉(stereo vision),它涉及到使用两个或多个相机从不同的视点捕捉同一场景的图像。然后通过分析图像中对应点的位移来计算深度。光度学立体(Photometric stereo)是另一种被动技术,涉及在不同的照明条件下捕捉对象