以下内容,皆为原创,制作实属不易,多谢帅锅和镁铝观看和关注。
一.什么是计算机视觉
计算机视觉是人工智能的一个分支,它使计算机能够从图像或多维数据中解释和理解视觉信息。计算机视觉的目标是模拟人类视觉系统的能力,使机器能够识别、定位、测量和解释图像中的物体和事件。主要就是应用于图像处理方面。
计算机视觉的关键领域包括:
-
图像识别:识别图像中的物体或场景,如识别照片中的猫、狗或树木。
-
物体检测:在图像中定位并识别特定的物体,通常以矩形框的形式标出。
-
图像分割:将图像分割成多个区域或对象,以便单独分析每个部分。
-
图像分类:将图像分为不同的类别,例如将图像分类为风景、肖像或城市景观。
-
特征提取:从图像中提取关键信息,如边缘、角点或纹理,这些信息对于后续的图像分析至关重要。
-
场景重建:从图像中恢复三维场景,通常用于机器人导航或增强现实。
-
运动估计:分析图像序列中的运动,例如在视频监控中跟踪物体的运动。
-
面部识别:识别图像或视频中的人脸,常用于安全系统或社交媒体应用。
-
医学图像分析:在医学领域,计算机视觉用于分析X光片、CT扫描和MRI图像,以辅助诊断。
-
自动驾驶汽车:在自动驾驶技术中,计算机视觉用于识别道路标志、行人、其他车辆等,以确保安全驾驶。
计算机视觉通常依赖于机器学习和深度学习技术,特别是卷积神经网络(CNN),这些技术能够处理和分析大量的视觉数据,并从中学习模式和特征。随着技术的发展,计算机视觉在各个领域都有广泛的应用,从智能手机的相机应用到复杂的工业自动化系统。
二.搭建虚拟环境
1.下载Python Welcome to Python.org
在登录官网后,会有一个All releases,你可以在所有发行版本里选择适合自己的。
我使用的是Python3.11,已经后面程序都可以运行。
2. 下载虚拟环境包
pip install virtualenv
3.创建虚拟文件夹name(名字自己自定义)
virtualenv name
大概就是这个样子,进入scripts,并在上面的路径按下cmd,进入命令行
4.下载必要的库和依赖库
可以看到后面三个都能安装的很快。
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python numpy pandas
下载后,我们下载的是opencv,但是导入的时候是cv2。可以看到都没报错。
三.激活环境并进入notebook
接下来,ipython我们退出就行,用exit。但是下面是错误的示范,因为我们创建的是虚拟环境,所以我们要先激活,然后再jupyter notebook。
四.实操代码
这是一个弹出窗口和按下相应的按钮销毁窗口的程序。
import cv2
import matplotlib.pyplot as plt
import numpy as np
# 创建窗口
# cv2.WINDOW_AUTOSIZE不允许修改窗口大小
cv2.namedWindow('window', cv2.WINDOW_NORMAL)
# 更改窗口大小
cv2.resizeWindow('window', 800, 600)
# 展示名字为window的窗口
cv2.imshow('window', 0)
# 等待按键
# waitKey会返回按键的ascii码
# 0表示接收任意按键,如果给整数,表示等待按键的时间ms毫秒
# cv2.waitKey(5000)
# 可以利用waitKey销毁窗口
# key是int型,最少是16位,但是ascii码是8位
key = cv2.waitKey(0)
if key & 0xFF == ord('q'):
print("准备销毁窗口")
cv2.destroyAllWindows()
会弹出一个黑色窗口,因为我们没有设置颜色或者是传入图片。然后我们得用鼠标点一下窗口,按下q的按钮,即可销毁窗口了。
五.感谢观看
感谢大家的观看,祝愿大家在自己热爱的路上,勇敢前行。