B站|公众号:啥都会一点的研究生
颜色检测
从检测颜色到绿幕应用(用自定义视频或背景替换绿色背景),再到简单的照片编辑软件,构建颜色识别器是计算机视觉入门的一个很棒的项目
项目地址:https://github.com/mpatacchiola/deepgaze
目标跟踪
一句话概括目标跟踪就是,根据先前的信息估计场景中存在目标的状态,可以使用一个对象(例如汽车)或多个对象(例如行人、动物等)的视频来构建简单的跟踪模型
实际上,该模型执行两项任务:预测对象的下一个状态并根据对象的真实条件校正该状态
项目地址:https://github.com/JunweiLiang/Object_Detection_Tracking
行人检测
构建物体检测模型来检测行人是最简单(最烂大街)、最便捷的视觉项目之一
只需要一个相关的高质量图像数据集和一个数据训练平台来训练和测试模型,稍微特殊点的场景需要标注,且免费的标注平台也很多
项目地址:https://github.com/kuanhungchen/awesome-tiny-object-detection
手势识别
手势识别是一项稍复杂点的计算机视觉任务,首先将手区域与背景分开,然后分割手指以预测手势
如果想让模型简单,完全可以使用OpenCV,三哥的视频就是常基于OpenCV,训练之后可以使用网络摄像头测试
项目地址:https://github.com/ahmetgunduz/Real-time-GesRec
情绪识别
如果决定完成更具挑战性的任务,可以考虑构建情绪检测模型。 将模型建立在六种主要的面部情绪之上:快乐、悲伤、愤怒、恐惧、厌恶和惊讶
该项目的三个主要组成部分包括图像预处理、特征提取和特征分类
项目地址:https://github.com/atulapra/Emotion-detection
车道线检测
这也是我当年一步步完成的小项目,无论是深度学习方法还是传统方法,就面试来看还会问到这些传统图像算法
车道线检测主要用于自动驾驶,是一个有趣的初学者项目
项目地址:https://github.com/oneshell/road-lane-detection
车牌识别
车牌识别是计算机视觉领域中OCR识别的应用之一,但是该项目存在两个挑战:数据收集和车牌格式因地区而异。
注意:车牌号被认为是敏感数据,因此在构建模型时请确保使用开源数据集。
一个简单的自动车牌识别系统可以使用基本的图像处理技术,比如使用 OpenCV
然而,更进阶一点的使用物体检测器,如深度学习模型YOLO等
项目地址:https://github.com/sergiomsilva/alpr-unconstrained
MNIST手写数字分类
这个项目常常出现在新手教程中,是一个不错的上手项目,使用 MNIST 数据集构建一个简单的数字识别器
当使用卷积神经网络训练模型时,将会在这其中学习如何开发、评估和使用卷积深度学习神经网络进行图像分类
MNIST 数据集包含 60,000 个示例的训练集和 10,000 个示例的测试集:
项目地址:https://github.com/GoogleCloudPlatform/tensorflow-without-a-phd/tree/master/tensorflow-mnist-tutorial
人脸识别
该项目号称世界上最简洁的人脸识别库,操作简单,使用Python和命令行提取、识别、操作人脸
该项目的人脸识别是基于业内领先的C++开源库 dlib中的深度学习模型,用Labeled Faces in the Wild人脸数据集进行测试,有高达99.38%的准确率。但对小孩和亚洲人脸的识别准确率尚待提升。
项目地址:https://github.com/ageitgey/face_recognition
口罩识别
在持续的COVID-19流感中,目前交通工具、人口密集区、住宅区、大型制造商和其他企业需要高效率的口罩检测应用程序以确保安全。 该项目可以与嵌入式系统集成,应用于机场、火车站、办公室、学校和公共场所,以确保遵守公共安全准则。
项目地址:https://github.com/AIZOOTech/FaceMaskDetection
交通灯检测
最后,经典的交通灯检测任务,在智能交通领域得到应用
项目地址:https://github.com/erdos-project/pylot