文末提供免费的源代码下载链接
我们将使用 SMILES 数据集来训练我们的卷积神经网络。一旦我们的模型训练完毕,我们将按照与上一个教程中相同的步骤来检测图像和视频中的微笑:
- 我们将使用 Haar 级联来检测图像中的人脸。
- 从图像中提取人脸区域。
- 将面部区域传递给我们的网络进行分类。
- 最后,我们将根据网络的输出,用文本“微笑”或“不微笑”来注释图像。
SMILES 数据集包含 13,165 张 64x64 像素的灰度图像,分为 2 个类别:微笑和不微笑。正好有 9,475 张 “不笑” 面孔的图像和 3,690 张“微笑”面孔的图像。数据集不平衡,这意味着图像分布不均匀。
处理不平衡数据集的常用技术是应用类权重 - 我们将在构建模型时了解如何做到这一点。