在这篇文章中,我们将学习如何使用预训练的 ImageNet 模型来执行图像分类。我们已经看到了如何训练一个简单的神经网络来对 CIFAR-10 数据集中的图像进行分类,但这是一个相对简单的任务,因为只有十个类别。另一方面,对大量对象类型进行分类将需要包含数百万个参数的更大网络。然而,由于 ImageNet 项目,Keras 中提供了预训练模型,这些模型经过训练可以检测来自 1,000 个不同类别的对象。只需几行代码,我们就可以学习如何使用这些开箱即用的预训练模型来执行图像分类,而无需训练。
ImageNet 和 ILSVRC
ImageNet 项目是一个用于视觉对象识别软件研究的大型视觉数据库。这个项目的想法是由 AI 研究员李飞飞在 15 多年前构思出来的。ImageNet 团队在 2009 年首次展示了他们的数据集。