ImageNet 是一个非常著名的大型图像识别数据集,
数据集基本信息
内容 | 说明 |
---|---|
📸 图像数量 | 超过 1400万张图片(包含各类子集) |
🏷️ 类别数量 | 常用的是 ImageNet-1K(1000类) |
🧑🏫 标注方式 | 每张图像都有一个清晰的“物体”类别(比如:狗、猫、飞机、键盘等) |
🧠 来源 | 图像多数来源于 Flickr、搜索引擎,并由人工标注 |
🧪 用途 | 图像分类、目标检测、图像检索等 |
ImageNet-1K
子集 | 数量 | 说明 |
---|---|---|
训练集(train) | 128万张图像 | 每类约1300张 |
验证集(val) | 5万张 | 每类50张左右 |
测试集(test) | 不公开标签 | 用于比赛和排行榜 |
每张图像都属于 1000 个预定义类之一,比如:
"golden retriever", "zebra", "airplane", "pencil sharpener", "cucumber", ...