一、多实例学习概述
多实例学习(MIL)是一种弱监督学习形式,其中训练实例被排列在称为袋的集合中,并为整个袋提供标签。这种方式越来越受到人们的关注,因为它自然适合各种问题,并允许利用弱标记数据。因此,它被应用于计算机视觉和文档分类等不同的应用领域。
多实例学习(MIL)处理以集合形式排列的训练数据,称为bag。不提供袋子中所含实例的单独标签。这种问题表述引起了研究界的广泛关注,尤其是近年来,解决大型问题所需的数据量呈指数级增长。大量的数据需要越来越多的标签工作,弱监督方法,可以减少这种负担。MIL在许多其他应用领域得到了越来越多的应用,如图像和视频分类、文档分类和声音分类。
MIL是监督学习的一种变体,在很多文章或者论文中,大多是进行病理学应用。该技术涉及将单个类标签分配给输入集合 - 在此上下文中称为实例包。虽然假设包中的每个实例都存在标签,但无法访问这些标签,并且在训练期间它们仍然未知。如果袋子中的所有实例都是负的,则袋子通常标记为负数,如果至少有一个正实例(称为标准 MIL 假设),则标记为正数。下图显示了一个简单的示例,其中我们只知道钥匙串是否包含可以打开给定门的钥匙。这使我们能够推断绿色钥匙可以打开门。
二、多实例学习的应用
MIL在各个领域找到应用程序,在这些领域中,训练数据可以自然地组织到包中。一些例子包括: