一、简述
人工智能中的基础模型正变得越来越重要。它们被定义为在大量数据上训练的大型人工智能模型,可以适应广泛的任务。
基础模型的早期例子是大型语言模型(LLM),如GPT和BERT。随后,该行业也看到了同样的想法被应用于多模态基础模型,如DALLE、CLIP等。基础模型这个术语开始在NLP领域得到实践并正在进一步加快步伐。
Segment Anything是Meta的一个项目,旨在为图像分割的基础模型构建起点,其野心也可见一斑。
该项目主要包含两个重要组件:
1、用于图像分割的大型数据集
2、分割任何模型 (SAM) 作为图像分割的(可交互)基础模型
这个项目也是从NLP领域获得了灵感,
由于图像分割是计算机视觉的核心任务之一,所以创建者选了庞大的模型和数据集的做为起始。在科学和人工智能中,图像分割有许多用途。
其中包括分析生物医学图像、编辑照片和自动驾驶等。要解决这些问题中的任何一个,您必须训练只能执行一项任务的专用模型。这需要广泛的领域知识,以及特定数据收集所需的时间,更不用说深度学习模型所需的训练时间了。
Segment Anything项目目的就是让图像分割更加通用。
二、Segment Anything 模型
通常深度学习方法需要专门的训练数据收集、