前言
图像语义分割一直是数据标注中最繁琐、最耗时的标注任务之一,利用钢笔工具手动描边的标注方式所带来的时间成本和低准确率都将影响模型的生产速度和模型性能。整数智能ABAVA数据工程平台最新发布了基于SAM(Segement Anything Model)改进的语义分割标注2.0工具,借助与其他模型的协作和高效的掩码编辑工具,提高数据工程的生产速度,助力AI模型训练研发。
关于SAM的更多干货,可参考整数智能的上期文章:火爆CV圈的SAM是什么?
整数智能如何使用SAM提效标注?
虽然SAM是一款非常优秀的zero-shot图像分割模型,但是如果将SAM直接用于数据标注中作为生产力工具进行使用,仍然存在一些缺陷,需要进一步改进优化。首先,在使用SAM进行图像分割时,目标的分割边界可能不够精细,需要进行后期调整以达到更精准的分割效果。其次,SAM无法很好地调整分割对象的粒度信息,无法满足更丰富的标注需求。最后,"Segment Anything"算法需要较长的时间响应,对于需要高效标注的场景可能存在一定影响。为了更好地满足客户的需求,我们不断探索优化SAM算法的方法,提高ABAVA数据工程平台的标注效率和精度。相较于传统开源工具,我们平台拥有以下诸多优势:
-
完美解决SAM边界缝隙,密集相邻目标分割边界自适应调整,生成像素级贴合目标的标注结果
-
极致的响应速度,SAM底层优化与动态缓存图片序列化机制,缩减模型等待时间至原版的1/3
-
更优秀的显存分配机制,能够处理更大更复杂的图片
-
动态细粒度调整结合动态面积选择,更好地控制标注细节及分割对象的选择
-
支持动态模型加载,平台基于云端动态扩展,实现高并发处理需求
-
支持多种分割结果输出,支持复杂镂空对象导出
-
多种交互选择,支持一键全景分割,点选交互式分割
-
支持多人同时在线利用SAM进行标注,实现多用户分工协作
基于SAM的智能语义分割标注
一键分割,简单高效
SAM可以在无训练的情况下对任何目标进行切分,能够极大的提升语义分割的标注效率。我们针对不同标注场景和标注需求对SAM进行了参数优化,剔除了重叠图层和细小碎片,分割结果更准确,后期编辑更简单。
预标注结果修改标签类型
SAM模型分割的结果不包含标签类型的预识别,在ABAVA平台可以按照标注需求配置对应的标签类型,智能分割之后的标签只需要点击选择对应的标签类型即可完成标注,方便快捷。
掩码编辑工具,轻松编辑
因为SAM模型本身无法产生精确共边的结果,因此对于全景语义分割标注项目,我们自研了一套掩码编辑工具,包含钢笔、画笔、套索等多种标注方式,对边缘位置进行快速的增补、共边等操作,补足了SAM模型的最后一块短板。
基于SAM的智能语义分割标注
在实例分割等场景之下,点选智能标注通过加选减选即可完成标签的绘制,是最高效的标注方式。
关于整数智能
80%的数据 + 20%的算法 = 更好的AI
人工智能的研发是一个非常标准化的流程,它会经历4步,从数据采集->数据标注->模型训练->模型部署。而80%的研发时间,则消耗在了数据采集与数据标注的环节。数据工程的核心在于高效率、高质量的数据标注。
整数智能——AI行业的数据合伙人
整数智能信息技术(杭州)有限责任公司,起源自浙江大学计算机创新技术研究院,致力于成为AI行业的数据合伙人。整数智能也是中国人工智能产业发展联盟、ASAM协会、浙江省人工智能产业技术联盟成员。
整数智能提供了智能数据工程平台(ABAVA Platform)与数据集构建服务(ACE Service)。满足了智能驾驶、AIGC、智慧医疗、智能安防、智慧城市、工业制造、智能语音、公共管理等数十个应用场景的数据需求。目前公司已合作海内外顶级科技公司与科研机构200余家,拥有知识产权数十项,多次参与人工智能领域的标准与白皮书撰写。整数智能也受到《CCTV财经频道》《新锐杭商》《浙江卫视》《苏州卫视》等多家新闻媒体报道。
1.专业级的团队和技术支撑
- 强大的研发团队持续迭代AI数据平台ABAVA Platform,创造极致的AI数据标注效率
- 数据专家为您制定数据集构建方案,满足您对数据集的定制化需求
2.满足全领域多场景的数据标注需求
- 在图像与视频数据方面,支持关键点标注、线标注、框标注、语义分割标注、立体框标注、逐帧标注等标注需求
- 在点云数据方面,支持3D点云框标注、3D点云语义分割、3D点云车道线标注、2/3D融合标注等标注需求
- 在文本数据方面,支持NER命名实体标注、SPO文本三元组标注、内容审核、情绪分析等标注需求
- 在音频数据方面,支持ASR标注、音素标注、MIDI标注等标注需求
3.极致的的数据交付质量
- 整数智能拥有数十家自建数据产业基地和合作产业基地,覆盖10万名人工智能训练师,逐步形成一套科学专业的人员、质量管控及数据安全保障机制
- 依托数据标注方面所积累的经验,平台可达成100万张图像标注量级的峰值。整数智能数据管理平台通过流程与机制的双重保障,为您提供质量更优、响应速度更快的数据服务,助力企业用户实现降本增效
联系我们
希望能够与正在阅读这篇文章的您进一步交流沟通,一起探索AI数据的更多可能性。欢迎联系我们:
电话(微信同号):137-8507-0844
邮箱:zzj@molardata.com
也可以关注我们的账号:整数智能AI研究院