随着人工智能应用的大规模落地,数据标注市场在高速增长的同时,也面临着标注成本的挑战。据IDC报告显示:数据标注在AI应用开发过程中所耗费的时间占到了25%,部分医学类应用一条数据的标注成本甚至高达20元。数据精度的高要求、强人工的依赖、复杂的工具使用逻辑等都是造成标注成本高的核心痛点。
例如,计算机视觉领域的一个重要技术——图像语义分割,可以将图片切割成具有不同语义的色块,从而帮助机器理解整个视觉世界。在自动驾驶领域,车载摄像头采集的图像经过图像分割算法处理后,可以帮助汽车实现避障、寻找可行驶区域等功能。图像语义分割技术对训练数据要求较高,分割准确度通常需达到像素级别,在现实世界中不规则物体边缘的标注效率会更低。
▲ MatrixGo全景语义分割示意图
▲ 澳鹏MatrixGo平台工具箱
标注平台的智能化水平
Intelligence Level of Platform
我们将数据标注平台根据智能化及自动化水平,分为L0到L4的5个阶段。其中,L2(即智能交互)考虑到了“人”在数据标注环节中的交互作用。通过更好的算法介入和交互逻辑引导,使用户能够通过简易操作完成高效标注。
▲ L0到L4的5个智能化阶段
标注人员首先找到期望标注的对象,输入中心点后,模型给出首次识别的效果;对于识别不够精准的部分,标注人员只需通过点击响应的形式,来告知模型预测的不正确区域,即可得到更正后的识别结果,而无需依赖手动画线。
智能交互过程
Process of Intelligent Interaction
通过快速点选需要标注的前景对象,模型会预测出主体轮廓部分;当遇到标注有误需要修改的地方时,通过点选背景位置的反馈,工具会自动进行智能化收边和擦除操作。在模型识别过程中,标注人员通过简单的交互输入,得到更精准的识别效果。依靠简单点选取代稠密的轮廓绘制过程,根据项目实际应用统计,相对纯人工标注可节省约50%的标注时间。
▲ 交互流程示意
通过设计用户交互理解模块,输入用户的一系列交互行为,输出对应的高层特征,来建模用户输入的行为模式,可以有效推断出质量更好的标注结果。同时,辅助使用点击行为采样,根据用户的历史标注行为埋点,来提取有效的数据进行学习。输出上,考虑到不同项目和业务要求,支持一般的矩形框、多边形以及像素图等不同格式输出。
▲ 实现方法示意
在3D识别场景中,我们为快速识别点云中的目标也提供了交互式智能工具。模型能够在标注员圈定的范围内快速进行车道线识别,并将最终结果返回给标注员。
▲3D点云车道线识别
交互式智能标注通过结合算法识别+人工判断,可以极大程度上提升标注效率和准确率。通过AI赋能数据采标的全生命周期,提升数据生产的效率,充分给予AI应用开发以数据养料,从而为更多场景AI应用的大规模落地提供有力支持。