今天分享的是AI系列深度研究报告:《AI和人工智能与机器学习全景报告》。
(报告出品方:appen)
报告共计:30页
获取
数据获取仍是AI应用构建团队的主要瓶颈。
原因各不相同。例如,特定用例的数据可能不足,新的机器学习技术需要更多的数据,或者并未建立轻松高效获取所需数据的适当流程。
受访者对AI生命周期数据管理的看法有着强烈的共识,即企业领导者了解AI生命周期数据管理的价值 (90%同意),AI生命周期数据管理正在改变本企业的的经营方式 (87%同意)。决策者在AI生命周期四个阶段会平均分配数据管理时间。7成 (71%) 的受访者表示本企业在AI生命周期的许多阶段都很纠结。
尽管大多数受访者(88%)认为本企业拥有AI各阶段数据管理的必要内部资源,但只有42%的技 术专家认为,AI生命周期的数据获取阶段很有挑战性。不过,认为数据获取很有挑战性的企业 领导者并不太多(24%)。这表明,在对AI生命周期数据管理最大瓶颈的认识方面,技术专家和企业领导者之间仍然存在分歧。这就导致企业内的优先事项与预算的错位。
要使AI解决方案正常运行,就需要大量高质量数据来训练底层神经网络。多语言自然语言处理 (NLP) 便是个很好的示例。NLP依赖于数百万人的语音输入,并以ML(机器学习) 模型可以接受的格式准备和输入。
虽然我们调查的受访者中有五分之四表示他们拥有支持AI项目所需的适当数据量(81%) ,并且可以使用完成AI相关工作所需的工具 (90%),但他们中的大多数人仍在为低劣的数据质量而苦恼。依靠如此数据生成的系统往往性能不佳。当在NLP中集成多模态,或连接支持多种语言和内容类型的多个独立NLP解决方案时,数据质量问题就成为一个更大的挑战。
质量
世界日新月异,随着越来越多的智能设备、多屏幕的使用和收集信息的新数字工具的出现,全球数字足迹产生的数据量迅猛增长准确地构建和标注数据比以往任何时候都更加重要。
51%的受访者认为,数据准确性对其AI用例至关重要,46%的受访者认为,虽然这点很重要,但也可以变通。但只有20%的受访者认为,数据准确率高于80%,而认为数据准确率超过90%的受访者只有6%。
在AI生命周期开始阶段就使用正确的数据,将使后续阶段获得更好的结果。用于管理和准备数据的平均时间比例呈下降趋势,今年的平均占时间为47.4%,而2021年这一数字为53%。由于大多数受访者都使用外部数据提供商,因此可以推断,通过外包数据获取和准备工作,企业的数据科学家正在节省时间,并正确管理、清理和标注数据。
平均而言,管理和准备数据的平 均时间比例呈下降趋势今年这一 数字为47.4%,而 2021年为53%。
AI计划的最大障碍是数据管理。
AI计划的最大障碍是数据管理,41%的受访者表示,数据管理是最大的瓶颈。紧随其后的是,39%的受 访者表示,缺乏合格的人才——数据科学家和技术专家、数据架构师和工程师稀缺。31%的受访者表 示,缺乏足够的人员编制预算,增加了数据管理团队人员配备的挑战。合格数据科学家和技术专家的 短缺凸显了确保关键人才专注从事需要其宝贵技能的工作的重要性。为了解决这一问题,企业希望利 用外部数据提供商减少本企业在数据获取等领域的工作量,为数据科学家省出时间从事其他AI项目。
评估
机器学习模型需要持续监控和调整,以确保输出准确、相关的信息。
虽然部署后的模型基本上是自主的,但模型验证和再训练却需要人机协同。受访者对人机协同的重要性有着强烈的共识。81%的受访者认为,它非常重要或极其重要,97%的受访者认为,人机协同评估对于AI模型的准确性很重要。
AI生命周期是个持续的过程,需要不断地获取、准备和评估新的数据输入和模型输出。因此,有很多企业使用外部数据提供商 (88%) ,从我们衡量的需要持续更新模型的数据点中也可见一斑。去年,有86%的企业至少每季度更新一次模型,今年这一数字已增加到91%。
随着数据的及时更新,接下来就需要与外部数据提供商合作,找到合适的合作伙伴非常重要。92%的受访者认为,使用合适的数据合作伙伴对于成功的模型部署和验证至关重要,大多数受访者(83%)希望能够使用一个合作伙伴为AI生命周期的所有阶段提供支持。持续验证模型性能很重要,它对成功的模型输出至关重要。
携手具有技术和专业能力的合适合作伙伴对于获得高质量的结果至关重要。在AI生命周期各阶段, 技术和专业能力对于获得高质量的结果都很重要,93%的受访者对此表示同意,51%的受访者表示强烈同意。
人工模型评估在很大程度上分配的预算最少,40%的受访者表示,他们给AI生命周期的最 后阶段分配的预算最少。预算分配与人机协同的重要性之间存在差距。模型评估对于确保AI模型的准确性以及减少数据 量需求至关重要。预先对人机协同投入更多预算,企业将节约资金和时间,降低未来重新评估的可能性。
采用
2022年,AI的采用将继续实现增长,带来效益与应用,这源于企业创新以及提高效率和生产力的强烈愿望。
随着AI使用的日益普及,改善A的工具和最佳实践也变得越来越先进。
在疫情期间竞相推出AI之后,人们对企业AI先进水平的看法可能正在转变。我们的数据显示,认为本企业在业内领先的受访者有所下降 (对于美国市场,2021为66%,2022年为55%),这可能是由于疫情期间AI使用的大量涌现和各行各业AI用例的大量增加。虽然很少有受访者认为本企业在AI采用方面落后,但认为本企业领先的企业领导者(49%) 及和同行不相上下的企业领导者(49%) 数量不分伯仲。
与欧洲企业相比,美国企业更有可能表示其在采用AI方面领先于同行 (分别为44%和55%) 。