第3章.中央服务器的物联网模式
本章列出了由于存储和/或计算需求而部署在中央服务器上以及部署在边缘(本地)或云上的体系结构模式。
这些模式基于现场设备生成的数据提供见解,使用附加数据(来自附加系统,如企业系统)分析和丰富现有数据。 这些模式有助于提取见解,并使某些操作自动化(例如,如果土壤湿度超过定义的阈值,则打开灌溉泵)。
简单的决策(如果X,那么做Y)可以构建到业务逻辑中,但通常,任何复杂的决策都需要评估多个输入参数和某些先验经验,而这正是人工智能(AI)和机器学习(ML)发挥重要作用的地方。本章详细介绍了如何对从现场设备获得的数据进行预处理,以实现数据驱动决策。 在本章中,我们将介绍以下模式:
- AI/ML集成
- 规则引擎
- 文件上传
- 企业系统集成
AI/ML集成
在物联网解决方案中,AI/ML技术使机器和现场设备能够模拟智能行为,并帮助在几乎没有人类参与的情况下做出明智的决策。我们将在本书中用于AI/ML集成的符号如下:
图3.1——AI/ML集成模式的符号
AI/ML为每个物联网设备提供了独特的个性或身份,帮助我们理解整体环境,并使其能够代表最终用户行事。换言之,为现场生成的见解(来自传感器的数据)和命令(到致动器)提供了另一层抽象,如下图所示:
图3.2——AI/ML作为物联网系统和最终用户之间的抽象层
该模式有多个应用场景,如下所示: 清理脏数据(如不正确、断章取义)和插值/外推丢失的数据。 理解传感器积累的大量数据,消除误报。考虑到物联网运行的典型规模,对每个设备进行手动和单独监控是不现实的。 同时考虑实时数据流和历史数据,生成建议/可操作的见解。 测量传感器/执行器的校准漂移,并自动进行相关校正。
确定执行分析(或评估规则/决策)的最佳位置,无论是在边缘还是在中央服务器,平衡紧急性、复杂性、容量、延迟和电池/电源状态等因素。 从积累的数据中产生有意义的见解,而不是进行简单的数据报告。
例如,从供应商Xin而不是供应商Y处采购原材料将有助于提高工厂的整体设备效率(OEE),详见第7章。 预测性能瓶颈和操作故障,同时消除/最大限度地减少误报。 启用用例,如边缘的对象检测以及中央服务器中安全威胁的监控和补救。 自动检测安全威胁,如分布式拒绝服务(DDoS)及其补救措施。 前面的点可以通过使用简单的基于规则的算法来处理(例如,如果事件或数据为X,则为Y)。
然而,AI/ML的集成增强了分析的广度和深度,前者指的是分析的范围,后者指的是系统设计过程中未考虑的场景或事件。 由于所涉及的计算复杂性高,AI/ML模型创建通常在中央服务器中完成,然后部署在边缘或现场设备上。连续分析从边缘或该现场设备接收的数据,以进一步提高模型的准确性。借助下图可以更好地理解模型精化的这种良性循环:
图3.3——基于从现场设备收到的数据/反馈,对AI/ML模型进行持续改进
下图总结了物联网环境中相关的不同类型的AI/ML技术:
图3.4——物联网背景下相关的AI/ML技术
AI/ML的给定变体都具有不同的计算能力要求。因此,并非所有的变体都可以在物联网基础设施上运行。下图显示了在典型的物联网部署中如何部署AI/ML变体:
图3.5-不同AI/ML变体的典型物联网部署
有多种AI/ML方法可用于满足不同的需求。然而,特别是一个ML深度学习技术家族(零样本学习和少热点学习)特别适合物联网部署。这些深度学习技术不需要用于训练(或模型创建)的大型数据集,而是依赖于启发式或元数据来做出决策。零样本学习表明,这项技术不需要任何预先的数据集(也就是说,没有训练数据)就可以做出决定(例如,为了识别特定的图像,不需要提供一组图像;对感兴趣对象的样子进行解释就足够了)。
类似地,很少有镜头学习表明,该技术需要最少的数据集(数据集数量通常在1到5个之间),并且主要由启发式或相似性数据来补充才能得出结论。 乍一看,零样本学习和少搜索学习似乎不切实际,因为通常需要提供大量数据集来生成任何实际的ML模型。然而,零样本学习和少速学习模仿了人类大脑在物理世界中学习概念的方式。
狗是一种四条腿的动物,其头骨和脚比典型的狼小——然而,如果给孩子喂食,它的眼睛比狼大,可以帮助他们识别狗,前提是他们对狼的长相有一定的了解。没有必要给孩子大量不同狗的图像,让他们识别狗。零样本学习和少速学习在类似的水平上工作。 零样本学习和少热点学习在物联网中具有相关性,因为现场设备和设备网关通常从计算和存储的角度受到限制。因此,存储和使用大量数据集进行训练和后续模型部署是不切实际的。
少镜头学习的另一个例子是期望现场设备识别图像中的数字(0到9)的情况。在这里,传统的ML将涉及输入数字或将数字写入模型的所有变体——样本很容易达到数千个,甚至数百万个,这使得在边缘或现场设备上执行模型变得不切实际。然而,利用相对相似性可以消除对如此大的数据集的需求。在数字识别的情况下,为边缘或现场设备提供启发式或经验信息就足够了,例如数字3大约是数字8的一半和数字5的三分之一,以识别数字。 可以使用零样本学习和少热点学习的一些物联网场景如下:
- 场景识别
- 边缘分析
- 物体识别
- 自然语言处理
- 影像分析
现在让我们来看一下模式摘要。
模式摘要
让我们来看看AI/ML集成的模式摘要: 解决的问题: 商业 边缘或中央服务器的决策自动化 在规划中使用数据并提高运营效率 减少和消除停机时间 实现大规模定制和个性化 创建独立于个人的推荐系统 需要不断完善模型 技术的 实现数字孪生和数字线程 使用正确的数据模型为AI/ML工程师提供数据服务 物联网数据流处理中的模式验证 数据模型在物联网边缘设备上的应用 受约束的现场设备或边缘网关的模型创建和部署 需要在边缘提供可操作的见解 示例使用场景: 从工厂操作中的资产捕获标签(数据点) 根据资产的行为将命令发送回设备 为数据科学团队提供分析模型 模式原理: 在中央服务器(具有相对较高的计算和存储要求)中创建或完善AI/ML模型,并将其部署到边缘(具有受限的计算、功率和存储能力),以进行本地决策和及时行动 周期性/基于事件的边缘模型部署,导致AI/ML模型不断成熟 相关模式: 数字孪生 假设: 由于数据的体积、速度和准确性等原因,人工分析物联网生成的数据是不可行的 用于模型训练和创建的数据的可用性(除了前面章节中描述的零样本学习和少速学习技术的情况) 注意事项: 用于存储实时遥测信息的时间序列数据库 物联网代理,用于将数据从传感器传输到网关,再传输到中央服务器 使用内存中的缓存为紧急数据查询提供服务 支持未来可扩展性需求的基于微服务的体系结构 定制模型以补偿边缘设备的计算和存储限制(通常通过降低模型精度和/或速度),如零样本学习和少速学习技术 计划模型部署(和回滚)的能力,尤其是在大量现场或边缘设备的情况下 反模式场景: 粗鲁的决策(如果这样,那么就那样做) 有限的输入或原始数据 批量或离线数据分析