嵌入式微控制器架构为AI演进

news2025/1/14 1:15:57

如果您将IoT与AI相结合会得到什么?AIoT是简单的答案,但由于神经网络技术的进步,使机器学习不再局限于超级计算机的世界,因此您还将获得嵌入式微控制器的巨大新应用领域。如今,智能手机应用处理器可以(并且确实)执行AI推理以用于图像处理,推荐引擎和其他复杂功能。

未来几年,数十亿物联网设备的生态系统将获得机器学习功能

将这种功能带给不起眼的嵌入式微控制器代表了巨大的机会。想象一下一个助听器,它可以使用AI过滤掉对话中的背景噪音,可以识别用户面部并切换到其个性化设置的智能家电,以及支持AI的传感器节点,该节点可以使用最少的电池运行数年。在端点处处理数据具有不容忽视的延迟,安全性和隐私优势。

然而,利用微控制器级设备实现有意义的机器学习并非易事。例如,作为AI计算的关键标准的内存通常受到严格限制。但是数据科学正在迅速发展以减小模型尺寸,并且设备和IP供应商正在通过开发工具并结合针对现代机器学习需求量身定制的功能来做出响应。

TinyML起飞

作为该行业快速增长的标志,TinyML峰会(本月初在硅谷举行的新行业盛会)正日趋强大。根据组织者的说法,去年举行的第一届峰会有11家赞助公司,而今年的活动有27家赞助商,售空时间更早。组织者还表示,其全球设计师每月聚会的会员人数急剧增加。

高通公司Evgeni Gousev的TinyML委员会联席主席说:“我们看到一个由TinyML技术支持的数万亿智能设备组成的新世界,这些设备可以共同感知,分析和自主行动,为所有人创造一个更健康,更可持续的环境。”展会开幕词。

Gousev将这一增长归功于更节能的硬件和算法以及更成熟的软件工具的开发。他指出,企业和风险投资的投资正在增加,启动和并购活动也在增加。

今天,TinyML委员会认为该技术已经过验证,并且在微控制器中使用机器学习的初始产品应在2-3年内推向市场。“杀手级应用程序”被认为需要3-5年。

去年春天,谷歌首次展示了针对微控制器的TensorFlow框架版本,这是技术验证的重要部分。TensorFlow Lite for Microcontroller设计为仅在千字节内存上运行的设备(Arm Cortex M3上的核心运行时大小为16 KB,并且有足够的运算符来运行语音关键字检测模型,总共需要22 KB)。它仅支持推理(不支持训练)。

大玩家

大型微控制器制造商当然会感兴趣地关注TinyML社区的发展。随着研究使神经网络模型变得越来越小,它们的机会也越来越大。

大多数都对机器学习应用程序提供某种支持。例如,意法半导体(STMicroelectronics)拥有一个扩展包STM32Cube.AI,它可以在基于Arm Cortex-M的STM32系列微控制器上映射和运行神经网络。

e-AI开发环境,该环境允许在微控制器上实现AI推理。它有效地将模型转换为可在其e 2 Studio中使用的形式,与C / C ++项目兼容。

恩智浦表示,已有客户将其低端Kinetis和LPC MCU用于机器学习应用程序。该公司正在将AI与硬件和软件解决方案结合起来,尽管它主要围绕其更大的应用处理器和交叉处理器(在应用处理器和微控制器之间)进行。

强力武装

微控制器领域中大多数已建立的公司都有一个共同点:Arm。嵌入式处理器内核巨头凭借其Cortex-M系列统治了微控制器市场。该公司最近宣布了全新的Cortex-M55内核,该内核是专门为机器学习应用而设计的,尤其是与Ethos-U55 AI加速器结合使用时。两者都是为资源受限的环境而设计的。

串联使用时,Arm的Cortex-M55和Ethos-U55具有足够的处理能力,可用于手势识别,生物识别和语音识别等应用

但是,初创公司和较小的公司如何寻求与该市场中的大型企业竞争?

“不是通过构建基于Arm的SoC!因为他们确实做得很好,” XMOS首席执行官Mark Lippett笑着说。“与这些人竞争的唯一方法是拥有架构优势……(这意味着)Xcore在性能和灵活性方面的内在能力。”

尽管XMOS的Xcore.ai(其新发布的用于语音接口的分频处理器)不会直接与微控制器竞争,但这种观点仍然成立。任何制造基于ARM的SoC以便与大型公司竞争的公司都可以在秘密秘诀中找到一些特别之处。

标度电压和频率

初创公司Eta Compute在TinyML展会上发布了备受期待的超低功耗设备。它可用于永远在线图像处理和传感器融合应用中的机器学习,其功率预算为100µW。该芯片使用Arm Cortex-M3内核和NXP DSP内核-一个或两个内核均可用于ML工作负载。该公司的秘制调味料具有多种成分,但关键是在两个核心上连续缩放时钟频率和电压的方式。这样可以节省大量功率,尤其是在没有PLL(锁相环)的情况下。

Eta Compute的ECM3532使用Arm Cortex-M3内核以及NXP CoolFlux DSP内核。机器学习工作负载可以通过其中一种或两种来处理

现在有足够的竞争对手与Arm竞争,包括RISC-V基金会提供的最新指令集架构,为什么Eta Compute选择使用Arm内核来实现超低功耗机器学习加速?

Tewksbury告诉EETimes: “简单的答案是Arm的生态系统已经发展得非常好。” “使用Arm进行生产比现在使用RISC-V容易得多。这种情况将来可能会改变。RISC-V具有自己的优点。当然,这对中国市场有利,但我们现在主要针对的是[我们的设备]生态系统,着眼于国内外市场。”

Tewksbury指出,AIoT面临的主要挑战是应用程序的广度和多样性。市场相当分散,许多相对利基的应用程序只占很小的数量。但是,该领域总共可能扩展到数十亿个设备。

“对于开发人员而言,挑战是他们无法负担时间和金钱来为每种用例开发定制解决方案,” Tewksbury说。“在那里,灵活性和易用性变得至关重要。这就是我们选择Arm的另一个原因-因为那里有生态系统,工具也在那里,而且客户无需大量定制即可轻松快速开发产品并将其快速推向市场。”

在将其ISA锁定了数十年之后,ARM终于在去年10月宣布它将允许客户构建自己的自定义指令,以处理诸如机器学习之类的专业工作负载。在右手方面,此功能还可能提供进一步降低功耗的机会。

Eta Compute暂时不能利用此功能,因为它不适用于现有的Arm内核,因此不适用于Eta正在使用的M3内核。但是,Tewksbury能否在下一代产品中看到使用Arm自定义指令的Eta Compute,以进一步降低功耗?

“绝对是的,”他说。

替代ISA

RISC-V今年已经引起了很多关注。开源ISA允许处理器设计而无需支付许可费用,而基于RISC-V ISA的设计可以像使用任何其他类型的IP一样受到保护。设计人员可以选择要添加的扩展,也可以添加自己的自定义扩展。

法国初创公司GreenWaves是使用RISC-V内核瞄准超低功耗机器学习领域的多家公司之一。其设备GAP8和GAP9分别使用8核和9核计算集群。

GreenWaves的GAP9超低功耗AI芯片的架构现在使用10个RISC-V内核

GreenWaves业务开发副总裁Martin Croome向EETimes解释了为什么该公司使用RISC-V内核。

Croome说:“第一个原因是RISC-V使我们能够在指令集级别上自定义内核,而这是我们经常使用的功能。”他解释说,自定义扩展用于减少机器学习和信号处理工作量的能力。 。“当公司成立时,如果您想使用任何其他处理器架构来做到这一点,那将是不可能的,或者将使您损失一笔巨款。而且,要花掉的财富本质上就是投资者将钱花给了另一家公司,这很难证明。”

与未经修改的RISC-V内核相比,仅GreenWaves的定制扩展就可以使其内核的能耗降低3.6倍。但是克鲁姆还说,RISC-V只是因为是新产品,所以具有根本的技术优势。

“这是一个非常干净,现代的指令集。它没有任何行李。因此,从实现的角度来看,RISC-V内核实际上是一个更简单的结构,而简单意味着更少的功耗。”

克鲁姆还提到控制是一个重要因素。GAP8设备在其计算群集中具有8个内核,GreenWaves需要对内核执行进行非常精细的详细控制,以实现最大的电源效率。他说,RISC-V支持这一点。

他开玩笑说:“最后,如果我们可以用Arm完成所有这些工作,那么我们将用Arm完成所有这些工作,那将是一个更加合乎逻辑的选择……因为没人会因为购买Arm而被解雇,”他开玩笑说。 。“软件工具的成熟度远远高于RISC-V……但是,说到现在,人们对RISC-V的关注度很高,以至于这些工具的成熟度正在迅速提高。”

总而言之,尽管有些人认为Arm在微处理器市场上的控制力正在减弱,部分原因是RISC-V的竞争加剧,但该公司正在通过允许一些定制的扩展并从一开始就开发用于机器学习的新内核来做出回应。

实际上,针对超低功率机器学习应用的Arm和non-Arm设备都已上市。随着TinyML社区继续致力于减少神经网络模型的大小并开发专用的框架和工具,该领域将发展成为一个健康的应用领域,它将支持各种不同的设备类型。

嵌入式物联网需要学的东西真的非常多,千万不要学错了路线和内容,导致工资要不上去!

分享大家一个资料包,差不多150多G。里面学习内容、面经、项目都比较新也比较全!(点击找小助理领取)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/875477.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

UML 类图的画法

1.类图的画法 类 整体是个矩形,第一层类名,第二层属性,第三层方法。 :public- : private# : protected空格: 默认的default 对应的类写法。 public class Student {public String name;public Integer age;protected I…

kubernetes集群(k8s)之安装部署Calico 网络

目录 安装部署Calico 网络 (一)环境准备 (二)部署docker环境 (三)部署kubernetes集群 (四)部署Calico网络插件 安装部署Calico 网络 (一)环境准备 IP地…

混淆矩阵、F1score详解

混淆矩阵(Confusion Matrix) TP(True Positives):真正例,预测为正例而且实际上也是正例; FP(False Positives):假正例,预测为正例然而实际上却是负例; FN&…

九五从零开始的运维之路(其三十一)

文章目录 前言一、什么是计划任务1.一次性任务2.周期性任务(一)在/etc/crontab文件中写入计划任务(二)使用crontab命令编辑计划任务 二、用户提权1.什么是用户提权2.su与su -3.sudo提权 总结 前言 本篇将简述的内容:L…

1+X 综合布线系统安装与维护职业技能等级证书实训室建设方案

一、1X 综合布线系统安装与维护职业技能等级证书建设方案系统概述 "1X 综合布线系统安装与维护职业技能等级证书系统"是中国职业教育改革的一项举措,旨在为综合布线系统安装与维护领域的从业人员提供职业技能评价和认证的体系。 该证书系统采用了"…

浪涌保护器中SPD防雷模块的主要应用方案

浪涌保护器(Surge Protective Device,SPD)是一种用于限制瞬态过电压和导引泄放电涌电流的非线性防护器件,用以保护耐压水平低的电器或电子系统免遭雷击及雷击电磁脉冲或操作过电压的损害。SPD可以将过电压泄放到地线或限制过电压到…

如何高效地进行事件降噪

在事件处理方面,一般我们会遇到两个痛点,一个是告警事件太多,被过度打扰,另一个是重要告警疏漏,无法闭环处理。 告警太多的常见原因 最常见的原因,是告警规则设置得不合理。比如很多规则触发了告警之后&a…

5.内置构造函数

在JavaScript中最主要的数据类型有6种: 1.基本数据类型: 字符串、数值、布尔、undefined、 null 2.引用类型:对象 但是,我们会发现有些特殊情况: //普通字符串 const str andy console.1og(str.length) // 4其实字符串、数值、布尔、等基本类型也都有…

【MySQL--->表的操作】

文章目录 [TOC](文章目录) 一、创建表二、查看表三、修改表四、删除表drop table 表名; ![在这里插入图片描述](https://img-blog.csdnimg.cn/15227b8335364d41bd01b4b4dd83ee55.png) 一、创建表 语句格式:create table 表名(列名 类型,…)字符集 校验规则 存储引擎;字符集和校…

一盏茶的时间,带你轻松上手Pinia

🎬 岸边的风:个人主页 🔥 个人专栏 :《 VUE 》 《 javaScript 》 ⛺️ 生活的理想,就是为了理想的生活 ! 目录 📚 前言 📘 创建 Pinia 📘 Option Store 📘 Pinia 提供多种选项配…

JavaEE——网络编程(UDP套接字编程)

文章目录 一、简单理解Socket 套接字二、UDP 数据报套接字编程三、编写简单的 UDP 版本服务器客户端1. 编写 UDP 版本的回显服务器回显服务器整体代码罗列 2. 编写 UDP 版本的回显客户端回显客户端整体代码罗列 四、总结与代码运行结果解释 一、简单理解Socket 套接字 概念&am…

实践-传统深度学习

简介与安装 2 训练自己的数据集整体流程3 数据加载与预处理4 搭建网络模型5 学习率对结果的影响6 Drop-out操作7 权重初始化方法对比8 初始化标准差对结果的影响9 正则化对结果的影响10 加载模型进行测试 TensorFlow:每一步都需要自己做。 Keras:做起来更…

Redis_缓存2_缓存删除和淘汰策略

14.5 缓存数据的删除和替换 14.5.1 过期数据 可以使用ttl查看key的状态。已过期的数据,redis并未马上删除。优先去执行读写数据操作,删除操作延后执行。 14.5.2 删除策略 redis中每一个value对应一个内存地址,在expires,一个内…

关于海外应用ASO优化的一些热知识

应用程序市场挤满了人,我们不能依靠运气来帮助应用程序在全球应用市场上被发现,其中大约有 500 万个应用程序争夺相同的客户。ASO是应用营销活动的重要组成部分,其目的是提高应用程序在Google Play Store和Apple App Store中的可见度。 1、为…

怎么截取视频制成GIF?教你简单的GIF制作方法

怎么将一段视频截取片段制作成GIF动图呢?很多小伙伴在看到一段视频中的搞笑片段,想要将其制作成GIF表情包来在社交平台上发送、交流,那样会非常有趣,GIF动图能够很好的表达我们的情绪,因此该怎么制作呢?教大…

安利5个:在线帮助文档协同与团队知识库管理工具!

在线帮助文档协同与团队知识库管理工具是帮助团队共享和管理知识的重要工具。下面是我推荐的五个工具,并对它们的优点和缺点进行了简要描述。其中,我特别推荐Baklib这个工具。 Confluence: 优点:Confluence是Atlassian公司的产品&#xff0…

OLED透明屏批发:解读未来显示技术的创新与机遇

在数字化时代,OLED透明屏作为一种创新的显示技术,吸引了广泛的关注和应用。本文将深入探讨OLED透明屏的优势和应用领域,分析其在批发市场中的需求和机遇。 一、OLED透明屏的优势和应用领域 OLED透明屏的定义和原理: OLED透明屏采…

KU Leuven TU Berlin 推出“RobBERT”,一款荷兰索塔 BERT

荷兰语是大约24万人的第一语言,也是近5万人的第二语言,是继英语和德语之后第三大日耳曼语言。来自比利时鲁汶大学和柏林工业大学的一组研究人员最近推出了基于荷兰RoBERTa的语言模型RobBERT。 谷歌的BERT(来自Transformers的B idirectional …

搞什么副业可以月入过万?

现在的社会发展非常快,因此出现了许多非常有用而充满娱乐性的兼职职位。这些兼职职位可以让你放松自己的身心,同时还能获得高额报酬。下面兼职网将提供一些正规的兼职职位,可以助你月入数万。 第一种:网络直播主播 网络直播现在非…

redis — 基于Spring Boot实现redis延迟队列

1. 业务场景 延时队列场景在我们日常业务开发中经常遇到,它是一种特殊类型的消息队列,它允许把消息发送到队列中,但不立即投递给消费者,而是在一定时间后再将消息投递给消费者。延迟队列的常见使用场景有以下几种: 在…