抢跑智驾AI芯片「新路径」

news2024/9/20 7:59:59

“胆量”这个词,被后摩智能创始人兼CEO吴强着重提及。

5月10日,后摩智能发布首款存算一体智驾芯片鸿途™H30,以12nm制程实现最高物理算力 256TOPS,典型功耗 35W,成为国内率先落地存算一体大算力 AI 芯片的公司。即,能效比大幅拉升至7.3TOPS/W,根据高工智能汽车之前系统梳理,业内智驾大算力芯片采用冯诺依曼架构,能效比多在2-4TOPS/W。

事实上,自1945年6月,冯·诺依曼写出那份著名的长达101页的文档《First Draft of a Report on the EDVAC》,详细阐述“存储程序计算机(Stored-program Computer)”,不久后第一台冯·诺依曼架构计算机诞生,截至目前70多年间,主流的计算范式始终遵循这一架构。

根据资深芯片专家陈巍博士、耿云川博士此前文章阐述,冯式架构以计算为核心,计算与存储分离,两者配合完成数据的存取和计算,处理器以提升计算速度为主,存储注重容量提升和成本优化。但在过去20年,处理器性能以每年大约55%的速度提升,内存性能的提升速度每年只有10%左右,存储速度严重滞后于处理器的计算速度。

详细来看,自动驾驶、元宇宙、大模型等强烈呼唤更大算力、更高能效时代。但,冯式架构下,由于存储器和处理器的数据交换通路窄,AI运算需1PB/s,但DRAM 为40GB-1TB/s,数据提取、搬运时间为运算时间的成百上千倍,无用功耗约为60-90%,即存储墙、带宽墙、功耗墙问题越来越严重。

存算一体的概念提出于1969年,为非冯氏架构,其直接利用存储器进行数据处理或计算,从而把数据存储与计算融合在同一个芯片的同一片区之中,可以彻底消除冯氏架构架构瓶颈,“数量级程度降低功耗、一定程度提升算力(计算能力仍受制程制约)”。

受限于芯片制造技术和算力需求的匮乏,存算一体一段时间内仅仅停留在理论研究阶段,近年来则再次在产业界走热,英伟达、英特尔、微软等纷纷推出系统原型。

吴强瞄准的,就是这样一个时代窗口。

“长远来看,我们想做的事情就是用一个极致效率的芯片去实现万物智能,这也是我们自己给自己的使命”,吴强在发布会上称,从早期计算机到PC时代,再到智能手机时代,都伴随着1000倍计算效率的提升。后摩智能显然欲借底层技术创新的存算一体,抢跑下一个时代。

推进节奏

在第一阶段,后摩智能聚焦的应用领域为智能驾驶。

底层技术和处理器架构层面,据后摩智能联合创始人兼研发副总裁陈亮介绍,存算IP层面,鸿途™H30基于 SRAM 存储介质,采用数字存算一体,拥有极低访存功耗和超高计算密度,在 Int8 数据精度条件下,其AI核心IPU能效比高达15Tops/W,是传统架构芯片的7 倍以上。

处理器架构层面,后摩智能规划了三代架构,第一代为天枢架构,面向智能驾驶打造;第二代为天璇架构(已在研发中),可根据应用场景的不同配置计算单元的数量,整体性能、效率和灵活性将进一步跃升,支持多场景应用,例如成本和功耗敏感的智能终端、自动驾驶、大模型等场景;第三代IPU面向通用人工智能打造,命名为天玑架构。

其中,鸿途™H30基于天枢架构,其采用多核、多硬件线程的方式扩展算力,实现了计算效率与算力灵活扩展的均衡,AI 计算可以在核内完成端到端处理,保证通用性。得益于此,鸿途™H30 实现了性能2倍提升的同时,降低50%功耗。

“它最大的特点就是计算效率特别高”,后摩智能联合创始人兼产品副总裁信晓旭称。

据信晓旭介绍,SOC层面,得益于存算一体底层架构创新优势,鸿途™H30 基于 12nm 工艺制程实现256TOPS物理算力,SoC能效比达到 7.3Tops/W,具有高计算效率、低计算延时、低工艺依赖等特点。

鸿途™H30 已成功运行常用的经典 CV 网络和多种自动驾驶先进网络,包括BEV 网络模型以及广泛应用于高阶辅助驾驶领域的 Pointpillar 网络模型,以鸿途™H30 打造的智能驾驶解决方案已经在合作伙伴的无人小车上完成部署。

据信晓旭释放的信息,鸿途™H30 将于2023年6月份开始给 Alpha 客户送测。同时,后摩智能的第二代产品鸿途™H50 已经在全力研发中,将于2024年推出,支持客户2025年的量产车型。

那么,鸿途™H30 瞄准具体什么样的市场?

根据高工智能此前调研获取的信息,当前智驾芯片呈分层发展趋势,其一,智能前视一体机;其二,5-20TOPS轻量级行泊一体;其三,50-200TOPS中算力平台,支撑增强版高速NOA;其四,200TOPS以上高算力平台,做硬件预置和算力冗余,传感器配激光雷达,支撑城市NOA。

显然,鸿途™H30更有可能面向第四个市场,这也意味着,其将英伟达的Orin形成正面对抗。整体来看,这一市场在2022年已开启规模放量元年,与城市NOA元年、激光雷达规模放量元年相对应。对此,信晓旭也强调,产品发布只是开始,接下来的落地中,后摩会针对不同车型和对成本的考量,推出更丰富的产品系列,以满足不同类型客户对性价比的需求。

在时间节奏上,虽然后摩智能未披露鸿途™H30的量产时间,不过根据送测到上车的时间周期,鸿途™H30最快或于2024年上车。

根据后摩智能披露的信息,“我们拜访了超过50家客户和合作伙伴(包括20+主机厂),与他们进行了多轮次的合作和交流,我们也一起探讨如何用存算一体的颠覆性的技术,解决现实方案中的痛点,让我们的产品定义和产品组合策略更清晰”。

值得一提的是,为助力客户产品落地,后摩智能基于鸿途™H30开发了硬件参考设计平台:力驭®智驾域控制器。

根据现场展示的信息,该平台功耗仅85W,以太接口方面,提供8路100/1000Base-T1、2路100/1000Base-TX接口,可接入激光雷达、TBOX、组合导航及调试,摄像头接口方面,提供12路GMSL2摄像头接口,支持raw data输入(支持2个800万摄像头、6个200万摄像头)。

如何规模落地?

欲戴皇冠,必承其重。

高工智能汽车注意到,一方面,作为智驾芯片初创企业,此前调研中,部分业内人士反馈的最大挑战为“完成商业化闭环”。换言之,没有厂商可以在一开始,就交出一个十全十美的“芯片+工具链”,只有抓住某一具体应用场景的市场窗口,先交一个相对优质的答卷,被客户用起来,有一定造血能力,接着再快速把芯片、工具链迭代好。

另一方面,根据业内的观点,存算一体从学术研究,走向产业落地,面临的挑战包括:电路设计影响芯片算效提升、芯片架构场景通用性及规模扩展能力较差、EDA工具链尚未健全、软件及算法生态不完善等。

后摩智能如何解决?

根据信晓旭的介绍,在商业模式上,“后摩智能会坚定把自己定位为汽车产业连的Tier2,我们坚持不跨界、不越位原则,要做好自己擅长的事,我们坚持会用我们的底层的核心技术,去打造有竞争力的智能驾驶计算芯片,并提供必要的组件”。

同时,后摩智能尝试搭打造Sailing平台(寓意助力合作伙伴扬帆起航)。

其包括三部分:其一,贴近芯片的使能组件部分,包括基于鸿途™系列芯片的硬件平台、Boot&Drivers、软件工具链后摩大道™;其二,包括第三方合作伙伴的底层OS、第三方合作伙伴的中间件、第三方合作伙伴的智驾算法;其三,提供Model zoo加快合作伙伴的算法开发进程。

软件工具链为核心关键之一。根据高工智能汽车此前调研获取的信息,芯片厂商的长期核心竞争力往往被聚焦为两个:芯片本身、主要包括工具链的生态。此次发布会上,信晓旭亦分享了其创业之前过往从业过程中的“教训”:因工具链难用导致已获得的项目被客户放弃。

“我们的竞争力要构建两个方面:一个是要基于存算一体架构打造更好的PPA,这是硬的东西;另外一个是软的东西,我们要把软件工具链当成产品的另外一个关键的竞争力来打造”,信晓旭称,这是公司团队在创业伊始就达成的共识。

据介绍,后摩大道™的设计哲学包括两个:大道至简、大道至臻。

前者强调相同:对于客户呈现的开发方式、用户使用习惯,保持不变或者是相近的,尽量降低算法开发者的学习成本;后者强调不同,“为了打造好用的工具链,我们做了很多底层的独特设计。工具链和底层架构是强相关的,好用的工具链需要底层硬件给予很好的支持”。

整体来看,后摩大道™支持 PyTorch、TensorFlow 、ONNX 等主流开源框架,编程兼容 CUDA 前端语法,同时支持 SIMD 和 SIMT 两种编程模型,兼顾运行效率和开发效率,以无侵入式的底层架构创新保障了通用性的同时,进一步实现了鸿途™H30 的高效、易用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/535718.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

多线程的最最简单的基本了解

引言: 在学习完常规的语法后,我们将进入下一步的学习,而多线程则是被大多数人认为的下一步的学习目标,因为在有了基础的语法大框架后我们都有了对编程的一个基本的认知,而多线程则是开始有了一定的深度。 一、线程的基…

企业电子招标采购系统源码之传统采购模式面临的挑战

采购类型多 采购制度:采购金额、部门、品类的差异导致管理标准不同。 采购流程:从供应商管理、寻源操作到合同签订、订单执行,业务流程长,审批节点多,传统管理透明度低,联动性差。 供应商管理难 寻源&#…

Aixcoder:AI辅助编程工具

【产品介绍】 aixcoder是一款基于深度学习人工智能技术的AI辅助编程工具。提供了一个由各个领域的专业代码训练出来的“虚拟编程专家”,通过与aixcoder进行结对编程,程序员可以感受到工作效率的显著提升。 借助aixcoder的帮助,程序员可以摆脱…

ChatGPT教程 基于Springboot+Spring+MybatisPlus实现gpt3.5接口开发

⛪ ChatGPT教程: 基于SpringbootSpringMybatisPlus实现gpt3.5接口开发 🚀 文章介绍: 本文基于SpringBootSpringMybatisPlus实现一个响应快速的gpt接口,可通过与前端整合开发对应的前端页面 🚀 源码获取: 项目中的资料可以通过文章底部小卡片获…

AutoSizer.exe:自动调整窗口大小的便捷工具

AutoSizer.exe是一款实用的桌面应用程序,它旨在帮助用户自动调整窗口大小,提供更好的用户体验。无论您是在使用Windows操作系统进行日常工作还是进行多任务处理,AutoSizer.exe可以简化您的工作流程,提高效率。本文将介绍AutoSizer.exe的下载地址、功能介绍、使用方法以及其…

国考省考行测:增长率,减少率,增长3倍,是3倍,比较增长率直接相除,能除就除,能减就减,看题三要素:时间,关键词,考点

国考省考行测:增长率,减少率,增长3倍,是3倍,比较增长率直接相除,能除就除,能减就减,看题三要素:时间,关键词,考点 2022找工作是学历、能力和运气…

__101对称二叉树------进阶:你可以运用递归和迭代两种方法解决这个问题吗?---本题还没用【迭代】去实现

101对称二叉树 原题链接:完成情况:解题思路:参考代码: 原题链接: 101. 对称二叉树 https://leetcode.cn/problems/symmetric-tree/ 完成情况: 解题思路: 递归的难点在于:找到可以…

谈谈包装类与泛型

目录 包装类 基本数据类型与对应的包装类 装箱和拆箱 装箱 拆箱 泛型 什么是泛型 泛型的语法与使用 泛型的编译 擦除机制 泛型的上界 泛型方法 提到泛型的话,我们就先提一下包装类吧! 包装类 在Java中,由于基本类型不是继承自Ob…

STC8单片机+基于DMP库解析MPU6050数据+匿名上位机图形化显示

STC8单片机+基于DMP库解析MPU6050数据+匿名上位机图形化显示 📌相关篇《STC8单片机+基于DMP库解析MPU6050数据+vofa+图形化显示》✨该工程代码匹配的是匿名四轴上位机软件的2.6版本通讯协议,所以支持使用2.6版本的,最新的版本不支持。🌿验证对象:STC8H8K64U🌿时钟频率…

产品需求文档|协调、协作和沟通新产品开发的专业指南

「产品需求文档」是一个强大的产品管理工具,被众多敏捷团队推荐,并被一些行业中的大公司使用。 它有助于使团队保持一致,促进长期合作,并向团队成员传达优先必做事项,以完成工作。 如果你还没有开始制作,…

一个有趣的vc1编码器

这里分享一个vc1编码器,下载地址: https://download.csdn.net/download/weixin_43360707/87791898 文件包在附件,打开文件夹,可以看到下面三个文件夹: 因为我们的系统试Linux,所以我们选择Linux(x64). 继…

kubeadm方式搭建的k8s集群升级——2023.05

文章目录 一、概述二、集群概况三、升级集群2.1 确定升级版本2.2 升级Master2.3 升级 Worker 四、验证集群 一、概述 搭建k8s集群的方式有很多种,比如二进制,kubeadm,RKE(Rancher)等,k8s集群升级方式也各有…

利用android studio 生成 JNI需要的动态库so文件 图文详解

一、环境搭建 1.1 Android studio2021.2.1安装 到官网下载,此处不再陈述 1.2 JNI安装 JNI 是JDK里的内容,电脑上正确安装并配置JDK即可。 1.3 NDK安装 直接在Android studio下载(File---->Settings) 1.4 编译工具 工具一…

72.建立一个表格组件

本节课我们将实现如下的表格&#xff1a; ● 首先&#xff0c;我们直接用表格元素将这些数据展现出来 <table><tr><td>Chair</td><td>The Laid Back</td><td>The Worker Bee</td><td>The Chair 4/2</td></tr…

数据结构与算法——算法与算法分析

算法与算法分析 初识算法算法的定义算法的描述算法与程序算法的特性算法设计的要求 算法时间效率的度量事前估计法算法时间复杂度的渐进表示法算法时间复杂度案例分析最好、最坏和平均时间复杂度算法的空间复杂度 初识算法 算法的定义 算法&#xff0c;即是对特定问题求解方法…

Winform实现以管理员模式启动并实现修改系统时间

场景 SpringBoot/Java中定时请求并根据服务端响应头的date实现本地Windows修改时间/时间同步(管理员权限问题-bat管理员启动cmd并运行jar)&#xff1a; SpringBoot/Java中定时请求并根据服务端响应头的date实现本地Windows修改时间/时间同步(管理员权限问题-bat管理员启动cmd…

在家吃灰老主机怎么自建黑群晖NAS当影音服务器

准备:u盘一个,老主机一个,要显示器键盘,烧u盘软件win32-disk(网上找)、balena(balenaEtcher - Flash OS images to SD cards & USB drives)的 1,巴西大佬的引导文件 进来这里 GitHub - fbelavenuto/arpl: Automated Redpill Loader 点右边的release文件下载 下载…

golang 函数调用栈笔记

一个被函数在栈上的情况&#xff1a;&#xff08;栈从高地址向低地址延伸&#xff09; 返回地址&#xff08;函数执行结束后&#xff0c;会跳转到这个地址执行&#xff09; BP&#xff08;函数的栈基&#xff09;局部变量返回值&#xff08;指的是函数返回值&#xff0c;eg&am…

Facebook广告投放过程中,如何提高有效曝光?

在数字营销中&#xff0c;广告曝光是至关重要的一环&#xff0c;Facebook广告投放也不例外。 有效曝光能够提高广告的点击率和转化率&#xff0c;从而帮助企业实现更好的广告效果。那么在Facebook广告投放过程中&#xff0c;如何提高有效曝光呢&#xff1f;下面将为大家分享几…

【Mybatis】SpringBoot整合Mybatis

唠嗑部分 之前我们说了Mybatis的一些文章&#xff0c;相关文章&#xff1a; 【Mybatis】简单入门及工具类封装-一 【Mybatis】如何实现ORM映射-二 【Mybatis】Mybatis的动态SQL、缓存机制-三 【Mybatis】Mybatis处理一对多、多对多关系映射-四 这篇文章我们来说说SpringBoot如…