【AI学习】地平线首席架构师苏箐关于自动驾驶的演讲

news2025/1/16 5:16:05

在地平线智驾科技畅想日上,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)做了即兴演讲,以下是其演讲的主要内容:
对自动驾驶行业的看法
自动驾驶的难度与挑战:苏箐表示自动驾驶非常难,他做自动驾驶到现在已经快抑郁了,很多优秀的同学都改行了,去做具身智能机器人。他认为自动驾驶是第一个在物理世界跟人交互的机器人,是在一个半规则和半非规则的场景里面的东西,如果连自动驾驶都搞不定,去做完全是非结构化的机器人是不可能的。
自动驾驶的价值拐点:苏箐认为自动驾驶系统的竞争对手是人类本身,其价值是一个拐点式的价值。当自动驾驶比不过人的时候,它就是高科技的玩具;当有一天比人好的时候,其价值立刻就会跳上去。到目前为止,还没有一个系统真正达到了这个拐点。
对行业现状的批评:苏箐直言不讳地表示,他不太喜欢中国智能驾驶行业这几年的氛围。他认为智驾行业应该做一点正确的产品,解决一些正确的问题,而不是天天活在营销里面。
对特斯拉的评价
苏箐坦率地表示,如果抛开跟人类的比较,今天一定要让他找个对标对象,他还是会选特斯拉FSD。他认为特斯拉在技术方面有很多独到之处,甚至在某些地方有断代式的领先。他从特斯拉身上学到了很多新的思想和思路。
地平线的目标与技术路线
2025年的目标:苏箐透露,地平线今年的目标有两个,一个是用一段式的端到端把类人做上去,第二是把车辆紧急接管安全性至少要提升100倍。他们相信,只有解决了这些问题,才能打造出与众不同的产品。
技术路线的选择:地平线在自动驾驶系统的内核上采用了完全的端到端数据驱动方法。但在数据稀疏、难以快速收敛的情况下,也会制定相应的规则来确保系统的便利性和有效性。此外,地平线还推出了最新的智能驾驶解决方案HSD,这套方案能够应对各种复杂的交通场景,包括在狭窄城区道路掉头等难例场景。
对中国自动驾驶市场的理解
苏箐认为,中国自动驾驶面临特殊挑战,如基建随意性、外卖行为不守规矩等。因此,地平线选择了一条务实的道路,根据中国国情进行自主研发。他强调,一个真正有价值的自动驾驶系统,应该能够在用户感到疲劳或不安全时,提供可靠的驾驶辅助,让用户能够放心地将驾驶任务交给系统。

备注

转微博@高飞的文章,作为参考
#模型时代# 地平线首席架构师苏箐关于自动驾驶的“苦涩的教训”

昨天我参加了一下地平线智驾科技畅想日的活动,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)首次在媒体面前公开露面,并做了一段即兴演讲。讲的时间不长,但非常诚恳深刻。

他说“谈到(完美的自动驾驶),十多年过去了,全世界最聪明的人投入了这么多资金,还是没有突破这个点,确实会感到有些绝望”;而谈到解决方案,又讲“我干了这么多年,对每年出现的新概念和时髦词已经完全没感觉了。因为像这样的复杂系统,既没有捷径,也不存在一蹴而就的方法。明天有个新模型,搞个新工具就能解决所有问题,这种想法是不现实的;所以,结论是:”复杂系统的正确打开方式是:你要有一个非常强大的工程团队,要建立一个非常稳固的系统。在此基础上,不断地在一个嘈杂的环境中,将新的方法持续集成进去,然后不断前进“。

他讲到结论的时候,我就突然想到了Rich Sutton在2019年3月发表的名篇《The Bitter Lesson》,这篇文章的核心论点可以概括为一个深刻而"苦涩"的历史教训:在AI研究历史上,基于通用方法(利用计算能力的搜索和学习)的方案,最终总是战胜基于人类知识和智慧的特定方法。这个模式在计算机视觉、围棋、语音识别、机器翻译等多个领域反复上演。

所以,Rich Sutton说,“科学家的专业知识和智慧似乎不如简单的暴力计算更有价值”。虽然苏箐的看法是,国内的现实情况让业界无法用存粹的暴力算力数据堆叠,但两者都提到了这个领域没有“灵丹妙药”。既然如此,苏这句“一个强大的工程团队敢于干一些苦活累活优化前进”,某种程度上,也是一种苦涩的教训吧。

文字是现场记录,未经本人确认,仅供参考(其实我认为地平线的算法实际上有非常重要的优势,几年前的芯片架构设计就考虑了Transformer,苏的观点就有一些自谦的成分在):


1、说到今天的感受,我是既乐观又困惑。自动驾驶确实非常难,我有很多优秀的朋友已经改行去做别的事情了。

自动驾驶不是什么新东西了。自动驾驶的整个发展应该是从2004年的DARPA Project开始,从那个时候我们就看到了自动驾驶的可能性。我自己开始做这个是在2012年、2013年左右。

有不少人问我要不要去做机器人,但我想,我们连自动驾驶都还没搞定,怎么去做机器人呢?其实自动驾驶应该是第一个在物理世界中与人交互的机器人,它存在于一个半规则化的环境中。如果连这个都搞不定,去做一个完全非结构化环境下的机器人是不可能的。

2、自动驾驶的真正比较对象不是竞争对手,不是国内的蔚小鹏、华为或其他公司,而是人类本身。

它的价值是一个拐点式的价值:在比不过人的时候,它就是一个高科技的玩具;只有在某一天比人好的时候,它才会形成一个质变式的价值。但可惜的是,到目前为止还没有一个系统真正达到了这个拐点。

3、十多年过去了,看着全世界最聪明的人投入了这么多资金,还是没有突破这个点,确实会感到有些绝望。但是在绝望中依然能看到希望,因为经过五到六代核心技术的演进,整个系统确实能看到曙光。

说到我们的优势和理念,其实很简单,我并不打算去跟任何人比较。我干了这么多年,对每年出现的新概念和时髦词已经完全没感觉了。因为像这样的复杂系统,既没有捷径,也不存在一蹴而就的方法。明天有个新模型,搞个新工具就能解决所有问题,这种想法是不现实的。

4、复杂系统的正确打开方式是:你要有一个非常强大的工程团队,要建立一个非常稳固的系统。在此基础上,不断地在一个嘈杂的环境中,将新的方法持续集成进去,然后不断前进。我觉得这是做大型工程的一个经验之谈。

"说到自动驾驶的竞争,坦白说如果今天让我选择一个竞争对手的话,我还是会选择特斯拉FSD。因为美国团队的整体素质和创新经验确实值得敬佩。我自己实践后发现,他们在技术上确实存在一些不足,但这只是暂时的。我们也从中学到了很多新的思想和思路,至少他们已经证明了一些技术路线是可持续的,甚至在某些部分有断代式的领先。

5、但是说到中国的自动驾驶要跟美国做一样的事情,这是不现实的。

首先,在目前状况下,中国不可能投入像特斯拉那样的算力,无论是从经济还是政策角度都不可能。其次,中国的基建和道路条件与美国有很大差异。更重要的是,中国还面临着电动车不遵守交通规则等特殊问题,这导致了大量需要处理的博弈问题,而这些是现在的深度学习还不能完全解决的。

6、所以我们选择了一条比较务实的道路。我们的系统采用完全端到端的深度学习方法,但在一些数据比较稀疏、比较难处理,或者因为混杂数据难以收敛的情况下,我们也会让有经验的工程师去做一些规则设计,就是采用两种技术并行的方式。这在目前来看是最有效的方案。

当然,在做市场营销时,我们可以讲得天花乱坠,但对于普通消费者来说很简单,他上车后能够感觉到这个系统是可靠的,这才是最重要的。我到现在最推崇的产品仍然是Steve Jobs时代的iPhone,它在所有细节上都做到了极致,没有明显的弱点。目前这一代产品还没有看到谁能达到那个高度。我希望在我们这个产品中,能专注于解决真正的问题,而不是一味追求营销效果。

7、如果要谈自动驾驶的价值演进,我觉得可以分为三个阶段:第一个阶段是高科技的玩具,仅仅是噱头;第二个阶段是在高速公路上好用,虽然在城市道路上还不太理想,但起码在高速上开车时不用那么累了,只需要让它自己行驶就可以。虽然这个价值还不够高,但已经有一定意义了。不过这里要注意中美的差异:美国人上下班基本都走高速,而中国不是,中国的城市交通问题更复杂,是一个网格化的问题。

8、自动驾驶系统的本质问题是:到底是系统依赖人,还是人依赖系统?如果你想让这个系统真正产生价值,就要考虑这样的场景:当人们加班很累,感觉自己开车不太安全的时候,能否完全信任这个系统来接管驾驶?这才是系统真正的价值所在,它超越了单纯的功能价值。这也是我们正在努力要做到的方向。

9、说到底,我认为有两个关键点:第一是类人性,不好意思我提到这个词。但类人性的目的不是为了模仿人类,因为人开车时本来就不是预防性驾驶。比如今天我们看到一个系统在处理车辆变道时,你会观察到它’在思考要不要变道’,然后才做出动作,这其实已经不太对了。如果你完全感觉不到这个车辆在你的预判之前就已经把动作做完了,这个系统才是真正做对了。这是我们追求的目标。

第二个是要提升整个车辆的紧急避险安全性。这件事情非常难,但随着自动驾驶技术的推进,我们也发现了一些新的方法和线索。只有这两件事情都做到位了,我相信我们的产品才能在市场上真正与众不同。

10、坦白说,这么多人辛苦了这么多年,如果只是去做一个用来营销的东西,这不是我们应该做的事情。我们应该去解决实际的问题,而不是天天活在营销中。我个人不太喜欢中国这几年的氛围,我觉得我们应该做一些真正有价值的产品,尽管这很难。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2277362.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

前端实现doc文件预览的三种方式

文章目录 1、docx-preview 实现(推荐)2、vue-office 实现3、mammoth 实现(不推荐) 需求:有一个docx文件,需要按其本身的格式,将内容展示出来,即:实现doc文件预览。 本文…

final修饰的用法

1、final修饰类 被final修饰的类不可以在被继承。 比如在Java中String就是final修饰的不可以被继承 2、final修饰成员变量 同时final也可以修饰局部变量 final int N5; 3、final修饰静态变量 final修饰静态的成员变量,(在方法中不能定义静态的属性…

Windows 11 安装GTK+3.0 和VScode开发GTK+3.0配置

Windows 11 安装GTK+3.0 和VScode开发GTK+3.0配置 安装msys2下载msys2安装安装msys2安装编译器gcc安装调试器gdb安装GTK+3.0安装C/C++开发GTK+3.0工具配置路径验证GTK+3.0安装验证配置运行GTK DemoVScode配置测试代码文件test.c任务配置文件tasks.jsongdb调试配置文件launch.js…

鸿蒙-页面和自定义组件生命周期

页面生命周期,即被Entry装饰的组件生命周期,提供以下生命周期接口: onPageShow:页面每次显示时触发一次,包括路由过程、应用进入前台等场景。onPageHide:页面每次隐藏时触发一次,包括路由过程、…

国产编辑器EverEdit - 扩展脚本:新建同类型文件(避免编程学习者反复新建保存练习文件)

1 扩展脚本:在当前文件目录下新建同类型文件 1.1 应用场景 用户在进行编程语言学习时,比如:Python,经常做完一个小练习后,又需要新建一个文件,在新建文件的时候,不但要选择文件类型&#xff0c…

使用 selenium-webdriver 开发 Web 自动 UI 测试程序

优缺点 优点 有时候有可能一个改动导致其他的地方的功能失去效果,这样使用 Web 自动 UI 测试程序可以快速的检查并定位问题,节省大量的人工验证时间 缺点 增加了维护成本,如果功能更新过快或者技术更新过快,维护成本也会随之提高…

算法-贪心算法简单介绍

下面是贪心算法视频课的导学内容. 目录 1. 什么是贪心算法?2. 贪心算法简单的三个例子:1. 找零问题2. 最小路径和问题3. 背包问题 3. 贪心算法的特点4. 贪心算法学习的方式? 1. 什么是贪心算法? 简单来说, 我们称以局部最优进而使得全局最优的一种思想实现出来的算法为贪心…

【Hive】新增字段(column)后,旧分区无法更新数据问题

TOC 【一】问题描述 Hive修改数据表结构的需求,比如:增加一个新字段。 如果使用如下语句新增列,可以成功添加列col1。但如果数据表tb已经有旧的分区(例如:dt20190101),则该旧分区中的col1将为…

《深度剖析算法优化:提升效率与精度的秘诀》

想象一下,你面前有一堆杂乱无章的数据,你需要从中找到特定的信息,或者按照一定的规则对这些数据进行排序。又或者,你要为一个物流公司规划最佳的配送路线,以降低成本和提高效率。这些问题看似复杂,但都可以…

量子计算:从薛定谔的猫到你的生活

文章背景 说到量子计算,不少人觉得它神秘又遥不可及。其实,它只是量子物理学的一个“应用小分支”。它的核心在于量子比特的“叠加”和“纠缠”,这些听上去像科幻小说的概念,却为计算世界开辟了一片全新的天地。如果经典计算是“…

Linux第二课:LinuxC高级 学习记录day02

2.4、shell中的特殊字符 2.4.4、命令置换符 或者 $() 反引号:esc下面的按键,英文状态下直接按 功能:将一个命令的输出作为另一个命令的参数 echo 不会认为hostname是一个命令 加上 之后,先执行hostname,拿到主机名…

基于mediapipe的手势游戏控制

基于mediapipe的手势游戏控制 ​ 玩游戏,那不是有手就行!!! mediapipe介绍 ​ Mediapipe是Google在2019年开发并提出的一款开源的跨平台多媒体处理框架,用于构建基于机器学习的应用程序,特别是涉及到计算机视觉、音频处理、姿势估计等领域。…

安装软件缺少msvcp110.dll怎么办?出现dll丢失的解决方法

在日常使用电脑安装各类软件的过程中,相信不少朋友都遇到过 “缺少 msvcp110.dll” 的报错提示 。下面就来深入聊聊这个 msvcp110.dll 文件,以及当它缺失时,我们该如何巧妙应对。 一、msvcp110.dll 文件介绍 1.1 定义与功能 msvcp110.dll 是…

(学习总结19)C++11 列表初始化、右值引用、移动语义、引用折叠与完美转发

C11 列表初始化、右值引用、移动语义、引用折叠与完美转发 一、列表初始化C98 传统的 {}C11 中的 {}C11 中的 std::initializer_listC11 {} 列表初始化 与 std::initializer_list 区别 二、右值引用左值和右值左值引用和右值引用引用延长生命周期左值和右值的参数匹配类型分类 …

从0开始学习搭网站第二天

前言:今天比较惭愧,中午打铲吃了一把,看着也到钻二了,干脆顺手把这个赛季的大师上了,于是乎一直到网上才开始工作,同样,今天的学习内容大多来自mdn社区mdn 目录 怎么把文件上传到web服务器采用S…

ffmpeg硬件编码

使用FFmpeg进行硬件编码可以显著提高视频编码的性能,尤其是在处理高分辨率视频时。硬件编码利用GPU或其他专用硬件(如Intel QSV、NVIDIA NVENC、AMD AMF等)来加速编码过程。以下是使用FFmpeg进行硬件编码的详细说明和示例代码。 1. 硬件编码支…

【高可用自动化体系】自动化体系

架构设计的愿景就是高可用、高性能、高扩展、高效率。为了实现架构设计四高愿景,需要实现自动化系统目标: 标准化。 流程自助化。 可视化:可观测系统各项指标、包括全链路跟踪。 自动化:ci/cd 自动化部署。 精细化&#xff1a…

elasticsearch中IK分词器

1、什么是IK分词器 ElasticSearch 几种常用分词器如下: 分词器分词方式StandardAnalyzer单字分词CJKAnalyzer二分法IKAnalyzer词库分词 分词∶即把一段中文或者别的划分成一个个的关键字,我们在搜索时候会把自己的信息进行分词,会把数据库…

arcgis中生成格网矢量带高度

效果 1、数据准备 (1)矢量边界(miain.shp) (2)DEM(用于提取格网标高) (3)DSM(用于提取格网最高点) 2、根据矢量范围生成格网 模板范围选择矢量边界,像元宽度和高度根据坐标系来输入,我这边是4326的,所以输入的是弧度,输出格网矢量gewang.shp 3、分区统计 …

一文了解如何使用 DBeaver 管理 DolphinDB

在日常的数据开发、分析和数据库运维中,一款优秀的 IDE 能够极大地提升工作效率。DBEaver 是一款由 Java 编写的一站式跨平台连接器,其社区版本已能支持连接近百种数据库,受到广大开发者的喜爱。近期。DolphinDB 与 DBeaver 团队共同努力&…