2024年全国两会
确定

网站 > 2025中国汽车论坛

地平线吕鹏:高阶辅助驾驶技术发展历程与落地实践

2025第十五届中国汽车论坛于7月10日-12日举办,7月11日,地平线副总裁,战略部&智驾产品规划与市场部负责人吕鹏出席了第七届全球汽车技术发展领袖峰会,聚焦大模型赋能感知决策一体化,重点探讨了当下自动驾驶技术趋势。以下内容为现场发言实录:

地平线副总裁,战略部&智驾产品规划与市场部负责人吕鹏

尊敬的各位行业同仁们,大家好,我是吕鹏,非常高兴有机会在这里和大家分享地平线对于高阶辅助驾驶技术和自动驾驶技术发展及落地实践的一些看法。

我觉得整个的高阶辅助驾驶系统其实围绕着三个大的阶段在发展,第一个阶段,市面上之前很多刚开始落地的辅助驾驶系统其实属于规则系统阶段。在这个阶段,感知后的规则控制写了大量代码,但很难在复杂多样的场景下做好横纵向控制,会带来很多 “跷跷板” 效应:在某个场景想解决好,却会在其他场景的横纵向控制上带来新的问题。

第二个阶段是整个混合系统阶段,所谓混合系统阶段,就是说一方面有整个数据驱动的轨迹控制,但同时又混杂了很多规则的代码,它在某些场景下靠数据驱动,某些场景下靠规则,这会导致系统 “打架”,经常出现车辆犹豫或异常动作,本质是规则和模型之间存在很多冲突。

第三个阶段就是稠密模态系统阶段,就是一个完全的数据驱动性阶段,现在只有特斯拉实现了一个纯的数据驱动系统,同为自动驾驶辅助驾驶行业的技术公司,我觉得特斯拉非常值得尊敬,因为它带来了一个极致的产品力。然后在美国包括中国现在还没有大范围的推送,在之前小范围的推送中,其实在行业的从业人员都已经意识到它的整个的技术的领先性和产品的领先性。在这个阶段来说,其实我们已经看到这种返璞归真去构造整个系统,提升基础能力的重要性。

我觉得整个市场也会逐渐地改变,因为其实过往智能驾驶领域很多都是营销驱动的方式,我们看到在中国其实创造出了大量的新名词,如果你再回看特斯拉,其实特斯拉是没有讲过太多的新名词,但是它是扎扎实实地去做底层的算法、技术、产品的突破,带来用户体验的跃升。很有意思的一个点是,我们看最近在 AI 的这个领域里边, Meta 为什么会用 1 亿美金去挖一个人?一个人这么高的价值,比C罗的转会费都高,其实本质上来说,就是在底层的技术突破是非常难的,而在这种底层突破中,正是由于这些人在 OpenAI 实现了一定突破,他看到了很多别人没看到的东西。

而这种底层的突破,我觉得比靠营销驱动讲很多新的概念,讲一个一个 feature 点是更加重要的,所以其实从整个自动驾驶的发展来说,我觉得做产品其实是没有捷径的,要扎扎实实做产品底层的突破,化繁为简、返璞归真其实是很重要的一个点,不然的话我们会把很多的精力耗在了产品一些小的 feature 的宣传上,而忽视了底层技术的突破带来产品性能提升的重要性。

所以,从地平线的观点来说,要做好一个辅助驾驶的产品,要以实现极致的产品体验为核心,这依赖极简的全数据驱动系统,而不是说我们要去做一个个的炫技场景展示,只有在基础的能力做好了,整个自动驾驶就会成为汽车新的自动挡。

我们认为这里面最核心的关键要依赖四个方面的发展,一个是算力的持续增长,一个是模型的持续增长,一个是基础建设的持续优化以及整个传感器系统的标准化。其实我们看到 PC 和手机比汽车产业的规模要大好多个数量级,但是标准化其实比汽车的标准化要强好多倍。那在整个汽车转向智能化的时候,它其实是已经往 ICT 的产业去发展,一旦软件迭代的重要性凸显的时候,标准化就会非常的关键。而带动自动驾驶的发展的就是我们上面说的算力、模型和基础建设。

其实我们也可以跳出自动驾驶领域来看,其实在赛车游戏的发展上,与人类构建系统的方式是类似的:从以前的像素级的机械式赛车、到像素街机,到后面的Xbox,其实赛车游戏的逻辑和整个的游戏的标准都在变化。但是我们看到的是什么呢?是围绕着算力的数量级提升,同样的功能也会给消费者带来完全不一样的体验,人类一遍又一遍地用更大的算力去重构这样的一个用户体验,带来整个质的飞跃。所以在计算机领域,大算力和稠密模态是通向最优解法的正确道路。

那么刚才提到的三大核心,第一就是决定体验上限的算力,大家看到在产业高速发展上,其实大家要尽快地去拥抱更快更高的算力,是很重要的一个要素。因为用户体验高高在上,我们现在的性能水平其实是远没有达到真正消费者这个的用户需求。我觉得真正消费者用户需求虽然没有明讲,但是大家其实都想,一个系统能实现你下了班,设了一个导航路线,系统自己就能开过去海边看日出了,这才是消费者真正需要的东西。

所以,因为算力的发展是很快的,我们只有以最好的节奏快速地拥抱算力的发展,才能有最好的体验上限。要在一个算力不够的基础上,做出更好的产品,这是很难的。

第二个点就是算法的重要性,算法决定了体验的兑现能力,这一点无论是对做智驾的供应商还是车企,都提出了很高的要求。以前在营销驱动下是怎么样的呢?就是说你配了多大算力,但是算法能力不够的时候, 1000 TOPS 的算力你可能只能发挥出来10%,那你的 1000 TOPS 跟 100 TOPS 是没有什么区别的。所以只有在你有很好的算力的基础上,算法匹配去兑现你这个能力,如果你能兑现100%,那么你就拥有了竞争优势,如果你只能兑现10%,你就多花了冤枉的钱,那车的续航还受影响,对吧?对整个车企的竞争还会带来负面效应。

第三个点是,如果你要想去实现更快速的软件迭代和体验进化,取决于你的基础设施:你有多大的算力规模去做模型的训练,你有多强的数据闭环系统,你有多强的仿真的能力和验证的能力。如果做软件驱动的汽车,别人一周可以发一个版本,你三个月发一个版本,你怎么也不会追得上的,因为整个的迭代效率就决定了这个行业的发展速度。所以其实地平线一直坚持的一个观点,在智能汽车阶段,“快打慢、高打低”是行业的主旋律,首先你要做得足够快,然后如果你做得慢,大概率是不行的。第二是一定要快速拥抱更高的性能的算力基础,这样的话才能够以这六个字去支撑整个行业的快速发展。

在市场和技术的双重驱动下,我们认为算力平台的节奏其实是很重要的,在智能驾驶的发展过程中,每一年其实都有对应的算力甜点位,这个甜点位是规模最大,性能满足当前算法的要求,同时这个甜点位一定是在不断提升和发展的。我们回看智能手机的发展,从 iPhone 的发布开始,咱们以这个红米作为便宜的手机的例子,那么高性能我们以 iPhone 为例,那其实不管是 iPhone 还是红米,每年它的性能,特别是主计算平台的性能,都在提升,因为用户的需求在那里,它其实还是符合我们常说的这个计算机产业的发展的安迪比尔定律,只要硬件能提供足够的性能,软件永远能创造出更好的用户价值体验。

那今年其实整个行业的甜点位是在 100 ~ 200 TOPS,我们可以看到智驾平权中的大量车企智驾算力配置都集中在这个区间,形成了规模。地平线的征程 6M 芯片就处于这个档位,今年几个月时间就达到了近百万的出货,也是创造了我们自己的历史,证明这个档位算力的芯片是整个市场拥抱速度最快的。但我们也看到,其实随着这个的发展,到了明年的下半年,或者到后年,500+TOPS 可能会是行业一个主要发展方向,因为本身数据驱动就需要大家用更高的模型去演进,模型升级、功能跃迁,以及城区辅助驾驶走向标配,都带来对更好用户体验的追求。所以对于整个行业来说,节奏是很关键的,一旦你走得超前了,那就变成劣势了,一旦你走得落后了,那你整个的迭代是跟不上行业的发展。

今年我们基于 560 TOPS 的征程6P打造的 HSD,Horizon SuperDrive,我也和大家分享一下这个视频集锦,其实可以看到,我们基于数据驱动的方式可以很好地去应对复杂的路况,以及它会有对应的防御性驾驶,这些大家在特斯拉的系统上也可以看到类似的表现。

在这种全场景下的拟人表现,它会更加接近于老司机的驾驶行为,同时它会提高安全性。在中国,其实特斯拉有一点是做得不是特别好的,就是对于VRU(弱势道路使用者)的处理,因为美国的骑行者是非常遵守规则的,车辆基本要做的只是让行,但是在中国这个复杂的路况下,它还是要求有很强的博弈能力,这也是我们在中国这个场景下,可以发挥模型更高上限的地方,因为在美国是缺少这部分数据的。

所以最后这个稍微总结一下,就是我们认为未来产品应该化繁为简。从营销驱动变到真正的用户体验、产品力驱动,特斯拉其实给我们树立了一个很好的标杆,我们要围绕着 AI 发展的不变规律,以更大的算法,更大的模型规模、更大的算力和更好的用户体验来推动辅助驾驶和自动驾驶的发展。地平线一直有个 slogan 叫Journey Together,那我们也和各位行业同仁,包括各大 Tier-1 企业都有很好的合作,共同地服务我们的车企,以最快的速度,拿出高质量的产品,最终打动消费者,提供新时代的 “新自动挡”。谢谢大家!

竺延风:嗯,好,可以,挺棒。我想问吕总一个问题,你刚才提到的那个 500~ 560TOPS来讨论的“甜点位”的问题,而你今天推的征程6M是128TOPS 的,那么现在这个J6P 560TOPS模型或算力到什么程度了?在算法方面,现在的算法是否已经发生了彻底改变?就像产品开发一代,准备一代的节奏,你是不是已经为后续迭代做好了准备?就是500TOPS的算法和128 TOPS的算法相比是不是已经做了很大的变化?

吕鹏:竺总,我们的 HSD产品面向城区全场景辅助驾驶上规划了三档产品,采用了统一的架构,其中HSD 300是基于双征程 6M 来做的,算力达到是256 TOPS;HSD600是基于单征程6P来做,算力达到 560 TOPS ;还有一个HSD1200,是通过双征程6P来做的,算力达到1120TOPS,三档产品是统一的技术架构,统一的开发主线。它们的区别在于,主线开发完成后,我们会根据不同算力平台进行裁剪适配,不过裁剪就会有性能的损失,但产品价格相应有所不同。我之所以说产品有“甜点位”,是因为从行业角度看,产品竞争力每年都在提升,就跟手机性能逐年升级一样。

竺延风:我的问题是: 在 128 TOPS 算力情况下采用的算法,与即将推出的 560 TOPS 产品所采用的算法,是否存在本质上的不同?还是说这些算法都源自同一架构,只是在参数优化方法上进行了创新,或者是在原有方法基础上通过更快速度的迭代来提升性能?

吕鹏:我们现在都是采用纯数据驱动这种新方法在做,因为我们已经看到传统方式存在很强的限制性。正如我们之前提到的自动驾驶发展的三个阶段,若采用混合式或规则式方法,其实达不到很好的性能。但是如果用数据驱动的方式,其性能主要就是取决于模型规模大小。假设有一个模型有1万个参数,规模小一点的可能就是 5000,但是它们的模型结构是类似的。

竺延风:我第二个问题是关于刚才你提到的模型训练,主要是你们那个 560TOPS的,目前来看,这个模型的运行速度在行业内已经算是很快了,大家现在更多是在考量未来的发展。我想了解一下,你们这个模型所采用的架构,从宏观概念上讲,这个模型是主要通过训练得来的,还是依靠数据积累形成的?这两者之间的比例大概是多少?

吕鹏:在处理自动驾驶的过程中,首先可以确定的是,模型肯定是基于大量数据进行训练的。但数据方面有一个关键点,并非所有的数据都有用。市面上有人宣称自己用了 300 万个视频片段(clips),也有人用了 1000 万个,但这并不意味着用 1000 万个片段就一定比用 600 万个片段的效果好。因为最重要的是模型的基础架构要设计合理,底层构建要扎实。当然,在底层基础打好的前提下,数据自然是越多越好。

其实在 AI 智驾领域里,最重要的是学习优秀司机的驾驶数据。因为如果将全量驾驶员所有的数据都用于训练,大概率会训练出来一个比平均水平差一点的驾驶行为,而我们依靠的是专家级的司机车队,以及积累的量产数据来进行筛选。所以在 AI 领域里对于数据的筛选和选择是很关键的。

所转载稿件如有侵权,请与我方联系删除;邮箱:daogecaijing@126.com

评论

暂无评论
已全部加载