“端到端”会可不能杀死激光雷达?

时间:2024-09-12 09:15:24 推荐 599

近日,智能驾驶的热浪席卷了成都车展,其中值得关注的一点是,纯视觉的风头正劲,咨询界M7pro、小鹏MONAM03、深蓝S7乾崑智驾版,多款车型都推出了纯视觉版本。

在大模型等AI技术的加持下,以数据驱动代替以规则驱动的端到端方案,成为近来智驾的演化方向。在新的技术下,以摄像头为感知元器件的纯视觉方案,其智驾能力有了长足进步,而同为感知元器件,激光雷达则在一些新的车型方案中不见了踪影。

一时刻,舆论四起。激光雷达“落寞”了?关于不少追求降低成本的车企来讲激光雷达要被砍掉了?甚至,在智能驾驶的将来,激光雷达要被端到端“杀死”?

来自特斯拉FSD的启示

在智驾功能的感知元器件的应用上,特斯拉实际是不少国内企业的“镜像”与参考。特斯拉的CEO马斯克,一直特别坚定地反对激光雷达,他曾多次在公开场合表示“激光雷达毫无意义,关于自动驾驶汽车来讲没有必要”等等。

特斯拉对激光雷达的“无感”,除了可能出于CEO的个人好恶之外,也与激光雷达的成本息息相关,而支撑特斯拉可以抛弃激光雷达的,则是其出色的算法。

特斯拉依靠FSD架构,实现了仅靠纯视觉(摄像头)作为感知元器件,就能实现感知、规划、操纵的智驾功能,而算法则是其核心。今年1月,特斯拉FSD升级到了基于“端到端”的V12版本,改变了行业企业此前模块化智驾方案对规则、对激光雷达感知信息等的依赖,也带动一众车企和服务商纷纷转向,加码端到端。

所谓“端到端”,事实上是来自深度学习中的概念,英文为“End—to—End(E2E)”,指经过一个AI模型,只要输入原始数据就能够输出最终结果。应用到自动驾驶领域,意味着只需要一个模型,就能把传感器收集到的感知信息,转换成车辆方向盘的转动角度、加速踏板的踩踏深度以及制动的力度等具体操作指令,让汽车实现自动驾驶。

国内某头部激光雷达企业工程师程苒亦(化名)告诉记者,以往特斯拉不使用激光雷达而走纯视觉路线,要紧源于当时处于行业进展早期,动辄几十万元一枚的激光雷达价格关于量产车而言过于高昂。目前激光雷达进展已进入成熟时期,成本下降到千元级别状态,进入了低使用门槛的局面。

“但大模型技术的进展,使必须依赖激光雷达才能实现的智驾应用场景不断降低,而且随着不断进展,我认为有一定概率,这类应用会降到一个特别低的水平上。芯片的算力还在不断地快速提升,在端到端的助力下,视觉方案的能力上限显示出特别好的成长性。”国内某整车企业工程师告诉记者,“而且随着采用端到端方案的车型数量增长,数据量也会不断累积,推动训练效果会有更好的表现。这些都让我们推断,纯视觉方案会有更好的前景。”

双方的优劣势都有啥

但是,将来的智能驾驶,到底是谁的天下,可能还需要近一步来看端到端和激光雷达,谁“进化”更快。

首先来看激光雷达。

制约激光雷达上车最核心的因素就在于成本。但是,在今年的北京车展期间,速腾聚创发布了其新一代中长距离激光雷达产品MX,除了技术指标之外,速腾聚创打出了另外一个概念算是——“MX将以低于200美金的成本为基础实现第一个项目量产”。而“200美金”的概念,回应的算是一段时刻以来,行业因激光雷达成本而产生的“踟蹰”。另一家激光雷达服务商图达通也推出了千元机级别的905nm产品RobinE。

关于激光雷达的优势,程苒亦表示,智驾场景中,纯视觉仍存在一些尚无法较好处理的复杂事情,激光雷达在其中具有显著优势。例如目前各大车厂在卷的都市NOA中,带都市NOA功能的车大部分都搭载了激光雷达。而目前时期都市NOA遇到的诸多技术挑战,例如需要自车感知车道级定位,超出视觉感知场景库的异常小物体、人车混杂等事情容易漏判、误判,黑夜、逆光环境下等,这些技术挑战是现时期以视觉为基础的都市NOA系统难以应对的,需要激光雷达提供真实可靠的感知支持。

再来看看端到端。

端到端的“进化”几乎是“力大飞砖”。从去年开始,百度、华为、理想、蔚来、商汤等公司都开始快速切换技术路线,加速推动端到端技术的落地。由于端到端的本质是打通数据闭环的训练,解决CornerCase场景下安全性不高的咨询题,其核心是将功能模块神经网络化。于是其神经网络的参数规模通常特别高,带来对芯片的需求奇高。特斯拉打算在德州工厂上建设数据中心,以布置应用其10万张的GPU以及各种特斯拉自研的运算加速器。国内行业为了端到端开辟也有不少企业布置了千卡集群。

算力的提升,可以使大模型处理的参数数量明显提升,这将带来智驾效果上限的明显提升。但大模型的训练难度还是不低,以特斯拉为例,目前其FSD累计学习的人类驾驶视频片段超过2000万个,而这一规模的数据仅采集成本就需要50亿至80亿元。而显然,端到端也并非自动驾驶的最终形态,多模态的端到端可能是随后的技术方向。

车企会如何选择?

依照近期车型上市的事情梳理,我们能够明确地感觉到,智驾方案在分化。

例如8月21日上市的长城魏牌蓝山,搭载了禾赛科技的AT128;成都车展上首秀的极氪7X搭载了速腾聚创的激光雷达,同期上市的广汽埃安霸王龙520装配了速腾聚创M平台激光雷达。而在文章开头提到的车型,则坚定地走起了“纯视觉”路线。

“我觉得目前OEM对激光雷达的态度,事实上取决于多重因素。”国内某家智驾方案提供商的工程师林晟(化名)分析认为,“首先是智驾方案的多样性。即便是同一家企业当中,也会依照市场、用户需求,对车型进行区隔、定义,然后依照成本匹配不同硬件。所以我们将来会看到更多的企业,选择纯视觉方案、视觉+毫米波雷达、视觉+毫米波雷达+激光雷达等不同方案配置在自己不同的产品线上。高端一些的产品将搭载激光雷达,作为提升性能,增加冗余的配置,中档及入门的产品将采用摄像头、毫米波雷达的组合配置。所以从那个角度来看,激光雷达之于OEM与其讲是技术咨询题,不如讲是商业咨询题。”

“我认为另一个重要因素是芯片的成本。端到端的算法、训练都需要大量的芯片做支撑;纯视觉方案,对车端芯片的算力要求也比较苛刻,所以从那个角度来看,芯片的进步、成本的降低与激光雷达的性能进步、成本降低,构成了天平的两端。”林晟表示,“还有一个隐性的边界,算是消费者的感知。智驾表现不能单纯等同于‘堆硬件’,怎么让智驾功能的表现被用户感知到,认可智驾功能带来的价值,是特别关键的。”

“我们认为,端到端的视觉路线将与激光雷达方案在相当长时刻内并存,各自进展。思考到高速行驶极大压缩了决策执行时刻,感知距离和精度必然有更高需求,而全天候(昼夜、雨雪)的智驾功能实现,也需要感知有更强的抗干扰性。于是,我们认为激光雷达是智驾的必选项。”程苒亦认为,“与不同的技术路线同台竞技共同进展,更要求激光雷达可以进一步提升性能,进一步降低成本。”

来源:中国青年网