当前位置: 首页 > news >正文

AI智驾时代降临,端到端奏响“三重奏”

“追上未来,抓住它的本质,把未来转变为现在”,俄国哲学家车尔尼雪夫斯曾这样描述未来。而走到今天的新能源汽车,其通向未来的本质就是做好智能化。

呐喊智能化的口号,从2023年延续到2024年。如今,智能化的落点,从最开始的智能座舱、NOA智能驾驶等,开始转向新的轨迹。

近日,小鹏在广州举办“小鹏汽车AI智驾技术发布会”,向全球用户全量推送天玑系统XOS 5.2.0版本;其XNGP系统也将实现“不限城市、不限路线、不限路况的”全国全量开放。

此次发布会上着重突出的“端到端”“AI”等关键词,也暗示了业内新的共识——智能化的未来将向AI智驾看齐。

AI智驾时代已经到来

新能源车企智能化的步伐,从2023年迈出至今,或许已近半程。但时移世易,新的风向标也随之而来。

去年8月,广汽宣布正式推出广汽AI大模型平台,并将搭载于高端智能轿跑昊铂GT亮相;9月,华为云在华为全联接大会2023上发布盘古汽车大模型,并进一步探讨盘古汽车大模型在行业场景中的应用落地。

比亚迪璇玑AI大模型

今年1月,比亚迪推出了行业首创双循环多模态AI——璇玑AI大模型,首次将人工智能技术应用到车辆全领域。同年1月,蔚来推送了基于AI智能底盘技术打造的智能系统Banyan榕2.4.0。可见,AI大模型已经开始向新能源汽车渗透。

具体到应用场景上,大语言模型通过赋能语音助手,提升对乘客语音语义的理解能力,从而加速人车交互进化;视觉大模型通过优化感知,然后生成接近于真实的画面,从而降低传感器硬件使用成本,加速自动驾驶普及。

值得肯定的是,大模型在新能源汽车上得以应用,进一步打开了汽车智能化的想象空间,同时也预示着汽车智能化已经实现技术底层的突破。

只是,结合国内复杂的路况,单靠大量“小模型”堆砌,以及海量人工手写规则代码的辅助,始终难以穷尽驾驶时的各种情境,这也是近来各品牌高阶智驾车辆事故频发的主要原因之一。

此时,车企开始转而启用性能更强的“大模型”取代“小模型”,原本庞大的模块化结构,也开始变得简洁起来。之所以这样转变,是因为“小模型”堆砌相当于多模块组合后,各司其职,最后汇总处理结果,由于是多个“大脑”同时决策,处理结果容易发生冲突。

而“大模型”执行的是端到端的处理逻辑,从感知层的数据输入,到规控层的策略输出,整套流程都由一个或两个大模型搞定,处理效果的冲突性明显渐弱。

加之,AI可以通过学习和模仿人类的思考决策逻辑,并用端到端数据驱动算法迭代升级,从而取代传统的人工手写算法规则迭代,使得处理效率更高,决策错误率更低。

随着AI大模型逐渐成为汽车智驾跃进的解决方案,新能源汽车的智能化之路正式步入AI智驾时代,端到端大模型也成为业内争相追捧的热门。

华为、小鹏、特斯拉的“路线之争”

AI智驾趋势下,端到端大模型应运而生。这一思路最早由特斯拉提出,华为和小鹏紧随其后,抛弃规则、拥抱数据的“端到端”热潮,逐渐成为业界共识。

对车企来说,“端到端”首先是个非常好的营销概念,因为有热度和讨论度,所以发布相关概念产品,于品牌而言百利而无一害。但因为其定义模糊,市场上的端到端概念产品各有“特色”,最先入局的华为、特斯拉、小鹏便已经出现端到端落地路线上的分歧。

最早发声的特斯拉认为“端到端”应该是“一个模型走天下”。2023年12月,特斯拉的智驾工程师Dhaval Shroff 向马斯克提出建议,抛掉手写规则,搭建一张神经网络,让它大量观看人类司机的驾驶视频,并自行输出正确的行驶轨迹。直到今年1月,采用端到端架构的FSD V12正式向北美用户推送。据介绍,这一版本使用的正是单个端到端的神经网络。

而华为的ADS 3.0智驾系统,是用两个“大模型”,分别实现感知和规控的“端到端”;小鹏的XNGP则被分为感知XNet、规划XPlaner、控制XBrain三个部分。这一做法等同于将感知、规划和控制三个模块全部揉进一个模型中。

智驾的端到端与模块化方案

回顾过去数年,几乎所有的智驾企业都选择了与端到端“对立”的另一条路:模块化。在模块化的结构中,智驾系统被拆解为多个上下游连接的功能子模块,各模块彼此接力从而完成整个智驾任务。

由此来看,华为、小鹏的端到端大模型,更近似于模块化方案演变、融合后的结果,由多模块逐渐收缩为“感知-规划-控制”三模块,这一方案有进步但未完全突破。

尽管,模块数已经变少,但感知端为了保证规控端的平稳运行,仍有可能出现被迫丢失信息的情况,这是模块化结构一直存在的“硬伤”。

然而,只有保证系统在决策时获取足够全面的信息,其最终的决策效果才有可能达到全局最优。这是避不开的,同时也是与模块化结构最为矛盾的一环。

从技术角度来看,“端到端”极其依赖于大模型内部的神经网络结构,而神经网络本身又具备不可解释性,所以端到端的应用和界定一直是各执一词。但归根究底,成功落地、实现量产,提高驾驶安全性和便捷度才是智驾的核心。

过程或许不那么重要,结果才是。

新能源的“下半场”,端到端的“三重奏”

时至今日,端到端大模型的诞生,似乎为新能源车“下半场”的智能化竞争提供了一个确切方向,但是从进展来看,它还不足以将智能驾驶迅速推至终点。

因为,想要实现端到端大模型效果的最大化,车企和供应商们还有三大关卡需要面对。

1、数据需求激增

据悉,特斯拉从约32亿公里的行驶数据中挖掘了数万小时视频数据用于FSD训练。同时,也有自动驾驶工程师表示,训练端到端模型时,原始积累的路测数据仅有2%可用。可见,端到端模型对数据的需求量之大。

除了数据线需求庞大外,数据质量也是一大难关。小马智行的CTO楼天城曾表示,想要训练出高性能的端到端模型,数据质量的要求比一般性能模型高出几个数量级。

单论数据而言,目前国内车企的数据储备基本均落后于特斯拉,还处于初期阶段。加之对数据质量的要求,国内车企离数据积累的“长跑终点”仍“遥遥无期”。

2、算力需求激增

随着端到端自动驾驶的发展,训练海量数据所需的算力需求越来越高。对此,马斯克多次表示,目前FSD V12端到端模型的迭代,主要也是受到云端算力资源的掣肘,并计划重金堆算力。

图源来自汽车之心

眼见算力成了端到端的“必过关卡”,各大车企、供应商争相开始跑马圈地。有意思的是,这条路线上,行业也走向了分叉口。一方是倾向于重投算力的“大力出奇迹”,另一方是深耕算法的“工匠主义”。

从特斯拉、华为等头部车企都在重投超算中心的动作来看,算力提升,对应端到端智驾效果的天花板也会随之被抬高。或许,两条路径选择的背后,不仅有端到端战略规划的差异,也存在资本实力的差距。

可见,进入端到端阶段后,车企对训练算力的需求越高,也意味着需要更多的资金、人力和时间投入。这条路线走到最后,不仅是算力的比拼,也是综合实力的角逐。

3、商业化落地困难

端到端作为一个新的技术路线,堆算力、堆数据、加算法都是高门槛,抬高进场壁垒的同时,试错成本也在明显增加,入场企业需要仔细斟酌效率与成本之间的平衡问题。

即使完成了开发,而最后端到端方案的验证落地,也需要有合理且成熟的验证方式作为前提。直接实车验证显然成本过于高昂,而基于数据测试为主的开环测试,与端到端智驾所看重的可交互性并不匹配。

最后是落地市场的考验。目前,消费者之间普遍存在一种矛盾情绪。一方面对于汽车“智能化”和自动驾驶功能的兴趣与期望在上升,另一方面他们的支付意愿却在普遍下降。所以,即便完成了端到端智驾的量产,但却不被市场买单,一切愿景仍将化为乌有。

结语

进入AI智驾时代后,端到端模型的比拼愈演愈烈。基于算力、数据的需求,越早推出全国都可用的智驾方案,就能收集到更多数据,从而率先提升智驾能力,实现“强者愈强”。

这一路径,是包括特斯拉、华为、小鹏等头部车企正在做的事情,但是正在做不等于有结果。因此,最终局里上演的到底是弯道超车,还是黑马崛起,亦或是强者恒强,这都犹未可知。

作者:琴声奏响时

来源:港股研究社

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Hive-内部表和外部表
  • 【网络】UDP协议——传输层、端口号、UDP协议、UDP协议端格式、UDP的特点、UDP的缓冲区、UDP使用注意事项
  • LeeCode Practice Journal | Day30_GA04
  • Notepad++ 安装 compare 插件
  • AI表情神同步!LivePortrait安装配置,一键包,使用教程
  • 数据集——鸢尾花介绍和使用
  • AI问答:DIP / Big Data Diagnosis-Intervention Packet / 区域点数法总额预算和按分值付费
  • Python面试整理-自动化运维
  • 允许服务器支持密码直接连接
  • 重生之我当程序猿外包
  • CAPL使用结构体的方式组装一条DoIP车辆声明消息(方法1)
  • go程序在windows服务中优雅开启和关闭
  • 隐写工具steghide linux编译安装
  • uni-app 将base64图片转换成临时地址
  • 使用 Python 中的 ELSER 进行Serverless 语义搜索:探索夏季奥运会历史
  • [rust! #004] [译] Rust 的内置 Traits, 使用场景, 方式, 和原因
  • Laravel深入学习6 - 应用体系结构:解耦事件处理器
  • Logstash 参考指南(目录)
  • XML已死 ?
  • 关于Java中分层中遇到的一些问题
  • 猴子数据域名防封接口降低小说被封的风险
  • 面试总结JavaScript篇
  • 前端每日实战 2018 年 7 月份项目汇总(共 29 个项目)
  • ​草莓熊python turtle绘图代码(玫瑰花版)附源代码
  • ![CDATA[ ]] 是什么东东
  • # 计算机视觉入门
  • #QT(一种朴素的计算器实现方法)
  • #数学建模# 线性规划问题的Matlab求解
  • #我与Java虚拟机的故事#连载08:书读百遍其义自见
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • (iPhone/iPad开发)在UIWebView中自定义菜单栏
  • (ISPRS,2023)深度语义-视觉对齐用于zero-shot遥感图像场景分类
  • (NSDate) 时间 (time )比较
  • (附源码)计算机毕业设计SSM保险客户管理系统
  • (个人笔记质量不佳)SQL 左连接、右连接、内连接的区别
  • (学习日记)2024.04.04:UCOSIII第三十二节:计数信号量实验
  • (原)记一次CentOS7 磁盘空间大小异常的解决过程
  • (转)甲方乙方——赵民谈找工作
  • (转载)CentOS查看系统信息|CentOS查看命令
  • (最优化理论与方法)第二章最优化所需基础知识-第三节:重要凸集举例
  • .axf 转化 .bin文件 的方法
  • .Mobi域名介绍
  • .NET/ASP.NETMVC 深入剖析 Model元数据、HtmlHelper、自定义模板、模板的装饰者模式(二)...
  • .NET单元测试使用AutoFixture按需填充的方法总结
  • .net和jar包windows服务部署
  • ??在JSP中,java和JavaScript如何交互?
  • @hook扩展分析
  • @test注解_Spring 自定义注解你了解过吗?
  • [240903] Qwen2-VL: 更清晰地看世界 | Elasticsearch 再次拥抱开源!
  • [ACM独立出版]2024年虚拟现实、图像和信号处理国际学术会议(ICVISP 2024)
  • [C++] Windows中字符串函数的种类
  • [CC2642R1][VSCODE+Embedded IDE+IAR Build+Cortex-Debug] TI CC2642R1基于VsCode的开发环境
  • [C和指针].(美)Kenneth.A.Reek(ED2000.COM)pdf
  • [C语言][C++][时间复杂度详解分析]二分查找——杨氏矩阵查找数字详解!!!
  • [flume$2]记录一个写自定义Flume拦截器遇到的错误