你的浏览器版本过低，可能导致网站不能正常访问！为了您能正常使用网站功能，请使用这些浏览器。

chrome

Firefox

网站地图

全部频道：

车型

图片

视频

直播

文章

评测

导购

报价

经销商

降价

点评

社区

易车号

新能源

商用车

裸车价

二手车

购车服务：

超值特惠

分期

鲨鱼车展

实用工具：

车型对比

购车计算器

贷款计算器

卖车估值

查看更多>>
移动应用

易车app
手机扫码快速下载


易车小程序
手机扫码打开
 手机易车易车汽车报价淘车车易鑫金融
出版

工具栏

理想L7

中大型SUV指数排行第20名

从老婆开车到自动驾驶：李想的技术路线思考

作者：电动汽车观察家
2024-06-11 15:16
460

自从特斯拉不举办AI DAY以后，中国智能驾驶行业对于未来的技术路线，似乎失去了方向。

大家争先恐后爱说的“时髦话”，也止步于“端到端”了。

出人意料地，“好久没出来的”李想，给出了一个自动驾驶技术路线的新思考。

在2024年6月8日举行的2024中国汽车重庆论坛上，理想汽车董事长兼CEO李想发表了关于自动驾驶技术路线的思考。

“端到端+VLM（视觉语言模型）+生成式的验证系统，会是未来整个物理世界机器人最重要技术架构和技术体系。”

李想认为这一技术路线“法力”足够强大，基于它，“最早在今年年底，最晚在明年上半年，真正有监督的L3自动驾驶就可以批量向用户交付了，而不是做实验。”

而且，“L4级别无监督的自动驾驶在三年内一定能够实现。”

很激动人心的展望。

先不说理想汽车这一技术路线是否“画大饼”，李想还说，“最近本月还有下月还有几个关键AI方面的技术论坛里，我们技术研究的同事也会向整个行业来分享我们对这方面的研究。”

尽管近期，业界风传“理想智驾团队裁员至1000人以内”。

但是，对于自动驾驶研究，人多未必力量大。

李想和理想汽车希望在自动驾驶领域更多的发声，来和特斯拉、华为、小鹏争夺自动驾驶、智能驾驶的话语权和标签，提升理想汽车在各个层面的吸引力。

01

从老婆开车思考自动驾驶

“我的爱人刚学会开车，连续好多年都不停地刮蹭。你和她分析下一次怎么不刮蹭，还是没有用，还是刮蹭。”

李想说，最后他给他爱人报了宝马驾驶培训的初级班，此后才不再剐蹭。

他的意思是，学习cornercase没有用，需要通过提升能力解决问题。

人类是这样学习驾驶的，AI也应当如此。

所以，如果“自动驾驶团队每天干的活都是靠人工去调试各种各样的cornercase，而且人越多，cornercase越多，离真正的自动驾驶就越遥远。”

那正确的做法是什么？

他介绍了一本书《思考快与慢》的启发。

李想曾多次推荐《思考，快与慢》

核心意思是，大脑分成系统1和系统2来工作。系统1来处理一些直觉、快速响应的事情。“很多时候我们在开车，脑子在想别的事情，但我们仍然在处理路上的各种事情，这就意味着我们用系统1在工作。”

“当去到一个复杂的路段，比如十字路口或者遇到一个水坑，这时候调用大脑系统2工作，处理复杂逻辑推演的能力。”

处理简单问题的自动驾驶系统1，李想说，今天很多自动驾驶团队都用端到端技术来解决，效率更高。

但是包含三个挑战：一是要有真正做端到端及数据训练的人才，二是需要真正高质量的数据，三是需要足够多的算力。

李想说，理想汽车“大概放入了100万Clips（视频片段），用于端到端的训练，大概一个月十轮左右的训练，基本就可以完成一个无图NOA的上限水平。”

处理复杂路况的系统2，李想认为不能依赖解决cornercase，而是要提升能力。

他认为需要用VLM，即视觉语言模型，来提升能力。

现在，由于ChatGPT等应用的示范，大语言模型LLM很火。但他认为大语言模型在云端使用，响应速度慢，遇到问题还来不及反应就车毁人亡了。

“所以我们还是思考如何把一个视觉大语言模型进行足够压缩，最后放到车上去。”

李想还说，VLM能够让自动驾驶告别高清地图。因为视觉的语言模型能够像人类一样去读懂导航地图。

找到技术方案分别解决系统1和系统2问题之后，还需要对能力进行验证。

理想的方案是，用类似Sora的技术，构建一个小型的视觉模型，来检测自动驾驶的能力。

Sora和ChatGPT出于同门，也是美国人工智能研究公司OpenAI的作品。Sora可以根据用户的文本提示，创建最长60秒的视频。OpenAI将它视作世界模拟器。

Sora生成的视频中的一个画面

Sora在今年春节期间发布，视频逼真效果引起震撼。当时，就有智能驾驶业界人士评论，Sora或可以用于自动驾驶模拟训练。但也有人表示，Sora会生成大量不符合物理规律的视觉内容，并不可靠。

李想总结，理想汽车过去一段时间自动驾驶最重要的技术突破就是——端到端承载人的系统1，VLM来承载人的系统2，并应用生成式的小的视觉模型来进行考试。

他还说，这一方案“已经完全通过了正常的研究验证。”

李想会提出VLM来解决自动驾驶问题，不是突然兴起。此前，理想汽车与清华大学交叉信息研究院一直在进行联合研究。今年2月，双方团队联合发布了论文《DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models》。

根据该论文，双方提出的DriveVLM模型，在 nuScenes（一个公开的可供测试的自动驾驶数据集）规划任务上取得了最先进的性能（下表）。

基于这一技术路线，李想对理想汽车和全行业的自动驾驶进展非常乐观。

他表示，最早在今年年底，最晚在明年上半年，真正有监督的L3自动驾驶就可以批量向用户交付了，而不是做实验，“并且随着这套技术的演进、算力增强，我认为L4级别无监督的自动驾驶在三年内一定能够实现。”

02

理想智驾现在什么水平？

李想此时发布理想汽车对于自动驾驶的技术路线，很多人可能不服。

就当前的智能驾驶、自动驾驶实践来说，全球市场特斯拉独领风骚，国内华为和小鹏更被认可，理想汽车在前列，但绝非引领者。

从车辆当前的智能驾驶水平而言，消费者有感知的还是功能和功能可用性、体验性。

功能层面，当前对比的“科目”，一般而言就是可以根据导航和限速自动行驶的辅助系统——高速领航驾驶和城市领航驾驶。

如今，第一梯队都至少具备了高速领航功能，并且实现了高速和快速全覆盖。

在城市领航驾驶方面，华为系（问界、阿维塔、极狐阿尔法HI版、智界）和小鹏覆盖范围最广，理想汽车大概在第三名或者第四名。

目前，理想汽车正在进行近千人规模的AD MAX 3.0进阶版测试，核心功能是实现无图城市NOA，要做到全国都能开、有路就能开。

这一版本就是李想所说的，即将在今年三季度正式推送的版本。

如果这一版本能够顺利推出，那就在功能和覆盖范围上，理想就可以追平华为了。

李想在提及此事时还说，届时，理想也会向测试用户提供通过300万Clips训练出来的端到端+VLM的一套监督型自动驾驶体系（即L3）。

并且，“最早会在今年的年底，最晚明年年初，我们会推出超过1000万Clips训练的端到端+VLM的带有监督的自动驾驶体系。”

按照李想同一场合的说法，这一系统，就是可以交付的“真正有监督的L3自动驾驶”。

目前的理想汽车，还未完全从此前MEGA受挫等一系列的挫折中摆脱出来。

首先是MEGA受挫后，内部启动了矩阵组织2.0的升级，其次，理想汽车启动了大范围的裁员。据《21世纪经济报道》等媒体报道，五一过后，理想汽车开启了一轮比例超过18%的优化行动。

到目前为止，本轮优化已经基本结束，包括裁员重灾区智驾部门。

在产品层面，李想在一季报电话会上宣布，原本计划今年发布的三款纯电推迟到明年发布。今年重点还是经营L系列。

在销量上，理想汽车5月交付3.5万辆，同比增长23.8%，环比增长35.8%，在新势力新品牌中依旧可以排名第一，比华为系——鸿蒙智行（问界、智界）更多。

只是，理想汽车2024年的目标颇高。最早理想汽车曾定下80万辆目标，3 月 21 日，下调到56 万-64 万辆。

《晚点汽车》近期还报道说，在三款纯电 SUV 延期发布之后，理想再次下调全年销量目标。

在组织、产品、智驾等方面的大调整之后，理想汽车需要更多时间来修复外界预期和内部士气。

在一季报电话会上，有分析师问李想，如果销售不如预期，理想汽车会不会再次降价。

李想当时的回应是，理想L系列订单增长很快，没有任何降价计划。

最新的消息是，理想汽车6月8日宣布推出端午节限时购车礼包。

6月18日前定购理想 L7、理想 L8、理想 L9，可以享受最高价值 2798 元限时购车礼（用车服务包）及价值 10,000 元限时购车权益。

如此看来，理想汽车的销量也还不够好。

不过，如果理想汽车能在智能驾驶、自动驾驶上后发先至，现在的一切困难，都是浮云。

就看看今年底、明年上半年理想汽车能否交付有监督的L3级自动驾驶了。

标签: 理想L9 驾驶自动驾驶

内容由作者提供，不代表易车立场

收藏成功 ! 去易车app查看收藏文章

猜你想看

排行榜

相关资讯

CopyRight © 2000-2023 BitAuto,All Rights Reserved. 版权所有北京易车信息科技有限公司购车咨询：4000-168-168 (周一至周日 9:00 – 21:00) 法定假日除外