你的浏览器版本过低,可能导致网站不能正常访问!为了您能正常使用网站功能,请使用这些浏览器。
chrome
Firefox

工具栏

3000字长文,深度讨论AI技术如何赋能自动驾驶!


人工智能技术(AI)有那些好处?

人工智能技术是一套认知世界的方法,其方案更接近人类大脑的方式。最大的特点就是可学习,可成长。通过这套算法,可以模拟人类大脑,去认知和探索世界。

https://picx.zhimg.com/80/v2-8fb964f1c40c6d4ea053fda207e69306_1440w.png

人脑:如同星云一样的神经网络。人类的学习,就是通过外界的刺激,神经节之间不断的断裂,重新链接,建议了“刺激—响应”的链接。

传统算法:就是“如果—那么”的一系列判断的结合。初期的人类的自动驾驶,就是软件工程师们敲代码,编写无数行的“if-else”代码。但是,依旧无法取得突破性进展。

AI算法:模拟人类大脑的学习方式,建议基础的如同人脑一样的“神经网络”,我们要做的只是不断输入X,并且预设输出O,并且输入大量的数据(类比于小孩子受到的外界刺激),不断的促使模型形成正确的链接,输出正确的结果。我们发现,中间的“隐层”我们并不关心,我们只需要不断的训练即可。

这就很大程度上避免了“if-else”代码无法覆盖所有“自动驾驶”场景的问题。

https://img1.baidu.com/it/u=789291291,2017271944&fm=253&fmt=auto&app=138&f=JPEG?w=976&h=500

这就是AI的第一大优势,提供了一套认知世界的方法,可以处理复杂的自动驾驶问题。

不知道大家之前注意到机器人的发展没有,现如今汽车行业生产线工作,很多都被机器人替代。也就是自动化的发展,完全替代了那些重复操作的体力劳动。

同样的道理,现如今AI的发展,另外一个优势在于:将替换一部分重复操作的“脑力劳动”,进一步提高效率、降低成本。

https://pic1.zhimg.com/80/v2-b3ad3bb5208c7c20fc10f159ca36184f_1440w.png

对于汽车来讲,人工智能将“加速”自动驾驶落地

那么是如何加速的呢?我们以应用AI更充分的特斯拉为例,来进行说明。

一、特斯拉的自动驾驶方案

1.硬件-AP控制器(自动驾驶域控制器)

核心:特斯拉自主开发的 FSD 芯片+算法

特斯拉硬件方案已经进化到HW3.0 版本了,最重要的是配备两颗自己研发的 FSD 芯片

https://pic4.zhimg.com/80/v2-66f8ac6909bcdf4ff72da237d079328d_1440w.jpg

网络方面,AP 控制器内部包含以太网交换机和物理层收发器,此外还有 TI 的高速 CAN 收发器。对于自动驾驶来说,定位也十分重要, 因此配备了一个 GPS 定位模块。

外围接口,特斯拉整车的所有摄像头都直接连接到 AP 控制器,与这些相机配合的还有 TI 的视频串行器和解串器。此外还有供电接口、以太网接口和 CAN 接口使得 AP 控制器能够正常运作。

2.硬件-感知部件

核心:三目摄像头(纯视觉方案)

其实对于自动驾驶了解的人都知道,现在自动驾驶方案主要有两套,一套是视觉+雷达的”多传感器融合"方案,另外一套就是特斯拉的“纯视觉”方案。

https://pic3.zhimg.com/80/v2-477ad08480823b0cf1f8bdfaf9b7187e_1440w.jpg

特斯拉HW3.0硬件外围传感器:主要包含 12 个超声传感器、8 个摄像头(风挡玻璃顶 3 个前视,B 柱 2 个拍摄侧前方,前翼子板 2 个后视,车尾 1 个后视摄像头,以及1个DMS 摄像头)、1 个毫米波雷达。

https://pic4.zhimg.com/80/v2-434ac97985a1053bbc6a72cb4078893d_1440w.jpg

其最核心的前视三目摄像头包含中间的主摄像头以及两侧的长焦镜头和广角镜头,形成不同视野范围的搭配。

小结一下,硬件方面,特斯拉的技术核心技术壁垒就是其自己研发的FSD 芯片,并基于此的高效的视觉算法计算能力。更少的传感器的应用,使得特斯拉的“低成本”自动驾驶方案更具竞争力。

低硬件成本的方案就需要强大的软件处理能力来做支撑,那么特斯拉又是怎么在软件上突破的呢?

3.AI算法:庞大的“数据”支撑其算法更快的迭代进步

AI 算法方面,根据特斯拉官网人工智能与自动驾驶页面的描述,AutoPilot 神经网络的完整构建涉及 48 个网络,每天依据其上百万辆车产生的数据进行训练,需要训练 70000 GPU 小时。

小知识:深度学习网络使用串联式多层人工神经元,从经过软件识别与标上标记的数字图片中捕捉图片特征。其实,深度学习网络识别物体的方式与人类相同,首先认识某个细小的特征,然后把该特征抽象出来,应用至更广义、更抽象的概念中去。比如,人类的眼睛看到一双尖尖的耳朵,八根胡须和毛茸茸的尾巴时,总能快速地把以上视觉信息分类:“啊,是只猫!”。同样的,构建神经网络时,通过进行快速的个体特征分析确实是物品分类的一种办法,人工感知也由此更接近人类的感知水平。

https://pic2.zhimg.com/80/v2-9330e39586b4579f20039159a0b9d615_1440w.jpg

二、AI自动标注,能大幅降低数据标注的成本

注意上面深度学习中的关键词:训练,训练就需要有大量的数据注入到整个模型中去,而这些可注入的数据是需要经过标注(标上标记的数字图片)的。也就是哪里是人、哪里是车道线,那里是车辆等关键信息,都需要进行标注,才能进行训练。

https://picx.zhimg.com/80/v2-f57a837f248c13586d9c99462ba0dd90_1440w.png

传统的用于训练的图片标注,都是通过人工来处理的。2023 年 4 月毫末智行 DriveGPT 发布会显示,目前要得到诸如车道线、交通参与者、红绿灯等信息,行业人工标注的成本约每张图为5元,毫末 DriveGPT 的成本为 0.5 元。

https://picx.zhimg.com/80/v2-8d8cf616124579a7c1d3455c55315256_1440w.png

特斯拉 FSD 同样通过自动标注优化系统效率。他通过“多重轨迹重建”技术自动标注车辆行驶轨迹。据了解在集群中运行 12 小时即可完成 10,000 次行驶轨迹标注,取代 500 万小时人工标注。通过机器的自我训练,减少了人力标注成本高、效率低的问题。自动标注技术成熟,人工标注团队规模缩小。特斯拉2021 年人工标注团队为 1000 多人,2022 年 该团队裁员 200 余人。

三、基于AI大模型勾勒拓扑关系,摆脱对高精度地图的依赖

我们看到,特斯拉的自动驾驶另外一个重要的突破,就是摆脱对高精地图的依赖。

https://picx.zhimg.com/80/v2-8b3dc9b6e624826db36d61e2a132a9ef_1440w.png

最初 autopilot 使用的传统 link prediction,只能预测比较简单的道路,比如高速公路。要实现更加复杂的城市道路的拓扑关系预测,通常的方案就是:高精度地图。特斯拉创新性的使用了一种:导航地图+AI神经网络预测的方式,彻底摆脱了高阶自动驾驶对高精地图的依赖。

具体就是,特斯拉基于基础的硬件配置(摄像头+普通导航地图)+自创的 language of lanes 模型,来通用化地勾勒整个世界的道路信息。

https://picx.zhimg.com/80/v2-d10e5c834d67fa0a69f4119b380597fb_1440w.png

特斯拉对可能的行进轨迹进行预判并绘制成车道线

四、特斯拉:影子模式

对于汽车的自动驾驶来说,还有很多“小概率”场景是无法覆盖到的。而特斯拉为了强化自己的算法能力,发明了“影子模式”。

影子模式就是让“AI大模型”在车辆后台运行,模拟决策而不实际控车,不会对驾驶者及车辆产生任何干扰。但是在有异常场景或模型与人类驾驶员的决策不同时,触发数据采集及回传,对机器做出的决策进行“纠正”。

https://pic1.zhimg.com/80/v2-b6630310c328d0850bb949db6e342881_1440w.png

通过这套影子模式,一切行驶在路上的汽车,都在无形中训练着模型,提高模型的成熟度。

可以说是真正的在进化的自动驾驶算法。

总之,人类体力,脑力的局限,无法编写那么庞大的“if-else”代码,来覆盖所有自动驾驶车况。AI大模型本身就是实现自动驾驶的最佳(目前也是唯一)方案;其次,在AI大模型训练过程中,其庞大的数据处理需求,使得“AI标注”可以大幅度降低成本,进一步加速了自动驾驶的发展。

内容由作者提供,不代表易车立场

收藏

收藏成功 ! 去易车app查看收藏文章

猜你想看

+加载更多

活动推荐

广告
  • 奖 
  • 抢 
  • 奖 

CopyRight © 2000-2023 BitAuto,All Rights Reserved. 版权所有 北京易车信息科技有限公司    购车咨询:4000-168-168 (周一至周日 9:00 – 21:00) 法定假日除外