自动驾驶汽车是如何工作的?加速使用的是什么原理?如何实现自动导航?刹车原理是什么?自动驾驶车辆如何感应周围环境?如何确保驾驶安全?自动驾驶汽车如何减少能源消耗?自动驾驶汽车如何避免碰撞?自动驾驶汽车的

马斯克,将给中国自动驾驶产业来一次降维打击

“特斯拉正在对中国自动驾驶产业进行一次釜底抽薪式的打击,一旦成功,将是颠覆性的。”

以上这段话并不是危言耸听,而是因为我们对特斯拉了解的太少,所以特斯拉每一次技术的发布、策略的调整,都会让我们措手不及,就像一条搅乱生存环境的鲶鱼。

“一切恐惧皆来源于未知”,只要不让自己保持未知,那就不会恐惧,所以我们分析一下“特斯拉电音之王”“火星皇帝”“真人版钢铁侠”埃隆·马斯克最近整了什么活,才会对中国自动驾驶产业产生这么大的威胁。

就在近日,马斯克本人亲自上阵,驾驶老款Model S开启了一场试驾直播,时长45分钟,引发千万网友观看,本次测试的主角,正是特斯拉尚未发布的新版自动驾驶系统“FSD Beta v12”

早在几个月前,马斯克就曾在社交平台上表示,FSD Beta v12 将采用端到端的方式,输入视觉等信号,输出转向、刹车、加速等车辆控制信号,与现有版本将有很大差距。而随着本次测试,数百万网友也终于一睹FSD Beta v12的庐山真面目。

然而,在自动驾驶测试的第19分钟,FSD Beta v12却出现了一次“试图闯过红灯”的失误,让许多网友怒喷,毕竟在自动驾驶领域,安全永远是第一位。

但如果你只关注到了直播中的失误,那只能说明你不懂FSD Beta V12,也不懂马斯克。

FSD Beta v12,是否成功?

马斯克的这次测试,出发点是位于美国加利福尼亚州帕洛阿托的特斯拉总部,而在这次旅途中,马斯克一共选择了三个终点。

首先是在地图上随机选择的同样位于加州的斯坦福,其次是脸书的创始人扎克伯格的家,最后又回到了帕洛阿托。

在整个行驶过程中,搭载了FSD Beta v12的特斯拉Model S先后实现了:

在交叉路口等待信号灯的变化、在信号灯变绿后开启平稳地左转、在减速带面前缓慢通过、礼让行人、在施工区域顺利通过、在环形交叉路口等待前方车辆通过,并在到达最终目的地后自动将车停在了合适的位置。

据马斯克表示,整个过程是通过人工智能和摄像头实现的,就如同我们大脑和眼睛一样。并且,在道路上遇到的很多建筑和交通标志都是车辆从未实地见过的,但车辆依然实现了完美的通过。

尤其是在经过环形交叉路口时,马斯克再次重申,团队从来没有对环形交叉路口的概念进行过任何编程,只是向系统展示了一系列关于环形交叉路口的视频。

也就是说,FSD Beta V12已经不需要对每个路段进行独立的编程,仅仅通过向AI输入大量的视频,就可以让FSD的AI去学习人类的处理方式,根据不同的路况做不同的决定。

这就是前文中提到的,马斯克所说的“端到端的输出”。换句话说,就是让AI像有了独立的思考能力一样,学习人类的驾驶习惯驱动车辆。

而在本次测验中,驾驶到第19分钟时,车辆却出现了一次“试图闯红灯”的动作,好在马斯克和旁边的工程师及时接管车辆,阻止了这一行为。

马斯克也表示,FSD Beta v12目前仍处在调试中,这也是至今还没有正式发布的原因。

那么,FSD Beta v12的表现是否成功呢?

显然并没有。虽然全程只有1次干预,但一旦驾驶员没有及时反应,那这一次干预就有可能是致命的,除非你全程紧盯着它,随时做好接管准备。

这就意味着,只要车辆有一次干预的可能,那么你就需要全程干预。

由此可见,FSD Beta v12仍不成熟。当然,这毕竟是仍在调试中尚未发布的版本。

事实上,在这场直播中还有更值得我们关注的事情,那就是马斯克所说的“端到端自动驾驶”,这种方式让我们看到了人工智能在自动驾驶领域的无限潜力,也是与实现自动驾驶方案的另一条路。

自动驾驶的第二条路

在了解端到端之前,我们要先了解当下主流自动驾驶的达成方式。

主流的自动驾驶是模块化的,将自动驾驶任务拆分成多个模块,每个模块再完成对应的任务,包括感知模块、定位模块、决策模块、路径规划模块,以及控制模块,每个模块下还存在众多小模块。

举个例子:

当我们在智能驾驶的过程中,车辆识别红灯后自动停车的现象。

其中摄像头、雷达等感知模块就会负责感知信号灯的存在和当前道路的情况,然后定位模块就会定位车辆所在的位置,再将数据上传到决策模块,由决策模块通过算法作出决定,再进行当前的道路规划,最终将停车的指令传达给控制模块,让车辆停下。

虽然整个链条看起来十分流畅,但这种自动驾驶方案却存在部分问题。

首先,由于模块较多,并且每个模块所在的模型都需要进行单独的训练、优化,随着模型的进化,需要的训练也越来越多,所需要的的研发人员也随之增加,研发成本极高

其次,模块化的架构是逐级进行的,如果一个模块出现误差,就有可能在下一级中被放大

最后,各个模块相互独立,可能会出现重复计算的现象,导致算力资源出现浪费

那么,如果将这些模块所在的模型整合在一起,通过一个大模型实现所有模块的功能,是不是就能规避以上问题?

仅将感知到的图像数据输入大模型,其内部的神经网络就能输出启停、转向等动作,这种将所有算法都交给神经网络负责的方式,就叫做“端到端”。

那么大模型中的神经网络凭啥这么优秀呢?

关键就在于神经网络的算法模拟了人脑的处理方式,通过学习大量的视频数据,就能根据这些视频提供的行驶经验做出判断。

如前文中提到的马斯克团队从来没有对环形交叉路口的概念进行过任何编程,只是向系统展示了一系列关于环形交叉路口的视频,车辆就能安全通过环形交叉路口。

再比如车辆会车时,由于模块化的自动驾驶基于规则驱动,代码的规则设定让对面的车先走,就一定是对面的车先走。

而端到端的方式是根据人工智能学习到的大量视频数据驱动的,它会根据道路情况进行自主式的判断,决定是自己先走,还是对面先走。

这就是人工智能的强大,它可以通过学习大量的数据,让智能驾驶的表现更像是真正的人类在操作。

马斯克为何押注“端到端自动驾驶”?

关于这件事,我们可以从两方面分析,即马斯克过往的经历和正在从事的产业。引申开来,就是过往与人工智能结下的不解之缘,以及如日中天的特斯拉。

从个人经历来看,马斯克的父亲是一名机电工程师,在父亲的启发下,马斯克对科技十分痴迷。早在10岁时,马斯克就学会了如何编程,并在12岁时成功用编程设计出了一款太空射击游戏。

到了1992年,马斯克转入美国宾夕法尼亚大学沃顿商学院读书。要知道,美国作为芯片的发源地,凭借技术积累和先发优势,早已构建了全球最完善的产业链。高通、英伟达、TI、英特尔、AMD、赛灵思等等知名芯片巨头,全是美国公司。

而在软件、互联网等领域,美国也有数不尽的人才储备和无数的行业巨头,如Google、微软、苹果等等。

这就导致了美国有着极其浓厚的科技氛围,这与初来乍到的“赛博”马斯克也不谋而合。最终,在1995年,马斯克选择创业。

再看马斯克的部分商业履历,也与人工智能领域密不可分:

2013年,马斯克投资了人工智能公司DeepMind;

2015年,马斯克与其他合伙人联合创立了人工智能研究公司OpenAI;

2016年,马斯克创立了脑机接口公司NeuraLink;

近年来,特斯拉先后收购了DeepScale、GrokStyle、Perceptive Automata等人工智能公司。

由此可见,马斯克通过多年来的运营,早已让旗下的产业吃透了人工智能的多个环节。在2022年的AI Day上,马斯克更是大胆地表示:“我们是人工智能在现实世界应用的无可争议的领导者。”

更恐怖的是,马斯克有一个与众不同的优势,那就是商业落地能力,它的特斯拉、火箭公司、超级高铁公司、OpenAI等等都能在马斯克神奇的运作下,实现商业落地。

由此可见,与其说特斯拉是一家汽车公司,倒不如说它更像是一家科技公司,而汽车只是其承载人工智能科技业务的载体。

再说说产业方面,人工智能在特斯拉的电动车上,也有着极其有前景的应用,尤其是自动驾驶。

前文中我们提到过,主流的自动驾驶是模块化的。彼时的小鹏智驾负责人吴新宙和理想智驾负责人郎咸朋都曾表示,完全的端到端方案在很长一段时间内都会处于技术探索的状态。

虽然事实如此,但近年来的智驾算法中,神经网络的占比却在不断提高,小鹏和理想也先后表示在智驾中加入了神经网络的算法,也侧面突出了神经网络的未来可期。

而特斯拉这种完全将智驾交由神经网络的端到端方式,除了能让汽车更加拟人化,还有一个巨大的优势——成本

要知道,端对端的方式仅需要一个大模型,不需要传统主流方案的那么多模块,所以可以更好的集中资源训练、优化,不需要冗长的代码,这就节约了很多研发、调试成本。同时也可以避免模块化自动驾驶出现的级联误差问题,系统上限大幅提高。

例如在马斯克在直播测试时就多次表示,V12系统从头到尾都是通过AI实现。我们没有编程,没有程序员写一行代码来识别道路、行人等,全部交给了神经网络。

此外,这种端到端的方式也不需要价格昂贵的激光雷达,仅需多摄像头的组合就能实现,传感器方面的硬件成本也能做到大幅降低。

可见,无论是出于个人角度,还是站在商业角度,马斯克都有着充分的理由,将人工智能作为主要方向,布局端到端的自动驾驶。

“端到端”的落地难题

尽管我们已经可以想象到端到端自动驾驶带来的无限潜力,但现阶段它依然存在着不少问题,这也是阻碍其落地的原因。

首先就是“可解释性”问题。

俗话说“人类的一切恐惧都来源于未知”,而模块化与大模型就是已知和未知的状态。

由于模块化的每一个步骤,每一个代码,都是技术人员提前设定好的,所以我们能清楚知道它的运行逻辑。

而搭载神经网络的大模型,可以通过学习人类的驾驶思维来进行决策,我们根本无法判断它为什么会做出这样的决策,甚至连判断逻辑,我们也知之甚少,只能通过不断输入大量的正确资料去引导它做出正确的决策,这就导致了系统的“黑盒”化。

如果让这样一个相对未知的东西去控制车辆的自动驾驶,人们的安全性显然无法得到保障。

其次,神经网络算法需要大量的算力。

举个例子,前段时间大火的ChatGPT,其运行过程就是典型的“端到端”方式。仅仅输入问题,就能得到回答。有论文显示,若将ChatGPT级别的神经网络用于汽车上,大概需要1018 FLOPS算力,相当于10万张英伟达A100的GPU。

然而,ChatGPT的实力懂的都懂,虽然已经是人工智能领域的现象级产品,但胡言乱语、答非所问的情况也依然不在少数。因此,对于复杂的自动驾驶来说,其算力门槛只会更高。

最后,端到端需要庞大的数据支撑,而且必须要是正确有效的驾驶数据,这显然也是个需要长时间积累的领域。

值得一提的是,特斯拉的超级计算机平台Dojo已经开始投产,大量的算力将用于神经网络训练,而特斯拉中国也表示,已经在国内建立了数据中心,并且数据都会储存在中国境内。

可见,端对端的自动驾驶或许真的离我们不远了。

结语

眼睛观看路况,手脚做出反应,这是人们最常见的驾驶方式。

将图像输入大模型,再对车辆做出反应,端对端自动驾驶显然更接近人类,将自动驾驶的大模型拟人化,让它拥有接近人的思想,学习人的行车逻辑。一旦落地,对整个自动驾驶行业必将是颠覆性的存在。

所以这次直播中的重点,从来就不是FSD Beta v12的表现,而是隐藏在FSD Beta v12背后,基于人工智能产生的端到端自动驾驶方式,这才是值得我们关注的。

尽管FSD Beta v12的表现没有令我们满意,但别忘了,在摩尔定律的加持下,芯片的性能每两年就会提高一倍,两年之后会怎么样呢?五年之后呢?

由此可见,马斯克的重点或许从来就不在电动汽车上。

他只是通过电动汽车为载体,造拟人化的机器人罢了。

2024-03-14

后面没有了,返回>>电动车百科