汽车导航 汽车导航
Ctrl+D收藏汽车导航
首页 > 汽车资讯 > 正文

特斯拉自动驾驶的底层逻辑

作者:

时间:1900/1/1 0:00:00

本文基于公开信息,仅供信息交流之用,不构成任何投资建议。

如果机器人有大脑,它会是什么样子?

在科幻电影《我的机器》中,世界上最大的搜索引擎公司“蓝皮书”的首席执行官内森向观众展示了他发明的机器人大脑,并留下了一句话:“人们认为搜索引擎是人们思考的东西,但事实上,人们就是这样想的

特斯拉,发现,大众

这部电影于2015年上映,被认为是人工智能爱好者必看的电影之一,赢得了包括奥斯卡奖在内的多个国际电影奖。然而,在众多奖项中,唯一的最佳女演员是“最佳女配角”。埃里卡·维坎德也是电影中智能机器人“艾娃”的扮演者。

“Ava”是Nathan给“她”起的名字。为了创造能够独立思考的人工智能,Nathan使用自己的搜索引擎“蓝皮书”中的算法来构建Ava大脑的“思维”,使其能够学习人类的思维方法。

无独有偶,在特斯拉的自动驾驶人工智能中也可以看到希望机器具有人类思维。在2019年特斯拉自动驾驶日,Andrew Capassi明确向公众传达了特斯拉自动驾驶正在模仿人类驾驶,因为目前的交通系统是基于人类的视觉和认知系统设计的。

因此,特斯拉推出了一种“人工神经网络”,并使用大量有效的驾驶数据对其进行训练。在此过程中,特斯拉不断改进和迭代视觉算法,最终于今年年中取消了毫米波雷达。随着超级计算Dojo的出现,长期以来被批评只是一名助理司机的特斯拉离真正的自动驾驶又近了一步。

从学会驾驶,到成为一名更好的司机,驾驶得比人类更好,成为一名优秀的“老司机”是特斯拉不断优化自动驾驶的底层逻辑。

特斯拉,发现,大众

01

用于“云驱动程序”的神经网络

纯视觉自动驾驶解决方案是特斯拉的绝技,但它需要建立在计算机视觉的深度训练之上。

计算机视觉是一门研究机器如何“看见”的科学。当人类看到图像时,他们可以清楚地区分图像中的事物,例如美丽的风景或狗的照片。然而,计算机看到的是像素,它们是由图像的小方块组成的。这些小正方形有一个清晰的位置和相应的颜色值,计算机“记住”的是这堆数字字符,而不是特定的东西。

如果你想让计算机像人类一样快速准确地识别图片中的东西,机器还有一个人工大脑来模拟人脑处理图像信息的过程,它分为输入层、隐藏层和输出层。其中有许多人工神经元,可以看作是人类大脑初级视觉皮层中的锥体细胞和中间神经元。

整个训练过程也可以比作孩子通过图像识别物体的能力,通过反复输入、比较和校正来完成机器图像认知。通常,在训练的早期阶段,人工神经网络识别结果的准确性很低,输出结果与实际值的相似度可能只有10%;

为了提高精度,有必要将两层的误差从输出层传播回输入层,并在反向传播中校正神经网络隐藏层的参数值。经过数百万次训练,误差会逐渐收敛,直到输入和输出端的匹配度达到99%。?

特斯拉,发现,大众

上述过程是理解特斯拉自动驾驶AI的关键,但特斯拉开发的人工神经网络专注于驾驶领域,是一个专注的云驱动程序。对它来说,最好的学习材料是驾驶数据,而一个庞大、多样化的真实世界驾驶训练数据集是自动驾驶人工智能处理各种路况和交通问题的宝库。

在影子模式的支持下,特斯拉全球数百万车队时刻的驾驶数据成为这位云端“老司机”提升驾驶能力的养分。时至今日,特斯拉自动驾驶系统已经能够即时识别道路上的各种动态和静态目标、路标和交通符号,其响应速度甚至快于人脑调节。

特斯拉,发现,大众

人工智能司机除了需要处理日常驾驶场景外,还需要处理一些罕见的长尾情况。在2020年Matroid机器学习大会上,Kapasi以交通指示器STOP为例,解释了自动驾驶仪处理这些长尾情况的具体方法。

在日常驾驶中,车辆总是通过各种STOP指示灯。最常见的情况是路边或路中央的“停止”标志,红色背景上有白色字母。然而,在现实生活中,总有一些意想不到的情况,司机偶尔会遇到奇怪和奇怪的指标,这些指标需要结合具体背景来理解,包括但不限于以下几种:

STOP指示灯无效,例如被人抓住但没有意义;STOP指示灯,下面有文字说明,例如不受限制的右行;

STOP字母被树枝或建筑物遮挡的指示器。。。这些情况很少发生,但数量太多,无法列举。

当遇到上述情况时,人类驾驶员在大多数情况下都可以很容易地识别“STOP”,并对行动做出快速反应。但对于计算机来说,情况变得更加复杂,毕竟他们看到的不是一个特定的“STOP”,而是一堆毫无意义的数字代码。如果遇到现有训练数据集中没有出现的情况,例如上面提到的一些奇怪且相对罕见的指标,自动驾驶神经网络无法处理。

特斯拉,发现,大众

这种罕见的长尾数据通常是无穷无尽的,但必须学会在尽可能短的时间内应对。如果一切都交给人工操作,无疑将需要巨大的时间成本和资源。尽管Capassi在8月20日的人工智能大会上透露,特斯拉的注释团队已经达到了千人级别,但面对海量的驾驶数据,数千人仍然显得杯水车薪。特斯拉开发了一个内部数据离线自动注释和自动训练框架,称为“数据引擎”。

特斯拉,发现,大众

首先,在了解这些长尾情况后,特斯拉神经网络团队将汇编一个样本数据集,并创建一个用于学习和训练的本地小型神经网络,该网络将通过OTA部署到全球英语地区的特斯拉汽车上。

通过再次利用车辆阴影模式,每当实际驾驶情况与自动驾驶AI决策之间存在差异时,这部分驾驶数据将自动上传到特斯拉后端数据引擎。在被自动标记后,它将被重新整合到现有的数据训练集中,并继续训练原始神经网络,直到掌握新的数据。

这样,在大量训练数据的反馈下,神经网络变得“知识渊博”、更聪明,能够在不同条件下识别STOP标记,准确率从40%逐渐提高到99%,完成单任务学习。

然而,这只是关于学习一个静态信号。汽车行驶过程中会出现无数静态和动态信号,如路边树、路障、电线杆等,而动态信号包括行人、车辆等。这些信号被摄像头捕捉,然后通过神经网络进行训练和学习。目前,特斯拉的自动驾驶神经网络已经开发了9个主要神经网络和48个神经网络,识别了1000多个目标。

然而,仅仅学习如何驾驶自主人工智能是不够的。它还需要像有经验的人类驾驶员一样轻松、安全、平稳地驾驶。

02

摆脱拐杖,自动驾驶的最初成长

任何有经验的驾驶员都可以很容易地确定前方车辆在不同路况下与我们之间的距离,从而为行车安全留出一定的距离。

但对于传感器来说,为了确定物体的距离,有必要了解其深度。否则,在他们看来,距离我们10米和5米的两辆一模一样的车将被视为大小关系。

作为回应,一些汽车制造商选择了激光雷达路线来检测深度,而特斯拉则选择了一种模仿人类视觉的纯视觉算法来感知深度。然而,特斯拉首先开创了毫米波雷达+视觉传感融合路线,直到今年5月才正式宣布将取消毫米波雷达,推出纯视觉版的自动驾驶。

这件事一出,社会各界一片哗然,很多人都无法理解特斯拉为什么要拿走高性价比雷达,因为它只需要300元,还可以为行车安全增加安全保障。殊不知,在特斯拉早期的多传感器融合路线中,毫米波雷达的存在就像儿童学步车,只是帮助神经网络学习和训练深度标注。

在2019年的自动驾驶新闻发布会上,卡帕西这样介绍了毫米波雷达。他说:“让神经网络学会预测深度的最好方法是通过深度注释数据集进行训练。然而,与手动注释的深度相比,毫米波雷达反馈在深度数据方面具有更高的准确性。因此,毫米波天线的引入本质上是用来训练和改进神经网络对深度的预测。”。

值得一提的是,在他演讲的背景幻灯片的右下角,清楚地表明了自主……

毫米波雷达的驱动算法是“半自动驾驶”。翻译成半自动驾驶,很明显,当时的特斯拉自动驾驶仪只是一个半成品。

特斯拉,发现,大众

直到特斯拉的视觉算法达到可以取代毫米波雷达预测物体的深度、速度和加速度的水平,特斯拉的可视化算法才真正独立。

在2021 6月举行的CVPR会议上,卡帕西表示,毫米波雷达收集的数据存在“间歇性翻滚”甚至错误判断。他举了三个具体的例子:前方车辆的突然制动,前方车辆在桥下的速度,以及路边静止卡车的判断。

场景1:前方车辆突然刹车,毫米波雷达在短时间内已经6次失去目标车辆。在失去跟驰状态下,前方车辆的位置、速度和加速度均归零。

场景2:当一辆行驶中的汽车从桥下经过时,雷达将所有静止和移动的物体视为静止物体;

在这一点上,视觉传感计算行驶车辆的速度和位移,导致数据融合后的曲线传输错误信息,即前方车辆正在减速和制动。

场景3:一辆白色大卡车停在高速公路上。纯视觉算法在距离目标车辆180米的地方检测到白色卡车并进行预测,但融合算法直到110米才提供反馈,延迟5秒。

在上述情况下,纯视觉算法比雷达+视觉融合算法具有稳定且明显更好的输出,能够准确跟踪前方车辆的驾驶状况,并生成深度、速度和加速度等数据。

不仅如此,纯视觉算法还可以在雾、烟和灰尘等环境中保持前方车辆的速度和距离测量,因此移除毫米波雷达并不奇怪。根据特斯拉人工智能日发布的最新信息,特斯拉目前每周能够获取1万条人们在恶劣环境下驾驶的短视频,包括大雨、雪、雾、夜晚、强光等情况。通过学习和训练这些标记材料,神经网络可以在没有毫米波雷达的情况下准确感知前方车辆的距离。

特斯拉,发现,大众

可以说,特斯拉宣布夺走毫米波雷达的信心,是对其成熟的纯视觉算法的信心,而在无监督自学习的支持下,特斯拉的纯视觉迭代和改进明显加快。

今年7月10日,特斯拉纯视觉版FSD在美国正式启动内测。2000名受邀车主通过OTA升级到FSD Beta V9.0版本,其中大多数是特斯拉粉丝和中小KOL。YouTube博主Chunk Cook就是其中之一,他在工程和航空航天方面也有一些专业知识。

系统更新一完成,CC就开始新版本的FSD道路测试,并将测试视频上传到输油管道。在视频中,他来到一个T形路口,那里有大量车辆,速度很快,准备进行转弯测试。结果显示,7次中只有一次FSD成功完成了自动驾驶,其余都需要手动接管方向盘才能完成驾驶。

但很快,当FSD在7月底推出新版V9.1时,CC发现升级后的FSD表现出乎意料。他再次在同一条道路上进行了七次自动驾驶测试,结果显示,七次测试中有四次成功完成了自动驾驶,但在转弯速度上有一些“犹豫”,这并没有表现出老司机应有的果断。然而,就综合得分而言,新版自动驾驶的表现优于旧版。

8月16日,特斯拉FSD升级至新版本V9.2,CC也率先进行了视频测试和上传。这仍然是一个路段,但测试时间改为晚上。他公开表示,这次最明显的改进是自动驾驶仪的加速性能,它可以像人类驾驶员一样在转弯时果断加速。

在过去的一个多月里,纯视觉自动驾驶在同一条道路上取得了快速进展,而其背后隐藏着人工神经网络强大的自学习能力。马斯克表示,FSD测试版V9.3和9.4已经在准备中,并将根据车主的使用情况不断优化细节,以改善用户体验,并为V10版本的重大变化做好准备。

03

Dojo装载并模拟限制

需要注意的是,尽管许多特斯拉纯视觉自动驾驶系统的资深驾驶员都感到惊讶,但他们不能忘记,这些道路测试大多发生在北美,而在人口稠密的亚洲等非英语地区,城市道路交通的复杂性与人口稀少的北美大不相同。因此,如何使神经网络学会应对各种路况和交通是值得考虑的。

收集现场数据是其中一种方法,但前提是有大量车队在该地区行驶,另一种解决方案是对自动驾驶进行模拟测试。简单地说,模拟是使用真实数据在计算机系统中重建和再现真实世界的实时动态场景。

除了模拟不同城市的交通状况外,模拟测试还可以模拟一些极端场景,例如各种突发交通事件或极为罕见的交通状况。在人工智能日,特斯拉的工程师们提供了具体的……

c例如,包括在高速公路上奔跑的行人、大量行人或非常狭窄的行驶道路。

这些情况往往非常极端,出现在日常驾驶场景中的概率也很小。然而,正是因为如此,通过模拟训练神经网络才有真正的价值,只有通过训练,神经网络才能学会正确响应。

为了真正发挥训练作用,这些模拟测试必须充分再现真实场景,包括道路上的各种行人、车辆、绿色森林、路障、信号灯等,几乎包括你在道路上看到的所有交通元素。目前,特斯拉已经创建了3.71亿张车内网络培训图像和4.8亿个标签,数据规模仍在迅速扩大。?

特斯拉,发现,大众

应该注意的是,模拟测试所能达到的逼真程度与计算机所能提供的数据处理能力成正比。特斯拉人工智能的模拟能力越强,对硬件算力和读写速度的要求就越高。

马斯克曾在2020WAIC大会上表示,计算机视觉已经超越了人类专家的水平,但确保计算机视觉实现的关键是计算能力的大小。因此,特斯拉准备了顶级超级计算机Dojo,以确保所有计算都能高效准确地完成。

在人工智能日,超级计算Dojo展现了它的本色,内置3000个Dojo 1芯片,组装成峰值计算能力为1.1 EFLOPS的ExaPOD,超过了世界上速度最快的超级计算公司富岳,成为世界第一。发布会结束后,马斯克在推特上回应了网友的提问,并表示ExaPOD的计算能力足以模拟人脑。

目前,高性能野兽Dojo专注于训练特斯拉的自动驾驶神经网络。有了它,神经网络的学习潜力突然变得不可估量。在这一点上,特斯拉还整合了自动驾驶的三大要素:数据、算法和算力,为推动L5级自动驾驶做好了软硬件准备。

然而,特斯拉要想快速实现自动驾驶的终结,还有很长的路要走,包括法律和道德挑战。?

本文首发于微信公众号:博科。文章内容属于作者个人观点,不代表和讯网络的立场。投资者应据此操作,并承担风险。

标签:特斯拉发现大众

汽车资讯热门资讯
言辞激烈 握好手机 无脑留言大回怼!我们给日系车洗白?

不久前发布了一篇关于日系车的内容。详细的讲解了碰撞测试有一个环节叫行人保护,也解释了为什么保险杠要用塑料的。有兴趣小伙伴,可以点击下方文字链接去回顾一下。

1900/1/1 0:00:00
加水就能跑!金华青年汽车等21家相关企业破产清算

2019年,一篇名为《水氢发动机在南阳下线,市委书记点赞》的文章在网络引发热议。根据报道,青年汽车集团因宣称使用“水氢发动机”,车辆只需加水即可行驶。

1900/1/1 0:00:00
颜值在线 空间能打 新款帝豪L 10万级家轿王座稳了?

在自主紧凑型轿车市场中,目前呈现出两强争霸的局面,其中帝豪系列绝对称得上是传奇车型了,相对发展历史较长,持续热销程度与认可度极好,即便现款在售车型已经略显老旧,但依旧有着可观销量,

1900/1/1 0:00:00
比亚迪半导体成立新公司注册资本49亿

新浪科技讯8月25日上午消息,天眼查App显示,8月24日,济南比亚迪半导体有限公司成立,注册资本49亿,法定代表人为陈刚,经营范围包括半导体分立器件制造、销售;电子元器件制造;

1900/1/1 0:00:00
特斯拉劲敌Rivian建新工厂:产能20万辆 工人最低年薪36万

和中国市场一样,在特斯拉先入为主的背景下,美国也诞生了一大批造车新势力。不过,被曝出PPT造车,试装车为套壳车的Nikola,目前造假已经基本被实锤,被淘汰出局已是早晚的事。

1900/1/1 0:00:00
二马合一!长安汽车发布长安马自达收购一汽马自达声明

8月24日,长安汽车000625股吧发布关于长安马自达汽车有限公司增资项目的联合声明。

1900/1/1 0:00:00