汽车导航 汽车导航
Ctrl+D收藏汽车导航
首页 > 汽车资讯 > 正文

距离超越特斯拉,还有X天

作者:

时间:1900/1/1 0:00:00

两年前,《日经亚洲评论》发表了一篇报道:研究人员在拆解Model3后发现,自动驾驶硬件3.0不仅是自动驾驶系统和多媒体控制单元的核心,也是特斯拉摆脱其他竞争对手的关键武器。

高性能的硬件平台是应对海量数据预期增长的基石,也是自动驾驶系统不断完善的技术支撑。事实也证明,特斯拉近年来一直走在自动驾驶队伍的前列。但显然,这只是开胃菜。数据是压轴选手。

Tesla, Discovery, Weilai, Tucki

在早期开发阶段,自动驾驶系统需要收集大量的道路环境数据,形成贯穿感知、决策、规划、控制多个环节的算法。随着自动驾驶级别的每一步,场景的长尾都会大大增加,数据量也会呈指数级增长。

量产车上市后也是如此。还是要不断的回传场景数据,训练验证算法模型,做进一步的优化迭代。因此,数据被认为是车企发展自动驾驶技术的护城河。截至去年6月,特斯拉已经采集了100万个36帧10秒的高度差异化场景视频数据,累计数据量约1.5PB,远超Waymo。

如何获取、存储和使用更多的海量数据,是向更高层次过渡甚至实现完全无人驾驶的L5级自动驾驶的关键,也是越来越多车企将目光投向超算中心的根本原因。

真正的主菜没有数据,不智能

对于自动驾驶系统的建设,数据采集主要有两种模式,一种是采集车提前采集数据,另一种是生产车测量充值。一些计划从事自动驾驶系统开发的公司经常面临两个问题。创建一个数据收集车队是困难的,而建立一个生产车辆返回团队则更加困难。

结合IDC和Nvidia发布的白皮书,在实车端采集数据需要实车配备全套传感器设备在真实场景中连续行驶,通常会导致较高的测试成本。

同时,依靠实车路测很难实现对长尾场景的全面覆盖;有些场景也很危险,很可能会增加测试成本。另外,仅仅通过实车路试,无疑会拉长研发周期,难以满足当前市场对产品创新周期的需求。一旦数据成为缺失项,自动驾驶就无从谈起。

Tesla, Discovery, Weilai, Tucki

“长尾场景”是种类多、频率低的场景。

在自动驾驶时代,模拟也因此成为了一种硬需求。自动驾驶系统通过数字建模数字化还原现实世界中的物理场景,可以在虚拟环境中进行测试并生成数据。

不仅测试速度优于真实物理世界中的车辆水平,还可以在组装原型之前测试自动驾驶系统算法。通过预收敛算法的准确性,可以进一步提高实车测试的效率。毫无疑问,一个高效准确的仿真工具尤为重要。

至于为什么需要智能计算中心,如果进行大规模仿真测试,在一定时间内测试多个10亿量级的数据,计算能力将成为仿真效率的瓶颈。而计算能力也不再是一两个GPU或者一个小集群的开发基础。

当数据越来越复杂,越来越系统化,自动驾驶算法模型的复杂度越来越高,模型体量呈几何级增长。只有依靠成百上千的GPU并行运算,才能在更长的训练周期内完成Transformer等模型的训练,而只有数据中心才能支撑这种需求。

“超级计算机中心是算法的基础。如果没有超算中心,就没有办法打通自动驾驶卡。”英伟达汽车数据中心业务总监陈伟这样强调。这些要求对数据中心的设计、建设和运维提出了更高的要求。

造车新势力中,小鹏已率先与阿里云在内蒙古乌兰察布启动智能计算中心“Boom”,计算能力达到600PFLOPS(每秒60亿次浮点运算),可将自动驾驶核心模型的训练速度提升近170倍。蔚来、特斯拉等公司都选择了英伟达提供的解决方案。

其中,蔚来使用英伟达HGX加速器平台搭建数据中心基础设施,并在此基础上提升了近20倍的车型开发效率,加快了ET7、ET5等车型的量产上市速度。HGX集成了英伟达GPU、Mellanox等技术,以及在NGC优化的AI软件栈(英伟达GPU云)。

Tesla, Discovery, Weilai, Tucki

特斯拉也使用英伟达GPU来建立自己的超级计算中心。在英伟达的自动驾驶客户中,特斯拉是最大的GPU用户,已经部署了120个DGX SuperPOD分布式集群。

“DGX”是英伟达最强的服务器,内置8个英伟达GPU。“SuperPOD”是NVIDIA的最小可交付超级计算机中心,拥有20个DGX。换句话说,特斯拉用了2400个DGX,近2万个英伟达GPU。

“20台服务器可以做大量的初期工作,但对于中国的造车新势力来说,20台服务器的数量远远不够。”据陈野介绍,中国领先的自驾客户的需求在300至600 DGX之间。

从完成数据采集、筛选到阅卷,自动驾驶算法模型训练、回放验证(推理过程)、模拟测试三大环节都离不开超算中心的作用。如果车企或者自动驾驶公司想做好自动驾驶模型培训,大型超级计算机中心是必须的。这其实就是车企自建数据中心的底层逻辑。

建超级计算机中心结束了吗?

但是,在“量”之前,还有几个问题需要考虑。

建设超算中心不仅与服务器有关,还涉及系统建设,包括GPU集群、存储、高速网络、软件调度、机房管理、数据中心基础设施建设等等。每个部分都涉及大量的组件,增加了设计阶段的难度;而且设备和软件的部署都需要很长的周期,统一协调的部署和集成面临很多挑战;最后,当数据中心的所有设备安装部署完毕后,保持其处于最新鲜的状态,保持最佳的工作状态也是非常重要的。

市场研究公司Forrester在早些时候的一份调查报告中指出,超过60%的受访公司认为他们的数据中心处于L3级别。

本次调查通过对197位大中型企业IT部门领导和技术决策者的访谈发现,云计算、人工智能等技术可以帮助数据中心网络提高自动化、智能化运维水平,但由于相关企业在建设和运维阶段仍然依赖专家经验和员工技能,效率低下且容易出错。

以上白皮书还有一点,就是无形成本问题。车企和Tier1建设智能计算中心的预算一般超过1亿元,超过2亿元的占五分之一。AI科技公司和自动驾驶独角兽也有不少投资人投资过亿,但这些都只限于初期投资。

开发自动驾驶技术是一项烧钱的活动。以Waymo、Cruise等公司为例,三五年烧钱几十亿是常事。再尴尬一点,一些自动驾驶公司继续烧钱却毫无进展。硬件就是钱,数据就是钱,人才就是钱。

Tesla, Discovery, Weilai, Tucki

建设人工智能计算中心的投资额(人民币);图片来源:IDC

选择合适的供应商可能比自建超算中心事半功倍。为了应对这些挑战,NVIDIA可以提供从芯片到数据中心的端到端集成解决方案。

以SuperPOD超级计算机为例,它有一个支持从小规模快速扩展的参考架构,可以从20变到40,80变到1000以上,像搭积木一样不断扩展。同时具有持续的软件优化和“白盒”交付的特点。这样,车企可以把更多的时间和精力放在算法开发上,而不是数据中心。

至少在现阶段,规模和服务器数量不一定是超算中心的比拼,比如效率和开发方式也会决定自动驾驶模型的进度条,这不仅涉及硬件,还包括开发的AI框架、方法、管理平台等等。谁能掌握主动,谁就有望先赢一局。

NVIDIA会是唯一的答案吗?

从市场以往的发展规律来看,高科技产业的第一梯队会掌握在少数公司手中。随着新技术新兵的不断入场,绝对的寡头垄断格局只会越来越脆弱。

目前在数据中心处理器市场,英伟达、英特尔、AMD几乎100%垄断。就GPU计算芯片而言,英伟达和AMD继续竞争,前者占比超过80%。目前自动驾驶算法模型的训练主要基于GPU。英伟达正在通过用GPU搭建服务器,建设基于“服务器+网络”的超算中心,积极抢占市场。

围绕超级计算中心的战争已经打响,车企和自动驾驶公司要想拔得头筹,就必须迅速行动起来。

两年前,《日经亚洲评论》发表了一篇报道:研究人员在拆解Model3后发现,自动驾驶硬件3.0不仅是自动驾驶系统和多媒体控制单元的核心,也是特斯拉摆脱其他竞争对手的关键武器。

高性能的硬件平台是应对海量数据预期增长的基石,也是自动驾驶系统不断完善的技术支撑。事实也证明,特斯拉近年来一直走在自动驾驶队伍的前列。但显然,这只是开胃菜。数据是压轴选手。

Tesla, Discovery, Weilai, Tucki

在早期开发阶段,自动驾驶系统需要收集大量的道路环境数据,形成贯穿感知、决策、规划、控制多个环节的算法。随着自动驾驶级别的每一步,场景的长尾都会大大增加,数据量也会呈指数级增长。

量产车上市后也是如此。还是要不断的回传场景数据,训练验证算法模型,做进一步的优化迭代。因此,数据被认为是车企发展自动驾驶技术的护城河。截至去年6月,特斯拉已经采集了100万个36帧10秒的高度差异化场景视频数据,累计数据量约1.5PB,远超Waymo。

如何获取、存储和使用更多的海量数据,是向更高层次过渡甚至实现完全无人驾驶的L5级自动驾驶的关键,也是越来越多车企将目光投向超算中心的根本原因。

真正的主菜没有数据,不智能

对于自动驾驶系统的建设,数据采集主要有两种模式,一种是采集车提前采集数据,另一种是生产车测量充值。一些计划从事自动驾驶系统开发的公司经常面临两个问题。创建一个数据收集车队是困难的,而建立一个生产车辆返回团队则更加困难。

结合IDC和Nvidia发布的白皮书,在实车端采集数据需要实车配备全套传感器设备在真实场景中连续行驶,通常会导致较高的测试成本。

同时,依靠实车路测很难实现对长尾场景的全面覆盖;有些场景也很危险,很可能会增加测试成本。另外,仅仅通过实车路试,无疑会拉长研发周期,难以满足当前市场对产品创新周期的需求。一旦数据成为缺失项,自动驾驶就无从谈起。

Tesla, Discovery, Weilai, Tucki

“长尾场景”是种类多、频率低的场景。

在自动驾驶时代,模拟也因此成为了一种硬需求。自动驾驶系统通过数字建模数字化还原现实世界中的物理场景,可以在虚拟环境中进行测试并生成数据。

不仅测试速度优于真实物理世界中的车辆水平,还可以在组装原型之前测试自动驾驶系统算法。通过预收敛算法的准确性,可以进一步提高实车测试的效率。毫无疑问,一个高效准确的仿真工具尤为重要。

至于为什么需要智能计算中心,如果进行大规模仿真测试,在一定时间内测试多个10亿量级的数据,计算能力将成为仿真效率的瓶颈。而计算能力也不再是一两个GPU或者一个小集群的开发基础。

当数据越来越复杂,越来越系统化,自动驾驶算法模型的复杂度越来越高,模型体量呈几何级增长。只有依靠成百上千的GPU并行运算,才能在更长的训练周期内完成Transformer等模型的训练,而只有数据中心才能支撑这种需求。

“超级计算机中心是算法的基础。如果没有超算中心,就没有办法打通自动驾驶卡。”英伟达汽车数据中心业务总监陈伟这样强调。这些要求对数据中心的设计、建设和运维提出了更高的要求。

造车新势力中,小鹏已率先与阿里云在内蒙古乌兰察布启动智能计算中心“Boom”,计算能力达到600PFLOPS(每秒60亿次浮点运算),可将自动驾驶核心模型的训练速度提升近170倍。蔚来、特斯拉等公司都选择了英伟达提供的解决方案。

其中,蔚来使用英伟达HGX加速器平台搭建数据中心基础设施,并在此基础上提升了近20倍的车型开发效率,加快了ET7、ET5等车型的量产上市速度。HGX集成了英伟达GPU、Mellanox等技术,以及在NGC优化的AI软件栈(英伟达GPU云)。

Tesla, Discovery, Weilai, Tucki

特斯拉也使用英伟达GPU来建立自己的超级计算中心。在英伟达的自动驾驶客户中,特斯拉是最大的GPU用户,已经部署了120个DGX SuperPOD分布式集群。

“DGX”是英伟达最强的服务器,内置8个英伟达GPU。“SuperPOD”是NVIDIA的最小可交付超级计算机中心,拥有20个DGX。换句话说,特斯拉用了2400个DGX,近2万个英伟达GPU。

“20台服务器可以做大量的初期工作,但对于中国的造车新势力来说,20台服务器的数量远远不够。”据陈野介绍,中国领先的自驾客户的需求在300至600 DGX之间。

从完成数据采集、筛选到阅卷,自动驾驶算法模型训练、回放验证(推理过程)、模拟测试三大环节都离不开超算中心的作用。如果车企或者自动驾驶公司想做好自动驾驶模型培训,大型超级计算机中心是必须的。这其实就是车企自建数据中心的底层逻辑。

建超级计算机中心结束了吗?

但是,在“量”之前,还有几个问题需要考虑。

建设超算中心不仅与服务器有关,还涉及系统建设,包括GPU集群、存储、高速网络、软件调度、机房管理、数据中心基础设施建设等等。每个部分都涉及大量的组件,增加了设计阶段的难度;而且设备和软件的部署都需要很长的周期,统一协调的部署和集成面临很多挑战;最后,当数据中心的所有设备安装部署完毕后,保持其处于最新鲜的状态,保持最佳的工作状态也是非常重要的。

市场研究公司Forrester在早些时候的一份调查报告中指出,超过60%的受访公司认为他们的数据中心处于L3级别。

本次调查通过对197位大中型企业IT部门领导和技术决策者的访谈发现,云计算、人工智能等技术可以帮助数据中心网络提高自动化、智能化运维水平,但由于相关企业在建设和运维阶段仍然依赖专家经验和员工技能,效率低下且容易出错。

以上白皮书还有一点,就是无形成本问题。车企和Tier1建设智能计算中心的预算一般超过1亿元,超过2亿元的占五分之一。AI科技公司和自动驾驶独角兽也有不少投资人投资过亿,但这些都只限于初期投资。

开发自动驾驶技术是一项烧钱的活动。以Waymo、Cruise等公司为例,三五年烧钱几十亿是常事。再尴尬一点,一些自动驾驶公司继续烧钱却毫无进展。硬件就是钱,数据就是钱,人才就是钱。

Tesla, Discovery, Weilai, Tucki

建设人工智能计算中心的投资额(人民币);图片来源:IDC

选择合适的供应商可能比自建超算中心事半功倍。为了应对这些挑战,NVIDIA可以提供从芯片到数据中心的端到端集成解决方案。

以SuperPOD超级计算机为例,它有一个支持从小规模快速扩展的参考架构,可以从20变到40,80变到1000以上,像搭积木一样不断扩展。同时具有持续的软件优化和“白盒”交付的特点。这样,车企可以把更多的时间和精力放在算法开发上,而不是数据中心。

至少在现阶段,规模和服务器数量不一定是超算中心的比拼,比如效率和开发方式也会决定自动驾驶模型的进度条,这不仅涉及硬件,还包括开发的AI框架、方法、管理平台等等。谁能掌握主动,谁就有望先赢一局。

NVIDIA会是唯一的答案吗?

从市场以往的发展规律来看,高科技产业的第一梯队会掌握在少数公司手中。随着新技术新兵的不断入场,绝对的寡头垄断格局只会越来越脆弱。

目前在数据中心处理器市场,英伟达、英特尔、AMD几乎100%垄断。就GPU计算芯片而言,英伟达和AMD继续竞争,前者占比超过80%。目前自动驾驶算法模型的训练主要基于GPU。英伟达正在通过用GPU搭建服务器,建设基于“服务器+网络”的超算中心,积极抢占市场。

围绕超级计算中心的战争已经打响,车企和自动驾驶公司要想拔得头筹,就必须迅速行动起来。

标签:特斯拉发现蔚来小鹏

汽车资讯热门资讯
成立三天,上海蔚来汽车增资至300万元

根据天眼查App显示,12月23日,上海蔚来汽车服务有限公司(以下简称“上海蔚来汽车”)发生工商变更,注册资本由100万增资至300万,增幅高达200。这次增资距离该公司成立不过三天。

1900/1/1 0:00:00
定位中大型SUV 魏80将于广州车展首发亮相

日前,车质网从官方获悉,魏牌全新中大型SUV魏80将在12月30日开幕的广州车展上首发亮相,并同时公布其正式命名。

1900/1/1 0:00:00
品牌成立十周年,奇瑞捷豹路虎云端开放日线上开幕

分享在成立的第10个年头,奇瑞捷豹路虎以线上形式打造了一场直播,全面展示了企业实力,解码创立以来的十年跨越。12月27日,以“十载卓越智领新程”为主题的奇瑞捷豹路虎云端开放日活动正式开启。

1900/1/1 0:00:00
基于单地平线征程3,宏景智驾首发单SoC行泊一体解决方案

12月29日消息,宏景智驾宣布近日推出业内首个基于单地平线征程3芯片开发的、面向量产的行泊一体系统级解决方案,率先实现单SoC(SystemonChip)行泊一体方案的突破,

1900/1/1 0:00:00
【国际快讯】特斯拉上海工厂明年1月将继续减产;特斯拉二手车价值下降

特斯拉上海工厂明年1月将继续减产特斯拉计划1月份在其上海工厂继续减产,将从本月开始的减产计划延长到明年。

1900/1/1 0:00:00
中国电动汽车市场:弯道超车后,直道加速还会远吗?

临近年末收官,复盘跌宕起伏的2022年中国乘用车市场,颇感“忽如一夜春风来,千树万树梨花开。

1900/1/1 0:00:00