汽车导航 汽车导航
Ctrl+D收藏汽车导航
首页 > 汽车资讯 > 正文

中国最懂自动驾驶量产公司秀肌肉:自动驾驶算力怪兽、百亿参数云端超大模型、百万公里路测里程

作者:

时间:1900/1/1 0:00:00

贾浩南源自奥非寺

量子比特报告|公众号QbitAI

这可能是中国发展最快的自动驾驶公司。

在最近结束的米莫智行Q3品牌日上,这家被业内人士视为“中国最懂量产自动驾驶”的公司发布了最新成绩单:

随着营收的快速增长,成立不到2年的米陌知行今年已经实现了1亿元的营收。

这本身就已经令人难以置信了。

777,长城,发现,摩卡,RAM

在产品实施方面,今年第二季度推出了10款量产产品,硬件和软件全部到位。最新产品是与阿里巴巴达摩院合作的无人终端配送车“小毛驴”。

超越行业经验认知的是技术的快速迭代。

自今年1月以来,已经积累了超过100万公里的智能驾驶数据,而且不是模拟,而是中国真实道路上的实际里程。

智行取得如此惊人的进步,其杀手级武器是什么?

所有高管都露面,很少分享技术细节,并展示自己的技能。

100万公里的数据可用,但问题并没有那么简单

让我们先来回答100万公里的民磨智行是从哪里来的。

民美智行孵化于长城汽车(601633,股吧)集团,诞生于这家传统汽车巨头的后顾之忧,也肩负着长城智能化转型的核心责任。

今年推出的魏牌摩卡车型是纳米智能驾驶系统的首次亮相。

777,长城,发现,摩卡,RAM

100万公里,从今年1月的测试开始,包括上市后普通用户贡献的数据,都来自这款车。

但有了100万公里的数据,发现问题并不是那么简单。

品牌日当天,百度无人车团队首席执行官顾伟豪从问题入手,透露了最终成绩单背后的努力和探索。

首先,在海量的数据中,提高辅助驾驶系统能力的关键数据并不多。

例如,在城市高速公路的视频图像中,60%以上可能是平坦笔直的路段,没有任何意外事件。

再多的此类数据也不会对系统能力的提高产生决定性影响。

相反,低频率和较小的目标图像数据是填补系统缺陷的关键。

如何挑选出这些有价值的数据是第一个挑战

777,长城,发现,摩卡,RAM

在有价值的图像中,模型能力不足也会导致错过关键小目标的检测,并降低数据利用率。

此外,模型的能力可能存在“数据偏差问题”,例如能够识别白色客车,但无法识别被植物遮挡的白色客车。

这两个问题出现在数据收集的早期阶段。

在获得经过处理的有价值的数据后,该系统仍需要克服其他挑战。

一个是如何快速迭代,更一般地说,如何在参数调整后加快新模型的训练速度。

其次,不断涌入的数据使得模型版本快速迭代。在短时间内验证这些不同模型的挑战也很大。

自动驾驶公司没有数据可担心,而像Nano这样从不缺乏数据和场景的公司面临着另一个层面的困难。

刚刚,在米魔智行的第三个品牌日,CEO顾伟豪首次详细透露了如何应对米魔。

通过结合数据和培训,这家“知识最渊博”的自动驾驶生产公司表示

在发展过程中遇到的问题已经被识别出来,如何解决这些问题已经成为莫之星品牌日的核心焦点。

从应对这些挑战的技术解决方案中,人们也可以理解为什么这家公司在自动驾驶的生产和实施方面最有知识。

一种“以大带小”的数据诊断方法

让我们首先讨论寻找有价值的场景数据,然后将此过程称为诊断。

777,长城,发现,摩卡,RAM

目前有两种诊断方法可用。

第一种方法是通过清除系统故障信号来获得诊断结果,例如手动接管信号。

也就是说,如果用户光盘……

ers在使用和接管过程中缺乏系统能力,系统将在接管前后捕获上传到场景库的数据进行分析和学习。

第二种方法是通过更强大的后服务器模型来诊断车辆模型中的错误。

777,长城,发现,摩卡,RAM

车辆端模型受到计算能力、传输延迟和有限参数的约束,其初始容量自然受到限制。一般来说,一个小模型负责感知任务的一部分。

因此,在实际测量中发现,对于长距离的小目标,以前的系统版本经常会漏检。

部署在服务器上的大型模型称为基础模型,这是一个基于Transformer的全任务感知大型模型。

计算能力要求高,资源利用率高,但具有超强的能力,可以在恶劣天气下检测遗漏或识别能力下降的小模型中的错误。

777,长城,发现,摩卡,RAM

△ 顶部表示车辆端模型的漏检,底部表示大型模型的修正

识别出问题后,将结果返回到车辆端模型进行再培训和学习,这样可以最大限度地获取有效数据。

举一反三解决数据偏差

在发现有问题的场景后,有必要为该场景补充足够的样本数据,即找到足够数量的其他同类数据。

只有通过样本分配,才能开发出更好的人工智能模型

通过已经推出的长城威莫卡车型,我们积累了庞大的道路场景数据库。

面对海量场景,第一种方法是用无监督学习方法对图像进行矢量化,将图像数据转换为特征向量,然后通过光谱聚类将相似的图像聚类在一起。

777,长城,发现,摩卡,RAM

在获得聚类结果后,对于期望的目标场景,可以发现同一类别中的大量相关数据作为正样本,以及来自其他类别的相似且容易混合的数据作为负样本。

并且在类别中,只选择类中心和类边界附近的数据,以提高注释效率。

777,长城,发现,摩卡,RAM

这种方法也可以非常有效地以适当的方式混合异构数据,提高最终模型的有效性。

数据诊断依赖于“大与小”,而“数据偏差”则是通过举一反三来解决的。

平行训练将炼丹时间减少一半

既然我们已经获得了提高模型能力的关键数据,下一步就是“提炼药丸”。

变形金刚的能力很强,但他们的训练速度也很慢。

即使在具有360GB RAM和4个V100 GPU的服务器上,Swin Transformer网络也需要超过100小时的标准数据并行DDP训练。

777,长城,发现,摩卡,RAM

如果一个毫秒级的工程师稍微改变网络结构、参数配置或更改数据,那么看到结果的迭代周期将近一百个小时。

但这些操作频繁发生,因此这严重减缓了技术迭代。

因此,为了提高训练速度,除了常见的数据并行外,还需要更精细的模型并行方法。

第一种是数据并行,在每个GPU上训练一个完整的网络,并对数据进行切片以适应GPU。同时,每一层的梯度也会与其他GPU相互作用。这可以进一步提高模型的收敛速度,并以更少的历元实现相同的训练效果。

这种数据并行和模型并行的混合方法被称为流水线并行。

Swin变压器采用并联管道方案,可将整体速度提高50%-80%。

装配线的生产测试场景

培训效率有所提高,出现了新的问题:

如何通过快速迭代和多个版本验证模型的有效性?

当然,主流的方法是将模型放入模拟环境中进行测试,但传统的模拟方法效率很低。

从场景设计到建立道路模型、车辆模型、交通流模型,最后进行模拟测试。。。每人每天只能做30次。

777,长城,发现,摩卡,RAM

所以Momo有……

开发了语义场景的自动转换工具和参数泛化工具,可以将CSS场景库的描述文本自动转换为模拟测试场景,并在适当范围内通过离散采样获得大量模拟测试用例。

同时,通过在云中并行化,每天可以自动生成10000多个模拟测试用例。

简单地理解,之前的数据诊断实际上是数据标注的自动化,而云语义场景自动化转换是管道生产测试场景的工具。

世界上的武术是不可战胜的,只有快速和牢不可破。

自动驾驶也是如此,其中智能驾驶最具洞察力。

数据量大且数量多,处理速度快且准确。基于此,我们实现了令人难以置信的大规模生产和安装速度。

从技术的角度来看,行动中没有智慧

莫志行内部称董事长张凯和首席执行官顾伟豪是测试爱好者,他们每周都会花大量时间亲自测试智能驾驶产品。

在品牌日现场,董事长张凯也提到,长城汽车内部更注重智能化,要求所有公司的技术负责人和高管每周六都要参加智能化体验测试。

不仅是我们自己的产品,市场上的每一款产品,我们都需要经历比较,有时魏建军也会亲自参与。

777,长城,发现,摩卡,RAM0

硬核技术的背景色得到了充分的展示。

同时,张凯还表示,规模、数量和速度是最重要的因素,自动驾驶公司在2022年之前找不到大规模的落地路径无疑是致命的。

那么Minmo是一家什么样的公司呢?

快速的进步和抛光技术在这里实际上是一脉相承的,没有任何矛盾。

莫志行为什么更喜欢变压器?

上个月的特斯拉人工智能日,马斯克首次明确推出了DOJO,并分享了Transformer和Big Model在自动驾驶中的作用。

他们几乎不知道,类似的想法早就在中国的智行团队中得到了实践。

在Q3品牌日,我们看到Transformer已经成为一个极其重要的开发工具。

事实上,在米莫智行首次公开亮相时,CEO顾伟豪对Transformer表达了特别的关心。

随后,它不断被公开提及。

777,长城,发现,摩卡,RAM1

顾伟豪认为,自动驾驶行业目前的情况是,传感器供应商和解决方案正在趋同,仅靠硬件堆叠无法扩大差距。

所以未来的决定性点一定是数据,更多的数据是前提,好的数据是基础。

如果你经常关注人工智能技术的前沿,你一定有一些了解。转换器最初用于语言处理任务,其模型结构避免了循环,并完全依赖于注意力机制来对输入和输出的全局依赖性进行建模。

也就是说,只要数据足够大,就可以训练出一个超大型模型。

在过去的两年里,Transformer在图像识别的准确性、效率和鲁棒性方面不断刷新各种排名,超越了其他人。

这是一个真正实力的奇迹,因为这种方法需要一个大的数据集,这与毫米智能的数据收集和泛化优势完美匹配。

为什么自动驾驶在云端起决定性作用?

谈到莫志行开发的算力平台ICU 3.0,顾伟豪表示,现在有一种观点认为,车辆的算力已经达到了几TB,这是完全足够的。

但最终,从实践中得出了完全不同的结论。

仅从摄像头来看,如今主流的车载摄像头仍为100万像素,而即将搭载毫秒级智能驾驶系统的长城车型即将开始使用200万像素和800万像素摄像头。

因此,从长远来看,长城汽车和尼莫智行联合推出了ICU 3.0,这是世界上最强大的量产自动驾驶计算平台。

该平台采用8450和9000芯片,计算能力高,缓存大,推理快,路径多,延迟低,覆盖范围广,易于部署。大缓存使芯片能够同时支持多个高分辨率视频流进行实时感知推理……

777,长城,发现,摩卡,RAM2

多任务感知网络部署在高通芯片上,骨干网络使用Resnet50进行优化。在此基础上,构建了一个多特征融合层。通过网络预先对视觉相机和激光雷达数据进行三维传感,并在BEV空间中融合毫米波雷达和多帧相关。

777,长城,发现,摩卡,RAM3

这样,可以基于共同的特征元素进行车道线和障碍物识别等后续任务,大大加快了识别速度。

777,长城,发现,摩卡,RAM4

但即使它像高通一样强大,车端的计算能力也不可能永远持续增长。

未来,车端单个摄像头的数据量可能会增加100倍,车端使用的摄像头数量也将增加十多倍。

从这个角度来看,将板载计算芯片的计算能力提高几百倍是不够的。

因此,大量的数据带来了大量的计算,这是非云计算无法解决的。

前面提到的大型服务器模型训练小型汽车模型的核心逻辑就在于此。

纵观Q3品牌日,从民摩智行分享的技术细节可以看出,企业的核心是大数据大模型和快速迭代。

具体方法是打开一个快速着陆和测量的场景,然后根据场景的特点设计自己的高效数据方案,避免在有限的空间内测试数年或数月,从而可能导致延迟着陆。

777,长城,发现,摩卡,RAM5

随着场景的形成,小聪明正在走一条渐进的商业落地路线,智能驾驶正在从增强人到取代人发展。

小米“速度”的背后,不仅有以小米董事长张凯为代表的长城基因,还有中国最早在科技公司探索智能汽车的先驱顾伟豪。

这种业内罕见且强大的配置,共同决定了成为量产中知识最渊博的自动驾驶公司的底线。

-完-

这篇文章是网易新闻吗?网易账号签名内容激励计划的原创内容,未经账号授权,禁止转载。

第三届MEET大会启动,邀请您见证智能技术的新未来

今年12月,MEET2022智能未来大会将再次邀请来自智能技术行业、科研和投资领域的专家和嘉宾,共同探索推进智能技术行业的道路。

欢迎智能科技企业参加大会,分享成果,交流思想,共同参与盛会!点击下方链接或图片查看会议详情:量子比特“MEET 2022智能未来大会”已经启动,邀请您一起见证AI价值

本文首发于微信公众号:量子比特。文章内容属于作者个人观点,不代表和讯网络的立场。投资者应据此操作,并承担风险。

标签:777长城发现摩卡RAM

汽车资讯热门资讯
特斯拉最早2022年完成在印度的投产计划

新浪科技讯北京时间9月29日下午消息,据报道,CounterpointResearch分析师苏门曼达尔表示,特斯拉最早可能于2022年在印度制造车辆。

1900/1/1 0:00:00
德众汽车备战北交所:授权经销豪华品牌不足三成 押注汽车拆解市场待破局

每经记者董天意每经编辑裴健如北京证券交易所的“横空出世”,为一众中小企业的发展带来了想象空间,尤其是对汽车经销等资金密集型行业而言,融资渠道的进一步拓宽,为业内企业提供了快速成长条件。

1900/1/1 0:00:00
WAVE合作肯沃斯卡车 部署功率达1万兆瓦的无线充电垫

盖世汽车讯据外媒报道,当地时间9月28日,Ideanomics子公司WAVE宣布,将参与美国能源部的一个电气化动力系统项目,为8级电动卡车研发1兆瓦的无线充电系统。

1900/1/1 0:00:00
雷克萨斯同款一半价格 内饰好过汉兰达 丰田凌放SUV香疯了?

在本届天津车展上一汽丰田带来了全新的凌放,新车是一款中型SUV,个人感觉在外观和内饰设计上主打优雅定位,和丰田其他SUV车型形成了一定的反差。

1900/1/1 0:00:00
又有龙头车企加码新能源!一汽解放官宣:纯电、混动、燃料电池齐头并进,2035年销售整车50万辆

新能源汽车板块的持续升温,不仅吸引着无数跨界者的入局,也让在传统动力时代中的领军者加速转型。

1900/1/1 0:00:00
利物浦大学研究人员创建出协作人工智能工具 可减少新材料发现的时间和精力

盖世汽车讯据外媒报道,利物浦大学的研究人员创建了一种协作人工智能工具,可以减少发现真正新材料所需的时间和精力。

1900/1/1 0:00:00