在汽车芯片行业,特斯拉、英伟达、华为、地平线和高通是此次竞争的主要参与者。
来源:健海车评论
2021 7月29日,零点在上海发布了新一代芯片之旅5。地平线创始人兼首席执行官于凯表示,这是地平线成立六年来最重要的新闻发布会。
该芯片基于16nm工艺,配备贝叶斯BPU架构,AI计算能力为128TOPS。它最早将于2022年第三季度或第四季度初大规模生产。在微软的微软微软公司公开测试集中,地平线的Journey 5可以达到1283 FPS。Horizon估计,Journey 5的人工智能性能将与NVIDIA Orin持平。
差不多两年前的2019年12月18日,黄仁勋发布了用于自动驾驶的新一代处理器Orin。基于7nm工艺,晶体管数量达到170亿个,人工智能计算能力达到200 TOPS。Ideal X01和NIO ET7是该芯片的首批量产型号。
在2019年4月早些时候的特斯拉自动驾驶日上,特斯拉展示了其FSD芯片的技术细节,该芯片基于14纳米工艺,具有60亿个晶体管和72个TOPS人工智能计算能力。这种芯片已经安装在数百万辆特斯拉汽车上。
在那次活动中,特斯拉表示,当它开始准备开发自动驾驶时,市场上没有成熟的自动驾驶芯片可以用于神经网络。因此,特斯拉花了18个月的时间设计FSD芯片。
自特斯拉以来,专门为神经网络设计的NPU已成为汽车智能芯片的主要组成部分。传统通用计算CPU和GPU退居辅助地位,AI算力和性能成为各大芯片制造商的主要竞争点。
特斯拉、英伟达、华为、地平线和高通是此次竞争的主要参与者。
无论是老牌巨头还是新玩家,这些参与者几乎都认同中央计算的发展趋势。基于这一趋势,整个战场仍处于资格赛的第一轮。现阶段,芯片主要服务于自动驾驶,实现更快、更高效、低成本的自动驾驶是目前的主要任务。
自动驾驶是智能汽车的第一个杀手级应用。它将为汽车带来超过1000个TOPS AI计算能力和遍布车身的各种传感器,使汽车成为有史以来最强大的智能终端。
未来,其他Killer应用程序将在汽车超级终端上增长。届时,汽车智能芯片仍需为这些应用服务,这意味着未来的竞争将发生重大变化。汽车智能芯片离最终形态还有很长的路要走。
比赛才刚刚开始。
01
在自动驾驶应用方面,地平线发布了《征途5》的三大主要数据:1283 FPS、60毫秒延迟和30W功耗。
1283英尺/秒
在微软的MS CoCo开放测试集中,Horizon的Range 5可以实现1283 FPS,用于在真实场景中检测多种类型的物体,而Nvidia Xavier的FPS为143。Horizon根据Xavier的7倍业绩估计Orin的业绩为1001。根据这一估计,地平线的Range 5的人工智能性能略好于Orin。
60毫秒延迟
Horizon表示,Journey 5从相机输入到感知结果输出只需要60毫秒,而大多数竞争对手都在150毫秒以上。
功耗30W
作为对比,特斯拉FSD芯片的AI算力为72TOPS,功耗为36W;
NVIDIA Orin的AI计算能力为200TOPS,功耗为45W;
地平线之旅5的AI计算能力为128TOPS,功耗为30W。
对于自动驾驶来说,性能、延迟和功耗都是非常重要的参数,它们将直接决定整个自动驾驶系统的能力边界。
就芯片的硬件结构而言,Journey 5具有以下主要核心单元:
1.3G Pixel/S ISP可同时接入12路200万像素摄像头和4路800万像素摄像头;
Arm的A55 DynamIQ CPU;
Tensilica的Visual P6 DSP;
Horizon自主研发的用于人工智能计算的贝叶斯BPU
这些计算单元具有以下分工:
预处理,这部分计算通过双ISP、双DSP等单元进行处理;
感知,这部分计算是通过双核BPU进行处理的;
后处理由一个8核A55 CPU集群处理。
Journey 5的架构与特斯拉的FSD芯片非常相似,两者都将研发重点放在了NPU部分。NPU的主要功能是运行用于大规模并行计算的神经网络。
与NPU相比,CPU专注于单线程性能,响应时间更快,但在大规模并行计算中几乎不可用;GPU由于其高功耗,在运行神经网络方面比NPU具有优势。
特斯拉曾举过FSD芯片上CPU、GPU和NNA神经网络处理能力的例子。GPU大约是CPU的10倍,而NNA的处理能力是GPU的100多倍。
尽管NPU在运行神经网络时具有高性能、低延迟和低功耗的特点,但仍有很深的知识涉及。
地平线联合创始人兼首席技术官黄畅表示,贝叶斯BPU在硬件架构上有三项核心技术:大规模异构近内存计算、高灵活性和高并发数据桥以及脉动张量计算。
大规模异构近内存计算为自动驾驶提供了相对合理比例的异构计算模式。这些异构计算单元和存储器在物理空间中放置得尽可能靠近。那些可以通过L0的永远不会进入L1,而那些可以通过L1的永远不会到达外部存储器。这使得数据传输的功耗和延迟可以减少一个数量级。
高灵活性、高并发数据桥,灵活连接多个计算单元和存储阵列,提高了多个计算单位以高带宽同时读取数据时每个计算单位的数据吞吐能力,确保每个数据单元可以旋转,并有足够的数据进行计算,避免了计算单元空转的现象。
脉冲张量计算,其中来自L0存储器的数据流经MAC阵列,并在数据交叉流期间完成,可以显著降低对L1存储器的访问频率,从而降低计算功耗和延迟。
在软件层面,Horizon将通过编译进行优化,以实现高度并行计算,同时最大限度地减少数据溢出到外部内存的概率和数量,以更少的外部内存支持更高的有效计算能力。
上面的技术解释可能太无聊了,让我们试着翻译一下。
首先,我们需要了解神经网络操作的特点。
特斯拉人工智能高级总监Andrej Karpathy在特斯拉自动驾驶日上表示,一个典型的神经网络有数千万到数亿个神经元,每个神经元都有数千个连接。
这是一个大规模、大数据量的计算。
在冯·诺依曼架构中,由于“内存墙”的限制,数据在读写过程中的能耗比计算过程中的功耗高出两到三个数量级。
2019特斯拉自动驾驶日
这意味着运行神经网络需要在执行大规模并行操作的同时减少对存储的访问。
从这个角度来看,Horizon BPU中上述三种核心技术的功能是物理接近存储,提高并行计算的真实性能,减少存储访问。
如上所述,这些任务也围绕着高性能、低延迟和低功耗的目标展开。
在高水平的自动驾驶中,随着各种传感器和图像传感器数量和能力的增加、场景的扩展、丰富的功能以及自动化程度的提高,对AI算力的需求也呈指数级增长。在自动驾驶芯片方面,NPU部分将继续是每家公司的主要竞争点。
在NPU方面,地平线的核心竞争力在于于凯、黄畅等核心团队的深度学习算法背景,他们对构建人工智能芯片有着深刻的理解。地平线公司声称拥有世界上最好的激光雷达算法技术和世界领先的视觉技术。
在量产应用方面,零点为五号旅程设计了一些关键节点:到2021第四季度,将完成基于五号旅程的城市自主驾驶演示;2022年第二季度,合作伙伴域控制器硬件量产;
2022年第四季度,车载智能解决方案SuperDrive实现量产SOP。
02
未来汽车智能芯片将朝着什么方向发展?
在功能手机时代,全球最大的智能手机芯片制造商是德州仪器,该公司曾占据60%的市场份额。在这个时代,一个芯片可以流行10年,诺基亚可以在几年内发布的10多部手机上使用一个芯片。
此时,手机芯片可能已经被设计用于“呼叫”功能,这与目前专门为“自动驾驶”设计的汽车AI芯片类似。
随着智能手机的浪潮,智能手机芯片SoC上的功能越来越多,DSP、ISP、GPU、NPU等越来越多的异构计算单元被集成到芯片中。
与此同时,智能手机上的应用越来越多样化,这反过来对手机芯片提出了更高的要求。如果一个手机芯片没有得到ISP、5G基带芯片,甚至手机应用程序较少的NPU的正确处理,人们会感到无法理解。
这也使得手机芯片的设计越来越复杂,参与的门槛也越来越高。
目前,全球只有6家移动芯片制造商,包括苹果、高通、联发科、华为、三星和紫光展讯,这几乎与手机制造商的数量一样少。
移动芯片行业对汽车芯片行业有什么启发吗?
绝对地
应用程序及其潜在的用户需求是芯片行业的原始驱动力。
在功能手机时代,人们对手机应用的终极思考可能是上网、发电子邮件,以极其糟糕的体验完成这两件事。
当时,人们从未想过,随着CPU、摄像头和4G/5G的发展,抖音和王者荣耀将成为许多人在手机上的主要应用。
无论买手机是为了打电话还是玩游戏,用户不断变化的需求都在推动硬件水平的不断提高。
对于智能汽车来说,这种逻辑不会改变。
对于目前的智能汽车控制芯片来说,第一阶段的核心要求是满足自动驾驶的能力。例如,特斯拉表示,其FSD芯片在用于处理自动驾驶计算时非常高效。
我们可以将自动驾驶视为智能汽车上的第一个超级应用。目前,特斯拉FSD芯片、英伟达Orin、地平线J5等都是专门为自动驾驶开发的专用芯片。
在应用层面,除了自动驾驶,智能汽车领域还没有真正的下一代应用,甚至还没有出现原型。
这与智能座舱目前的尴尬处境有关,智能座舱和自动驾驶在硬件上几乎完全隔离。智能座舱的应用并没有显著改善用户体验,主机厂也没有动力将其升级到更好的硬件水平,导致智能座舱的使用和硬件迭代缓慢。
而自动驾驶硬件,无论是计算平台还是各种传感器硬件,近年来都在快速迭代,1000TOPS计算平台、8M摄像头、激光雷达层出不穷。
一方面,这是由“自动驾驶”这一超级强大的应用驱动的,另一方面,这些硬件反过来也将带来“自主驾驶”之后的下一代超级应用。
随着中央计算架构的演进,汽车的计算将集中化,这几乎已经成为业界的共识。
今年4月,黄仁勋表示,NVIDIA Orin不仅将支持自动驾驶计算,还将支持仪表、车载娱乐、车载人工智能等多个领域的计算和交互。
特斯拉的下一代FSD芯片和地平线J5也在朝着这个方向努力。
一个明显的优势是,智能驾驶已经为汽车购买了传感器和计算平台等硬件。“下一代超级应用”可以充分利用这些自动驾驶硬件开发新的应用场景,但无需支付另一笔费用。
下一代超级应用,也许是VR,对AI计算能力和GPU都有需求。当这些应用超越“自动驾驶”成为智能汽车的主要应用时,将对芯片制造商提出新的要求,竞争的内涵也将随之显现……
改变
就在我写这篇文章的时候,很多人可能会想,“有没有什么应用程序可以超越汽车自动驾驶?”就在15年前,人们很难想象现在人们主要用手机刷抖音,而不是打电话。
03
那么问题来了,汽车制造商会生产智能芯片吗?
2008年,高通凭借其通信能力,进入HTC的汽车,开始向HTC G1供应芯片。从那时起,高通公司开始主导移动芯片行业。
这与地平线等公司开始凭借其人工智能能力在汽车芯片领域展开竞争的方式类似。
他们都是局外人,从一个非常基本的起点开始。
在自动驾驶时代,或许车企自研芯片的力量还不够。
自我研究的优势在于它可以更有效地开发自动驾驶。此外,当规模达到一定水平时,与直接采购相比,它具有成本优势;
问题是这项任务太难了。正在修理飞机的汽车公司仍有大量资源可用于其他战场,如果没有时间,他们真的无法做到这一点。
然而,在超级应用程序的下一个时代,这将变得不同。
届时,最强大的应用程序,如元宇宙,甚至可能由汽车制造商开发,而不是由第三方应用程序开发商开发,他们只在该应用程序中提供服务和内容。
最雄心勃勃的汽车制造商将有动力制造芯片。
因为他们需要掌握软硬件集成的经验,所以可以更好地优化他们的自动驾驶和其他超级应用。
特斯拉已经在这么做了。当然,我们不能假设汽车制造商能够做好这件事。芯片开发的难度和复杂性与苹果最初开始生产A系列芯片时,甚至与特斯拉2016年开始生产FSD芯片时都有很大不同。
当马斯克在自动驾驶日发布FSD芯片时,他说:“现在确实有人可以追随我们,但它需要三年的时间才能制造出来,我们两年后生产的芯片将比现在好三倍
特斯拉预计将于8月19日举办“人工智能日”,届时我们预计特斯拉将推出下一代FSD 2.0和HardWare 4.0。
当然,第三方芯片制造商仍然有自己的优势。
当自动驾驶以外的一个或多个超级应用程序被杀死时,这些应用程序所需要的不是自动驾驶的专用功能,而是一些通用功能,例如NVIDIA强大的GPU功能,这将释放巨大的潜力。
对于地平线而言,其在人工智能方面的能力还需要进一步最大化。
基于Journey 5芯片,地平线还正在进行下一代高级自动驾驶感知系统的演示。该公司表示,该系统可以优化某些方面的效率,
车端阴影模式:将数据上传和存储效率提高100倍;
自动标注自学习:将三维数据标注效率提高1000倍;
AIDI平台工具:将算法工程师的工作效率提高20倍。
与芯片巨头相比,尽管地平线在资源和积累方面没有优势,但围绕自动驾驶提供相关服务和赋能可以帮助这家初创公司进入下一阶段。
祝福地平线和中国芯片行业。
本文首发于微信公众号:阿尔法工坊研究院。文章内容属于作者个人观点,不代表和讯网络的立场。投资者应据此操作,并承担风险。
谁说顶级豪华汽车品牌不内卷?当那些不差钱的车主不再满足于仅仅买一辆“贵”的车,定制化便成为了近些年各家车企转型的方向。当然这对于法拉利来说更像是一种传统,而且它们又要出oneoff了。
1900/1/1 0:00:008月20日消息,从中国海洋石油集团有限公司了解到,今年上半年,中国海油超额完成国内油气增储上产任务,原油增量占全国增量的近八成,生产经营业绩创历史新高。
1900/1/1 0:00:008月20日消息,据国外媒体报道,虽然美国监管机构已开始对Autopilot自动辅助驾驶系统进行调查,调查涉及的电动汽车超过76
1900/1/1 0:00:00文新浪科技花子健编辑韩大鹏8月18日,吉利汽车控股有限公司以下简称“吉利汽车”发布截止6月30日的2021年上半年财报。
1900/1/1 0:00:00盖世汽车讯据外媒报道,由于安全气囊中的充气泵端盖可能脱落,或者气体发生器侧壁可能破裂,Stellantis将召回212373辆2015至2020款Ram车型。
1900/1/1 0:00:00每经记者董天意每经编辑裴健如“从今年6月开始,我们店内每天的成交量都比平时多出一倍,其中大部分都是超标车车主。
1900/1/1 0:00:00