欢迎关注我们的公众号“阿宝1990”,这是一个专注于自动驾驶和智能座舱的汽车干货分享平台。在这里,你将每天接触到一篇关于汽车的深度解析,我们的视野不仅局限于汽车本身,更致力于探索其背后的科技与创新。
4月24日,地平线在北京隆重推出了征程6系列芯片,并在现场展示了基于该芯片的域控制器,展示了其即将在2024年底进入量产车辆的潜力。这一重大进展标志着汽车智能驾驶芯片实现了快速上车的新篇章。
征程6系列并非先前所猜测的3款芯片,实际上包含6款,这一阵容足以应对智能驾驶领域的各种场景和价位需求。在发布会上,地平线重点介绍了征程6B、6E、6M和6P这四款芯片,其中B、L、E、M和H的命名似乎暗示着不同的性能定位。尽管地平线尚未公开征程6L和6H的详细参数,但根据推测,6H的AI算力可能达到256-300 TOPS,CPU算力则为250-300K DMIPS。相比之下,6L的AI算力为30-40TOPS,CPU算力则为40-50K DMIPS。
与征程5系列相比,征程6系列的显著升级之一在于其CPU算力。征程5系列采用的CPU是8核心Cortex-A55,其算力大约在25-30K DMIPS范围内。而此次发布的征程6系列,除了最低端的6B之外,其余型号的CPU算力均有了显著提升。
此外,征程6系列还引入了BPU架构的升级。BPU是地平线对AI加速器的独到称呼,其中“B”代表Brain,意指该处理器类似于人脑的工作方式。地平线在BPU架构的研发过程中,分别致敬了数学家伯努利、贝叶斯和博弈论创始人纳什,这反映了其在智能驾驶技术上的不断创新与追求。
博弈论主要探讨智能车与智能车、智能车与非智能车之间的决策交互影响。当前,多数智能驾驶技术仅关注单车决策,忽视其他车辆的影响,导致智能车在面对某些情境时显得不够灵活。例如,当对向车辆主动让路时,智能车可能因无法理解其意图而错失良机。
强化学习(RL)是智能驾驶策略的核心,它通过与环境交互来训练智能体。RL最初基于Markov过程提出,让智能体在不确定环境中学习最优策略,通过奖励/惩罚机制进行训练。然而,在多智能体环境下(如多车交通场景),情况变得更为复杂。
若智能车旨在改善城市交通,每辆车的决策都将影响其他车辆,可能引发冲突。这时,博弈论的RL算法显得尤为重要,它使用深度神经网络逼近函数,迭代计算子游戏的收益矩阵。通过不断优化,该算法能找出最优策略,指导智能车的决策。
征程6系列AI加速架构采用纳什均衡理念,旨在提升智能驾驶性能。其中,征程6B以性价比为优势,配备6核心Cortex-A55 CPU和14或28纳米制造工艺,吸引国际客户如博世和电装,以及国内客户四维图新、福瑞泰克和Minieye。其竞争对手主要来自Mobileye的EyeQ5M/H和EyeQ6L等芯片。
征程6系列的核心产品是E/M,它充分利用了纳什均衡理念,旨在进一步优化智能驾驶性能。这一产品不仅性能卓越,还兼具成本效益,因此深受国际客户如博世和电装,以及国内客户四维图新、福瑞泰克和Minieye的青睐。其市场表现不俗,甚至与Mobileye的EyeQ5M/H和EyeQ6L等知名芯片展开了竞争。
征程6系列预计在2024年内启动首批前装量产车型的交付工作,并计划在2025年实现超过10款车型的量产交付。针对中阶智驾市场,地平线推出了具有竞争力的城区性价比方案——征程6M,以及为高速NOA提供极致体验的方案——征程6E。此外,公司还提供了符合AEC-Q104车规标准的SiP模组和Matrix 6域控参考设计,以实现高集成度、低功耗和优化系统成本的目标。在最近的一次发布会上,地平线宣布与多家Tier软硬件合作伙伴共同推进征程6E/M的合作,并预计到2024年第二季度,将有超过50家生态伙伴推出基于征程6E/M的准量产级产品。
接下来,让我们聚焦于征程6系列的旗舰产品——征程6P。这款车型无疑成为了大家关注的焦点。
征程6P搭载的AI算力达到了560TOPS,这一数据在地平线发布会现场备受瞩目。值得注意的是,这款车型所标注的560TOPS是在1/2稀疏网络下的等效算力,并未提及精度,推测可能为INT8位。实际上,这一算力已远超4片Orin合并后的总算力。在当前车载领域,即便是最顶级的车载以太网交换机,其带宽也不超过25GB/s;而典型的PCIe 0交换机,带宽则被限制在32GB/s以内。即便是价格高昂的PCIe 0交换机,其带宽也难以突破120GB/s。因此,要想实现类似于服务器行业中4个H100带来的4倍算力提升,所需的带宽至少要达到900GB/s,这在现有技术条件下显然是无法达到的。即便是最顶级的车载以太网交换机连接4个Orin,其算力提升也仅能达到2倍单个Orin的水平,即300TOPS。这也正是英伟达投入十几亿美元开发NVLINK技术的原因所在,而该技术目前因美国管制而严禁出口。
地平线征程6P所搭载的CPU采用18核心的ARM Cortex-A78AE架构,其算力高达410K DMIPS。相比之下,英伟达的Orin-X虽然内核同样为ARM Cortex-A78AE,但仅有12核心,其算力为227K DMIPS。值得注意的是,由于Orin的GPU发热量相对较高,其CPU频率有所降低。而地平线的征程6P在GPU方面的算力为200GFLOPS,发热量较低,从而使得CPU频率得以提升,其整体算力几乎达到了英伟达的两倍。此外,华为的昇腾610在CPU方面则配备了16核心,其算力为200K DMIPS。
征程6P内部配备了一个小型的GPU,其算力为200GFLOPS,专门用于处理智能驾驶领域的图像输出,以便将图像呈现在仪表或中控屏幕上。
为了进一步优化成本控制和供应链管理,同时简化软件架构,征程6P内部新增了一个ASIL-D级的MCU岛,其算力达到10K DMIPS。当前,许多车辆使用独立的安全MCU来操控底盘,如英飞凌的TC397,但该型号价格高昂、波动大且供应不稳定,其最高算力为4K DMIPS,典型值为7K DMIPS。地平线此次采用的MCU具体型号未公布,但预计可能与高通SA8650/SA8255/SA8775等4核心ARM Cortex-R52内核相似,运行频率可能位于800-1000MHz之间。
在存储性能上,征程6P升级为LPDDR5,提供高达205GB/s的带宽,与英伟达Orin持平。其前视感知系统可支持1800万像素的分辨率,并具备3Gpixel/s的图像带宽。
内部配备TB/s级高性能总线,实现极低的访存延时,仅为130纳秒。
为应对新一代大模型Transformer中的大量矢量运算,我们特别引入了VPU——矢量浮点运算加速单元,以进一步提升计算效率。
地平线征程P6以高达370亿的晶体管数量脱颖而出,相较于英伟达Orin的170亿和Xavier的90亿,展现了显著的领先优势。与此同时,地平线还发布了全场景智能驾驶解决方案SuperDrive,其核心在于拟人化体验的突破,旨在打造更出色的智驾系统0。通过融合动态、静态和OCC三网合一的端到端感知架构,以及数据驱动的交互式博弈算法,SuperDrive无论在何种道路环境下都能实现高场景通过率、高效通行以及高度拟人化的驾驶行为。在拥堵汇流、路口交互、动态Driveline、礼让骑行人、拥堵换道以及城市环岛通行等复杂的城区场景中,SuperDrive都能为用户带来既优雅又不失从容的智能驾驶体验。
动态、静态与Occupancy三网融合的端到端感知架构,是精准再现客观物理世界的关键技术。该架构通过遮挡准召率提升70%,动态代码行数减少90%,网络负载降低50%,从而有效解决了当前行业感知架构面临的高时延、繁琐规则和沉重负载等问题。同时,数据驱动的交互博弈算法为SuperDrive带来了更加拟人的决策能力,使其能够像经验丰富的司机一样灵活应对复杂的交通流。在拥堵环境下变道成功率提升了50%,路口通过率更是提升了67%。
此外,随着美国对中国高科技领域的敌意不断加剧,英伟达Thor芯片很可能无法出口至中国,这进一步推动了芯片领域的国产替代进程。