汽车 GPU 算力新高度支持智驾芯片实现架构创新

本文作者:翔煜 陈娇 商瑞       点击: 2024-12-02 11:04
前言:
作者:翔煜 陈娇 商瑞 北京华兴万邦管理咨询有限公司
随着汽车行业在“新四化”领域内迅猛地进步,汽车电子电气架构正在发生显著的变化。智能化的深入促使汽车计算架构逐步由传统的以分域来进行风险控制的分布式架构,转向以强调高性能计算同时减少冗余硬件和系统复杂性,从而提高系统效率和可靠性的中央计算架构。与此同时,一些新兴的功能在新车中的渗透率也在不断提升,例如在汽车座舱内人机界面(HMI)领域,诸如车内屏幕显示交互及后排娱乐屏幕等,其年度增长率大致维持在8%左右;而在高级驾驶辅助系统(ADAS)方面,增长率基本达到10%,部分研究机构所报告的增长率数据甚至更高。在此背景下,汽车对GPU算力的需求呈现出爆发增长的趋势。

汽车应用需要更高GPU算力和硬件虚拟化
随着先进驾驶辅助系统(ADAS)和各种级别的自动驾驶(AD)被广泛引入到汽车应用中,以及新一代汽车更加注重人车互动和车与环境交互功能,汽车对车载计算单元的算力需求大幅提高。智能化汽车中的各种传感器在短时间内就会生成大量数据,即使在较低级别的自动驾驶系统中,每小时也能生成 25GB 数据。面对如此庞大的数据量,市场需要能够高效处理大量信息的硬件来完成计算任务。由于CPU采用流水线处理架构,因此不能够高效地完成集中处理这些数据的任务。

面对这些巨量的数据,行业的解决办法是采用NPU和GPU 来执行不同的并行计算,这是因为这两类架构都具有大规模并行处理单元。在某些情况下,相比于以前的GPU,NPU的运算速度可能更高,但是因为NPU是一种基于特定加速器的并行计算单元,因此面对新的应用、功能和算法,其灵活性、适应性和产品生命周期远不如GPU。因此,在目前ADAS和AD还不是每辆车的标配,以及性能需求不断演进变化的情况下,市场上完全采用NPU架构的智驾芯片和解决方案提供商很难盈利,这些智驾芯片厂商总是在不断地开发新的硬件(特定加速器)和流片,同时也使主机厂和tier-1总是不断花费巨大的人力物力来适配他们的新芯片。

鉴于性能上的显著差异, GPU已成为同时支持智能驾驶、开发新一代座舱和支持AI功能的不二之选。GPU具备众多计算核心,不仅能够同时执行大量计算任务并展现出卓越的并行计算能力,而且还能够通过软件编程的方式,在一颗基于GPU汽车主控芯片上就能完成多样化的图形图像数据处理、基于渲染的人车交互和人工智能推理等各种任务,因此比采用NPU架构的智驾芯片具有更高的灵活性和可扩展性。在实际的汽车应用场景中,这种基于GPU的汽车主控芯片可以针对不同主机厂、不同车系和不同车型的需求定制自动驾驶功能、信息娱乐系统和V2X方案,可以通过模组化软件配置来大大降低主机厂及tier-1的开发难度和成本。

当然,要完美地实现以上功能和利用GPU架构的灵活性和适应性来帮助整个智驾产业链条上的玩家降难度和减成本,就需要GPU一方面要具有足够的算力,另一方面还要具有能够实现硬件完全隔离的虚拟化能力和可扩展的多核心能力。除此以外,在日益普及的CPU+GPU+NPU架构中,高算力的GPU还可以支持NPU(AI加速器)发挥人工智能的推理能力,确保车辆在行驶过程中能够迅速做出决策,提高了系统的响应速度和安全性,这种架构中GPU的灵活性与AI加速器的高性能相得益彰,可共同推动智能化汽车不断迈向新的发展阶段。

目前,市场上已经出现了能够同时满足上述三种要求的GPU IP产品,为新一代基于GPU或者GPU+NPU的智驾芯片的开发提供了大力支持。Imagination Technologies公司在不久前推出的DXS GPU是业内首款可以同时提供高算力、硬件虚拟化、多核心、支持RISC-V架构的 GPU IP产品,非常适合中国智驾芯片开发商从纯粹的NPU架构转向开发基于GPU架构的智驾芯片,除了其DXS GPU的高算力和多核能力,而且还可以提供独一无二的HyperLane硬件虚拟化技术,帮助主机厂和tier-1用一颗主控芯片实现多样化的功能及配置。

Imagination 是享誉全球的GPU IP提供商。1992年,该公司推出了创新的PowerVR GPU架构,采用该架构的GPU IP不仅在桌面应用、移动平台、消费电子和游戏设备等多个领域产生了广泛影响并持续至今,而且在汽车领域也被诸多领先的芯片企业采用,全球已有高达130亿台电子设备和汽车采用了该公司的GPU IP。Imagination 在车载领域拥有超过二十年的技术积累,其GPU IP被用在驾驶、座舱与信息娱乐系统等领域的芯片中;作为汽车GPU IP的领先供应商,具有领先同侪的市场占有率。其DXS GPU的问世,不仅满足了现代汽车对中央处理单元的高性能需求,还通过创新的分布式安全机制,解决了功能安全与性能、芯片尺寸之间的冲突,为汽车智能化进程注入了强劲动力。
     
      

Imagination DXS GPU 的性能优势
相较于上一代GPU产品,Imagination在设计DXS GPU时新增了一个SPU单元,从而使得DXS GPU的整体硬件性能提升了50%。得益于全新的设计,最新发布的DXS GPU所采用的工艺节点为5纳米,这使得其系统运行频率相较于上一代产品有了显著提升。如需进一步拓展,还可将其配置为四核,在主频达到1.5GHz的条件下,DXS GPU将能够实现9TFLOPS FP32的性能以及32TOPS的int8性能。

Imagination汽车产品总监章政表示:“GPU在图形处理方面具有显著优势,特别是具有并行处理能力,使得GPU能够高效地进行大规模计算,从而提升图形性能。我们最新推出的DXS GPU解决方案算力可从0.25 TFLOPS拓展到1.5 TFLOPS,这一可扩展、灵活的特性可以满足汽车中不同等级自动驾驶对图形处理性能和计算的需求。”
 
 
在以填充率为中心的图形工作负载上,性能相比竞争对手最高可提升28%,在安全关键型工作负载上更是能达到成倍的性能提升。相比IMG BXS GPU,优化过硬件架构DXS GPU在结合双重速率FP16加上额外的SPU,能为FP16工作负载提供3倍性能。DXS GPU还支持FP16/FP32/INT8/DOT8等行业标准数字格式,此外,该GPU相比前代提供更大片上内存用于加速计算。

DXS GPU提供单、双、三、四核灵活配置,可作为多个独立GPU核心运行,也可作为单个大型GPU跨多个核心调度任务,支持通过低带宽总线在核心间分配工作,并支持跨Chiplet桥接,进一步增强了核心之间的通信和协作能力,使得整个系统在处理复杂任务时更加高效和灵活。

此外,Imagination也深知软硬件协同优化的重要性。因此,在DXS GPU中,Imagination特别增加了片上存储,以减少带宽瓶颈,同时增强了算术逻辑单元(ALU)计算能力。这些优化措施使得DXS GPU在处理图形任务时更加高效。同时,Imagination还提供了强大的软件支持,包括针对特定工作负载优化的软件库和工具,帮助开发者充分发挥GPU的潜力,实现最佳的图形性能。

车用GPU与移动平台所用GPU的不同:FuSa
在11月12日,Imagination宣布其DXS GPU IP正式通过SGS-TÜV Saar(SGS旗下,世界领先的测试、检验和认证机构)的全面审核与评估,获得了ISO 26262标准的ASIL-B级别认证。这一成就标志着DXS GPU所采用的独特的分布式功能安全机制(FuSa)已经获得了行业内的认可。特别是在汽车应用领域,GPU对于FuSa有着严格的要求,这包括了冗余设计以及在某些功能失效时的应对策略。鉴于汽车电子系统的故障可能引发严重的交通事故,因此功能安全显得尤为关键。
 
 
Imagination 的 GPU 采用获得专利的分布式安全机制(DSM)和其HyperLane硬件虚拟化技术一样,都是针对汽车等GPU应用开发的高价值创新,可以以极小的芯片面积代价去满足汽车应用特定的需求。DSM通过在多个子模块中分散部署安全检测逻辑,实现对功能安全的全面覆盖。具体包括安全对、空闲周期占用、测试向量生成与执行、分布式故障检测与报告等创新点,在仅增加约 10% 的面积开销的情况下,能有效检测到超过 90% 的单点故障,符合 ASIL - B 的要求并获得了认证。      

随着汽车新四化(电动化、智能化、网联化、共享化)的不断推进,汽车中的芯片数量将快速增加。除了关注这些芯片的算力和连接带宽等性能之外,同样重要的是打造和推出全新的功能安全解决方案。Imagination结合GPU这种处理器的架构特点,在提供业内领先的算力之外,还利用GPU的运行特点来打造了创新的分布式功能安全机制,消除了以前的锁步等其他功能安全方案实现机制带来的性能降低以及成倍片芯面积,为电子行业在相关领域内的创新提供了一种全新的模式和思路。