自研神玑芯片,让蔚来ET9感知范围大2倍,决策快1倍?
如今智能驾驶领域方案呈现出两个不同的路线,其中一条路线是小米、小鹏、理想等车企在英伟达、地平线提供的芯片方案进行自研大模型优化,在主流芯片基础上实现软件功能的创新。小米在今天也在发布会上宣布使用双英伟达Orin-X方案,使用自研智驾芯片方案的车企仅有特斯拉和华为,这也凸显了自研智驾芯片的研发难度。
但蔚来在近期NIO Day活动中发布首款自研智驾芯片神玑芯片,也加入倒自研智驾芯片阵营。这款新的自研芯片目标为1颗芯片取代现有蔚来使用的4颗英伟达Orin-X方案,AI性能、ISP性能都有了明显的提升,最小提升幅度都达到了4倍于Orin-X的水平。由于首款搭载神玑芯片车型为2025年交付的蔚来ET9,也宣告了蔚来即将开始使用自研智驾芯片的时间点。而神玑芯片能够为蔚来旗下车型带来怎样的体验收益,以及这款芯片能否在后年继续保持领先,是大家比较关注的点。
芯片架构大更新,单芯片解决多芯带宽限制
在近日的蔚来NIO Day活动中,蔚来发布了代号为神玑NX9031的自研智驾芯片,这款芯片被李斌评价为“用1颗实现4颗旗舰智驾芯片性能”的全新产品。神玑NX9031芯片是业界首次采用5纳米车规工艺制造的芯片,这款芯片将被用于替代现有的蔚来ADAM超算平台,甚至需要拥有与英伟达Thor芯片打得有来有回的计算能力。
图片李斌在发布会上表示,蔚来神玑芯片在BEV类算法性能拥有4.3倍提升,LiDAR类算法性能提升4倍,Transformer类算法性能提升6.5倍。这些性能提升得益于神玑芯片采用了全新的芯片设计,采用了CPU+ISP+NPU的架构模式,与英伟达Orin系列芯片的核心架构完全不同,神玑芯片明显更符合AI人工智能计算环境,这也是其智驾性能提升的关键。
现有算力最强的英伟达Orin-X芯片在核心架构设计方面采用CPU+GPU+ACCEL架构,与传统PC的架构设计逻辑类似,通过GPU的高算力打通AI计算,借用DLA 深度学习加速器模块提升算力,芯片内部的主要算力释放由GPU负责、ACCEL中各功能模块进行辅助补全。
图片神玑芯片的架构设计以CPU+ISP+NPU为主要结构,其中ISP负责像素处理、功能类似于Orin-X上的GPU模块,NPU则专门负责AI相关的神经网络算力加速。NPU的工作原理为在电路层模拟人类神经元和突触,利用深度学习指令直接处理指令,以往需要CPU、GPU处理数千条指令完成的神经元处理,NPU只要一条或几条就能完成。因此,NPU的优势在于拥有更高的数据处理效率,这点是以GPU为主的智驾芯片所无法达到的。并且神玑芯片在Transformer算法方面也加入了专门的加速单元,NPU的性能释放更加符合现在主流算法的性能需求,无需专门的算法编译就可以直接加速。
而在CPU模块,蔚来将大小核设计加入到CPU中,相对于Orin-X也是一个大的创新。从CPU设计图可以直观看出,蔚来神玑芯片的CPU模块由2个Die互联,每个Die包含4颗大核与4颗小核,所有数据由中间的高速缓存输送至ISP、NPU模块。大小核设计的优势在于能够增加多核心并发处理速度,大核负责感知等高性能计算,小核则负责触控、座舱等性能需求较低的场景。根据蔚来放出的设计图,可以看出每个Die都有相同数量的大核与小核,从而减少任务调度带来的处理延时,神玑芯片的CPU工作效率要比Orin-X来得更好。
图片而负责视觉处理的ISP模块则得益于同样在SoC内部,数据传输依靠芯片内缓存即可实现,因此带宽与响应速度更高。神玑芯片内的ISP模块虽然没有Orin-X那般占用非常大的芯片面积,但优势在于大多数AI相关工作已经由NPU处理,ISP的性能压力减小,随着处理能力的提升会获得更大的体验收益。
简单来说,蔚来神玑芯片加入了NPU配置,抛弃了传统的用GPU算力打通AI的传统思路,用专属于AI计算的加速器解决AI相关的问题,计算效率有了大幅度的提升。
而相对于2颗/4颗英伟达Orin-X组合,神玑芯片的优势则在于整体效率。首先,Orin-X芯片间数据传输工作仅依靠PCIe总线(没错,就是电脑上显卡接口的PCIe),X22 PCIe Gen 4速度仅达到了约5GB/S,多芯片模块带宽不够大是一个巨大问题。在现有Orin-X芯片架构体系下,双芯片/四芯片并不能完全释放全部算力。
神玑芯片能够以1打4的优势在于几乎全部的计算功能都在SoC内部进行数据交换,芯片内部缓存拥有更大的带宽与传输速度。神玑芯片的数据处理逻辑为:原始数据-神玑芯片(感知/分析/处理/决策)-动力&转向模块等,整体效率比多芯片方案更高。
体验来讲,神玑芯片能强多少?
从技术角度来看,一切新硬件、技术的应用,都应该服务于体验上的提升。使用了神玑芯片的蔚来ET9,在智能驾驶方面能实现多大的体验升级?通过神玑芯片的多项性能指标,可以推导出蔚来ET9将会拥有怎样的智驾水平。
图片首先来看ISP单元,由于ISP单元主要负责道路关键信息的提取,即我们经常提到的感知方面。神玑芯片的ISP处理延迟达到了小于5ms的水平,相比行业平均延迟缩短75%左右。这意味着蔚来ET9能够在雪天等复杂的天气环境下准确识别目标物,转化为体验方面就是能够拥有更强的主动刹车能力。
在近期火爆的AEB和LCC主动刹车功能中,蔚来ET9大概率能够达到120km/h以上激活AEB并完全刹停,在雪天环境下也能够拥有一个较高的工作速度区间。
图片另外,由于蔚来ET9前方可感知范围超过了40万平方米,并且感知硬件达到了31个,因此NPU单元的感知能力有明显提升。NPU单元的BEV、Transformer模型加速有利于构筑范围更大的BEV构图模型,并且提升对车辆、行人的意图感知能力。转换到体验方面,蔚来ET9将会减少更多的突发刹车行为,车辆规避行为更自然。
如今蔚来NOP+智能驾驶系统在城市NOA领域同样采用了重感知轻地图方案,NPU模块的进化可应用于城市NOA领域。传统激光雷达扫描半径在200米水平,蔚来ET9的激光雷达扫描半径达到了约357米,前方可侦测距离增加了78%,感知范围增加了2倍以上。蔚来ET9将会从更长侦测距离中受益,NPU的激光雷达类算法优化可以提前预测到前方车辆行驶意图,刹车减速、加速等操作可以提前进行处理。
在NPU的专门优化下,蔚来神玑芯片的AI迭代能力将会比之前4颗Orin-X芯片更强,蔚来ET9大概率拥有智驾芯片在非智驾状态下继续工作的功能,学习人类驾驶员的驾驶风格。大概率神玑芯片会为蔚来ET9带来个性化的智能驾驶风格选项,车机芯片能够学习驾驶者的驾驶风格,让智能驾驶开得更像人类。
基本上可以确定的是,神玑芯片能够为蔚来ET9智能驾驶系统带来更准确的目标识别以减少误触现象,能够在多种极限环境下实现提前刹车,AEB工作范围也将大幅提升,甚至城市NOA驾驶体验也会变得更像人类、更具个性化。
总结:在智能驾驶领域,算力和算法的提升基本上是最直接能作用到驾驶体验方面的因素。蔚来做自研神玑芯片的优势在于加强AI与感知方面的计算,比现在4颗Orin-X用高GPU算力打通AI的方案效率更高。神玑芯片做到了仅一个芯片的更新,就能够让智驾系统变得更加灵敏、大模型迭代能力更强,体验升级明显。
张志涛
校验提示文案
张志涛
校验提示文案