张大妈技术讲堂 篇一:披荆斩棘——华为海思麒麟960SOC全解析
2016年10月19号,华为发布了麒麟最新旗舰级SOC——麒麟960。本文力求避开计算机体系结构和具体设计优化,在搭配麒麟960的终端出来之前,和大家谈谈这颗麒麟960SOC。
首先声明,任何的厂商发布会都是以宣传为目的,吹牛只是多和少的问题,实际情况还需要多维度严谨地去研究。
本文全手打,欢迎拿干货拍砖,但希望无脑吹和黑的值友自重。
一、参数总览
二、规格说明
1、CPU--Cortex A73(sophia)
麒麟950上的公版A72架构比高通和三星自主架构,具有更高的性能和能效比。
A73是ARM在今年初才公布的架构,和A72结构差别较大,反而是属于沉默已久的A17系列演进版。我们知道A9-A12-A17这条产品线,是属于Mainstream Level。A73脱胎于此,ARM官方发布会一直在强调A73的设计理念:让CPU能维持高性能输出状态。
A73相对A72的最大变化便是发射宽度由3变成2,整体流水线变成11级(和A17一致)。我们知道发射宽度对IPC的影响不小,ARM在以下地方有做出改进:
A、前端是顺序结构,减少了指令拾取周期,并且优化了解码效率。
B、去掉多余的AMBA5接口和L1 cache的ECC,更加专注于民用移动应用。
C、L1 cache容量由48KB提升到64KB,cache吞吐量和延迟都有提升。
D、后端全乱序执行,提高了分支预测性能。
ARM官方表示A73可以追上A72的单位性能。在笔者看来,A73的架构和A17太像了(而A17的性能放到现在就很渣),仅仅靠指令集拓展和部分优化是否能产生跨越式的进步,吃瓜群众应该表示怀疑。
在宣传中,ARM采用了很贱春秋笔法,就是默认制程和频率并不一样情况下大谈架构进步!10nm的A73 2.8GHz在保持持续性能上比16nm的A72 2.5GHz高出30%。
按照华为的说法,麒麟960的A73频率提高了100MHz,单线程提升10%,多线程提升18%。如果ARM没吹牛,华为麒麟960CPU部分宣传可信度还是比较大的。
2、内部总线--CCI-550
要说麒麟950的最大缺陷是什么,其实就是内部总线:采用CCI-400搭配了自主内存控制器(因为原配DMC400根本不支持LPDDR4)。因为总线的限制:1、内存用LPDDR4,效果其实和LPDDR3没啥区别;2、内部吞吐也被限制。
麒麟960在这一块补上了短板,使用了最新的CCI-550,峰值带宽为50GB/S,提高内存性能。GPU可以直接和总线互联了,优化了CCI-500引入的监听探针,使得不同内核的调度更为高效。
因此,还好这次更换总线,要不绝对被祖传老总线坑死!
3、GPU--G71(Bifrost架构)
麒麟950上的T880MP4,峰值性能只有adreno530的1/3。ARM的上一代GPU架构竟然用了5年。
Bifrost架构的变化很大,要不也不会采用全新命名了。主要概括为:指令级并行矢量处理演进到了线程级的并行标量处理架构,这种转变的目的就是使得ALU日常处理效率得到提升。
上图为标量和矢量架构在处理不同数据流时候的效率区别。
Vulkan API,这是一个通过软硬件接口优化提高图形渲染效率的方法,其实ARM T880已经原生支持,麒麟960的G71其实只是把之前漏掉的补上而已。
根据官网提供的参数,G71最明显的变化就是三角形生产率下降,像素生成率上升了。ARM宣称G71单位面积电晶体性能表现有 40% 的提升,功耗比提升20%。
笔者认为,按照华为官方的说法,海思960里面的G71MP8,同频达到了近2.8倍的性能,据测算GPU功耗保守估计会增加2倍。
4、UFS2.1
麒麟950SOC搭配的闪存是EMMC5.0/5.1随机混合搭配,详见本人Mate8深入测评https://post.smzdm.com/p/475656/
这一次麒麟960SOC采用的闪存规格是UFS2.1。UFS2.0是JEDEC组织在2013年提出的闪存标准。相比较EMMC,UFS的传输方式由半双工进化为全双工,并且提高了传输带宽。
UFS2.1目前并没有明确的定义,较为合理的解释其实应该是UFS2.0的高速版本(HS-G3 ),理论传输带宽可达12Gbps。因此对于UFS2.1这个命名,笔者认为有宣传成分在里面。具体在手机上,不同供应商的UFS2.0闪存颗粒肯定有不同性能,这点消费者其实也没法控制。
5、基带
对于前一代的麒麟950SOC,使用的是Balong720+VIA CDMA Baseband,应用了双载波聚合,峰值DL速率是CAT.6 300MBbps。
到了麒麟960的基带,可谓突飞猛进。
1、技术规格上,麒麟960的基带是一个崭新的系列(名字未知,但肯定不是balong了)。应用了4载波聚合和MIMO多发射接收技术,下行速度达到600Mbps。
2、根据直播现场发布会负责人的口述,整合的CDMA基带属于自主研发并且绕过了高通的专利!
这款全网通基带,在技术规格上至少和高通snapdragon820上的X12基带持平,除去X16和概念性的X50。因此,高通在移动通信基带上的优势被大大缩小了!
另一方面,高规格峰值速率只是技术极限的象征(就是个最佳值而已)。在实际上网体验中,还特别需要运营商的支持。实际上,要能稳定100Mbps速率,实现全方位覆盖,降低基站转换延迟和网络请求延迟,能实现这些进步才能切实提高网络体验!
5、其他
通话部分预示了下一代Mate的设计:4MIC采样。相比Mate8依靠3MIC打造的上佳通话和录音功能,Mate9显然非常值得期待。
ISP部分,预计依旧是华为法国nice团队研发。发布会上并未公布参数(应该没有提升),硬件增加支持了深度采样、超级分辨率、视频防抖等功能。
音频部分芯片名字HI6403,声学指标稍微提升了一点。这里要警惕华为“HIFI”的噱头,笔者认为实际有点吹牛了喂。硬件支持的采样率提升到了24bit/192Khz,但是具体到使用中,还需要软件的支持。我估计实际水平应该和独立DAC设计会有明显差距。
安全方案,其实ARM官方自己是提供了一个名为“TrustZone”的安全方案。华为InSE属于一个自主定制的,更高级别的认证芯片配合自己的加密算法。
工艺部分,和去年持平,并未采用apple A10fusion上的InFO封装技术(InFO可以把封装基板做薄,有利于布线和散热。这个InFO封装工艺可能被苹果独占了)工艺的提升是世界性难题,按照历史的进程,两年能更新一次工艺节点已经可以烧高香了。
三、竞争力
先吐槽两点:麒麟960最后的宣传结语,“拒绝迷途”翻译成莫名其妙的“Refuse me too”。
,还有傻笑合不拢嘴的麒麟LOGO,这难道要和Mate系列的村炮设计一脉相承么?
海思宣传部门估计雇佣的是以前居委会画吉祥物的大妈。在实力提升的同时还要注意审美要与时俱进呀!看看人家高通塑造在电视广告和平面海报中的骁龙形象!
关于ARM CPU IP授权的问题。凡是和ARM兼容的处理器其实都要交钱给ARM,目前高通三星苹果的自主研发其实就相当于买了个发动机专利来造汽车,采用公版可以比喻为多买了个底盘。自主是相对的,当然也能体现研发实力。GPU部分自由度大一些,目前按照技术排名笔者认为依旧是Imagination>Qualcomm>ARM。
和桌面级别芯片一样,在性能竞赛中,工艺制程的迭代越来越重要,纯架构效率挖掘会越来越困难。A73的研究方向是对的,提高能耗比以维持高频高性能才能实际提高应用体验。基带部分其实是所有移动终端IC设计公司的痛点,英伟达和德州仪器因为基带早就退出了移动SOC竞争,麒麟960的难能可贵,很大程度归功于基带的实力。
对手机终端厂商来说,华为麒麟960具有划时代的意义。因为这颗麒麟960让华为成为全球唯一能垂直整合旗舰手机SOC+高质全网通基带的移动终端厂商!任何手机终端厂商在高端市场做技术选择的时候,无一例外会因为CDMA基带而迁就于高通。华为在自主芯片和通讯基带上的强势,可以极大提高设计自由度,并且软件团队无缝对接硬件团队实现更好的底层优化。作为参照,三星旗舰因为全网统基带的缺失采用双平台策略,使得团队要对两个平台进行优化,结果就是三星高通820平台的优化明显差于自家Exynos8890!
此外,按照以往经验,ARM自主GPU其实是一大软肋,在架构效率上不及Adreno和PowerVR。这次麒麟960将面对的一大问题将是GPU的功耗。简而言之,要么麒麟960GPU性能提升达不到宣传预期,要么GPU会成为SOC耗电大户。
华为在这个节点发布麒麟960,打的就是对下一代移动SOC将近半年的错位竞争优势。在具体性能表现上(前提是ARM没吹牛),笔者认为这颗SOC基本能圆发布会吹的牛。但在下列三个方面存在疑虑:
1、图形表现。峰值性能应该稍微弱于宣传,和Adreno530相当,GPU或许不能稳定高频。
2、拍照表现。根据去年麒麟950发布会宣传和今年华为今年实际拍照表现,如果算法还是没搞好,表现会扑街。
3、快充技术。这个应该和电源管理芯片有关,目前情况不明朗。
笔者认为可预见最明显的提升,则是:麒麟960高效能CPU+新总线+新闪存规格+自家优化=或许会成为速度最快(安卓)手机。
四、结语
华为海思的进步是有目共睹的,麒麟960也确实在技术上日趋完美,但是也不可妄自尊大。其实很多对华为厌恶的数码爱好者大部分是因为某些过于极端的粉丝加上以前华为偶尔很“贱”的宣传手法 。移动市场的竞争非常激烈,苹果除了基带依旧领先全场,今年丢盔弃甲的三星说不准明年会拿出什么“大招”,老牌领头羊高通起码在基带上还是傲视群雄啊。
华为麒麟960在目前为止似乎是一块几乎没有缺点的SOC,这种进步起码让人看到很大希望的,实际表现值得期待。
下一篇计划:谈谈跑分原理:请不要在测试中大篇幅放安兔兔类跑分了我的哥。
本文主要信息参考源:
Anandtech:https://www.anandtech.com/
ARM官网:https://www.arm.com/
Imagination社区:https://imgtec.eetrend.com/
JEDEC官网:https://www.jedec.org/
小苦工
校验提示文案
hugo007y
校验提示文案
犹豫了
校验提示文案
李总好
校验提示文案
我爱小鱿鱼
校验提示文案
永夜光
校验提示文案
旭光呦喂
校验提示文案
Black是只猫
校验提示文案
米斯特爱慕
校验提示文案
Oo似水无痕oO
校验提示文案
一羊千洗
校验提示文案
rafealzheng
校验提示文案
逸墨书生zl
校验提示文案
Ehaschia
校验提示文案
minerva9119
校验提示文案
此号已注销
校验提示文案
闲者小窝
校验提示文案
Startoo
校验提示文案
元夜
校验提示文案
屡试不第沈佳宜
校验提示文案
海克梅迪亚
校验提示文案
九月羽衣
校验提示文案
我爱小鱿鱼
校验提示文案
喝花茶就炸酱面
校验提示文案
P4KCA
校验提示文案
weante
校验提示文案
CK_Skywalk
校验提示文案
含情脉脉林老师
校验提示文案
amitabha007
校验提示文案
不想改昵称
校验提示文案
wiserazor
校验提示文案
拉黑垃圾爆料人
校验提示文案
值友9648411652
最好的处理器还在
骁龙
校验提示文案
robinzhu78
ARM A73架构对于现有的geekbench还有内存性能测试都有很大帮助. google pixel用的是2.15G的820,等821的手机再测一下应该不会太差。
GPU方面,3D性能弱于A530,所以在antutu/GFXbench,Basemark这一块应该会比较弱
校验提示文案
花落他家
校验提示文案
xgc816
校验提示文案
小苦工
校验提示文案
火影忍者神龜
校验提示文案
微机原理
校验提示文案
孤星赏月
校验提示文案