你们都得退休!ARM Cortex-A35构架分析
你们都得退休!ARM Cortex-A35构架分析
2015-11-11 17:48

你们都得退休!ARM Cortex-A35构架分析

今天凌晨ARM在自家的技术大会中,发布了超低功耗的处理器构架Cortex-A35(代号水星)。厂商可以根据性能和功耗需求,对它的构架进行再设计,将其用在不同的领域。


你们都得退休!ARM Cortex-A35构架分析

Cortex-A系列分为高性能、低功耗和超低功耗3类:

  • 高性能系列的代表当然是ARM的大核构架Cortex A57和A72(还有在慢慢退市的A15和A17);

  • 低功耗系列的代表是高效能比的A53,根据需求,它可以以多核,或者 big.LITTLE大小核的形式工作;

  • 而超低功耗系列,在A5和A7之后,现在新增了A35。

虽然看起来有点反直觉,但A35和A53不是一个系列,A35是A7/A5的继任者(ARM的产品数字增长得真快……)。


你们都得退休!ARM Cortex-A35构架分析

在Exynos 5433测试中,我们发现作为升级版A7的A53,照样维持不了A7的功耗水平,它更像是把A7的效能曲线延长的产品,就是说A53的性能功耗比并没有多少提升。但因为A53普遍更高频,所以它在性能端可以走得更远。而A35这次主推能耗比,其实是在给当年吹过能耗比的A53打脸。

不过从战略意义上说,A35带来的最重要改变,是让Cortex-A系列上中下三路产品,都用上了64位的ARMv8构架。在A5/A7等老构架退休后,它就可以完成“全家64位”的宏愿了。此外,A35也可以和A72/A57/A53等核心组成big.LITTLE 大小核结构的SoC,可以让厂商根据需求,搞出各种大小核的组合产品,夸张一点,甚至可以搞出A35+A53+A72的三核心簇的SoC。

 

构架改进

你们都得退休!ARM Cortex-A35构架分析

A35和A7/A53一样,依旧是顺序执行的双发射构架。8级流水线长度,也和之前的构架设计没什么分别。ARM主要通过改进独立分区(individual blocks)来提升能效比。

  • 重点改善的是核心的前端效率,重新设计的指令预取单元,更强的分支预测性能。为了平衡性能和功耗,指令预取带宽也跟随队列长度的变短而做出了调整。

  • 对比A7,A35在缓存速度上有了明显的提升。A35套用了很多A53的缓存结构,一级缓存可以用作指令和数据缓存,加入了多线程的数据预测和写入侦查能力,根据需求可以定在8-64KB之间。二级缓存可以定在128KB-1BM之间。在提升写入效率,引入附着优化功能以降低占用的同时,也提升了资源共享的性能。

  • 另外一个大改进是 NEON/FP流水线,除了改善存储性能外,新的单元全流水线支持双精度乘法计算。流水线同样为了提升局部效率而进行了改进,这也是A35芯片面积可以比A53小的重要原因。

  • 在电源管理方面,A35也很像A53,它为CPU和NEON流水线(独立的电源供应区域)增加了状态保留功能(在休眠时,让核心保持原来的状态,类似iOS的墓碑模式),它多了个硬件来控制CPU进出保留状态。厂商很少使用这个功能,暂时确认有引入这个功能的是骁龙810,但或许因为发热问题,它也在随后的软件更新中禁用了这个功能,让在CPU闲置的时候直接关闭核心了。

 

低功耗/可定制化/超小芯片面积

你们都得退休!ARM Cortex-A35构架分析

A35盯准的功耗区间是125mW以下,这也是A7和A5通常的功耗范围。为了方便我们脑补,ARM表示,用28nm制程的1GHz主频A35处理器,其功耗只有90mW。当然,就像现在不同SoC里的A53,因为核心数、主频和工艺节点不同,A35核心的功耗也会很大的波动(例如用14/16nm制程,或者把主频推上2GHz)。


你们都得退休!ARM Cortex-A35构架分析

而A35也是ARM可定制化最高的构架,厂商能选择的不再只有核心数,他们可以选择是否加入NEON, Crypto(加密)和ACP(解析) 单元,甚至是否加入二级缓存都可以自行选择。这让A35可能成为下一代手机中应用最广的核心构架,我们也很可能会在可穿戴设备和嵌入式平台上,看到一大堆为IoT(物联网)定制的A35处理器。

对比32KB一级缓存,1MB 二级缓存,有NEON/Crypto加密模块的4核A53,剔除其他部分的乞丐版单核A35(8KB一级缓存,没有二级缓存),即使用28nm制程也能把芯片面积控制在0.4平方毫米一下(1*0.4mm,这可比米粒要小多了),这让它非常适合做成物联网芯片。


性能提升

你们都得退休!ARM Cortex-A35构架分析

在相同的核心数和频率下,A35构架宣称功耗比A7低10%,而且性能要高6-40%。在整数运算(SPECint2006测试)中,可以提升6% ;浮点运算(SPECfp2000测试)中提升更大,可达36%。

根据需求,A35可以做到A53 80-100%性能。在浏览器负载测试中,A35和A53的差距最大,A35最多只能提供A53 80%的性能;整数运算负载测试中,A35可以达到A53 84-85%的性能;而对于提升最大的缓存性能,反映在需要缓存性能的负载测试中,则可以有接近A53的性能表现。

A35的芯片面积只有A53的75%,而功耗则只有A53的68%。ARM宣称他们可以同时使用,甚至和A53做成大小核构架的SoC。


你们都得退休!ARM Cortex-A35构架分析

A35只要把频率提升,就能补上和A53的性能差距。即使再最差的方案中,高频A35会吃掉自己在功耗上的优势,但厂商依旧可以换来更小的芯片面积,照样可以省下一大笔费用。

如果正如PPT所说,无论是单独组成多核SoC,还是和A72等大核组成大小核结构的场合,都已经没什么必要使用A53构架了,A35很可能会代替A53。

ARM预计首批A35设备会在2016年末出货,因为用途和适应性奇广,它毫无疑问会成为之后数年里,ARM系列中最重要的的核心构架之一。

这么一想,A35在接下A5/A7的工作之后,顺便也让A53领便当了……

不过作为跑分党,笔者更关心高性能核心A72的表现,毕竟要同时抗衡苹果的A9、高通的Kryo和三星的猫鼬,一不小心就得领便当了。

via:anandtech

你们都得退休!ARM Cortex-A35构架分析

分享:
方查理
平凡的机佬
福利!

扫描二维码,关注作者

分享微博 分享微信
爱搞机微信

爱搞机微信

搞机啦微信

搞机啦微信

推荐产品

抱歉,产品库没有您要找的产品

试用