MCPLive > 杂志文章 > AMD Carrizo第六代A系列处理器技术解析

AMD Carrizo第六代A系列处理器技术解析

2015-07-07何方《微型计算机》2015年7月上

AMD宣布推出全球首款使用系统级芯片(SoC)设计的第六代A系列高性能加速处理器(APU),这款处理器号称“重新定义笔记本电脑”,可以带来两倍于上代产品的电池续航时间以及更强的游戏性能。那么这些特性是如何实现的?在前几期的杂志上我们曾经对其进行过详细的技术解析,而在刚刚举行的AMD 2015技术日上,我们又从AMD官方获得了一些更正式的资料,从而让我们对这款产品有了更充分的了解。

在时间碎片化的今天,笔记本电脑的需求依旧旺盛,毕竟目前的平板暂时还没有办法在很多高强度、高负荷工作中取代笔记本电脑。不过,这并不意味着笔记本电脑就是全能的,之前一些入门和主流笔记本电脑在3D游戏乃至4k高清视频解码方面也是力有不逮。要想满足这些应用需求,我们需要从处理器这一性能核心着手,这也是移动处理器平台更新的动力。

在AMD 2015技术日上,AMD分别发布了针对桌面平台的Godavari处理器和针对移动平台的Carrizo处理器,从而完成了2015年的产品更新。相对于Godavari处理器,我们对采用SoC设计的Carrizo APU更感兴趣。在AMD推出的“25×20”能效计划的执行过程中,Carrizo APU是非常具有代表性的一款产品。Carrizo是第一款采用SoC设计的主流APU,它拥有多项新技术特性:HEVC硬件解码、异构系统架构HSA 1.0、ARM TrustZone……

Carrizo APU是AMD推出的第6代移动平台APU。
Carrizo APU是AMD推出的第6代移动平台APU。

在AMD推出的“25×20”能效计划中,Carrizo APU是一款非常具有代表性的一款产品。
在AMD推出的“25×20”能效计划中,Carrizo APU是一款非常具有代表性的一款产品。

更长续航时间

对于笔记本电脑来说,续航时间是影响使用体验的关键指标,其重要性几乎与性能并列。根据AMD官方的测试,在其他条件接近的情况下,采用AMD FX-8800P APU的平台的续航时间是采用AMD FX 7600P APU的平台的2.3倍,这个数值比AMD宣称的“Carrizo APU的续航时间高可达上代产品两倍”还要夸张。要获得更长的续航时间,就需要有更低的功耗,而通常来说降低功耗常用的手段有两个:改进制程工艺和改进芯片设计。那么Carrizo APU采用的是哪种方式呢?

首先可以明确的是,Carrizo APU跟上一代Kaveri APU一样采用28nm制程,但是CPU核心从4个“压路机”核心变为4个“挖掘机”核心,而GPU部分则采用第三代次世代图形核心(GCN)架构,总计拥有12个计算核心(4个CPU+8个GPU)。而在相同工艺下实现更低的功耗,关键就在于AMD对“挖掘机”核心的设计思路进行了改变。从这张“压路机”核心和“挖掘机”核心对比图中我们可以看到,“挖掘机”的硅片面积减少了很多。一般来说,面积减少只会有两个原因:一是采用了更好的制程工艺,比如22nm或者14nm,但Carrizo APU还是采用28nm制程;另一个就是减少了晶体管,性能可能出现缩水,但实际上Carrizo APU的性能却不降反升。这是怎么做到的呢?

AMD Carrizo APU芯片规格
AMD Carrizo APU芯片规格

Carrizo APU的“挖掘机”核心采用高密度库设计。
Carrizo APU的“挖掘机”核心采用高密度库设计。

采用高密度库设计后,“挖掘机”核心同制程、中低频率下的功耗显著降低。
采用高密度库设计后,“挖掘机”核心同制程、中低频率下的功耗显著降低。

AMD Carrizo APU的每瓦特性能提高了2.4倍。
 AMD Carrizo APU的每瓦特性能提高了2.4倍。

我们都知道,AMD在收购ATI之后,就开始同时拥有CPU和GPU两方面的尖端技术积累,这两者在芯片研发方面其实是有共通之处的。2012年,AMD在做架构设计的时候,发现GPU在引擎处理方面的一些工艺、技术,实际上是有可迁移性的。比如说晶体管的装配方式,也适用于CPU核心。在Carrizo APU上,AMD就选择了高密度库(High-density Library)进行芯片设计,减少了核心面积。唯一的问题是,采用高密度库之后需要降低频率才能保持稳定工作。但这种做法可以让Carrizo APU把核心面积缩小26%到35%,而且由于面积更小,所以晶体管之间的距离也更紧凑,在运算过程中也能够降低功耗。Carrizo APU针对的是主流市场,也就是功耗在15W到25W之间的产品。通过AMD给出的,与Kaveri APU的性能功耗曲线对比可以发现,Carrizo APU在15W到25W主流功耗段上实现了大概10到12W的功耗降低。如果按照每瓦性能计算,实际上Carrizo APU的性能比上一代Kaveri APU有明显提升。如果看每频率上的性能,例如IPC(每时钟周期指令数),其实也是提升的。

除此之外,采用SoC设计也是降低功耗的一个方式。其实AMD在上一代的部分入门级产品中就已经使用过这种设计,比如说Kabini、Beema,而这次的Carrizo APU则是首次在高性能产品上应用SoC设计。这一方面说明AMD在芯片功耗控制方面有了明显进步,另一方面也说明AMD的融合道路正在取得成功。CPU与GPU的融合是第一步,融合南桥是第二步,而彻底整合视频处理、安全等核心之后,Carrizo APU成为了首颗针对主流移动平台的SoC设计的APU,为PC的产品创新提供了基础。

面向全能应用

对于用户来说,笔记本电脑的续航时间很重要,但是性能同样不能因为追求续航而受到太多限制或者降低。AMD在发布Carrizo APU时称之为“全能的笔记本电脑处理器”,要满足商用办公、媒体娱乐、3D游戏和各种计算体验,自然需要足够的性能。那么在提高性能和改进应用体验方面,Carrizo又有什么新的改进呢?

Carrizo APU的一级缓存容量翻倍,并且对功耗和速度进行了较好的控制。
Carrizo APU的一级缓存容量翻倍,并且对功耗和速度进行了较好的控制。

在Cinebench测试中Carrizo APU的单核和多核性能都较上代有一定提升。
在Cinebench测试中Carrizo APU的单核和多核性能都较上代有一定提升。

缓存和IPC

Carrizo APU性能的提升不只是来自于频率,它同时还加入了一些新的特性。首先,Carrizo APU提升了缓存的性能,增加了一倍的一级数据缓存,缓解了Kaveri APU上出现的缓存性能瓶颈。第二,Carrizo APU改进了分支预测,能够在CPU核心上对下一波数据量做智能化预测,从而减少CPU的等待时间,提高整体性能。第三,Carrizo APU降低了二级缓存的延迟时间,从原来的19个时钟周期降到了18个时钟周期,提高了数据交换效率。此外,Carrizo APU也更新了指令集,加入了AVX2、MOVBE、SMEP、BMI1/2等指令集。Carrizo APU在Modern Standby方面也做了优化,能够缩短读取CPU核心的时间。终,Carrizo APU在IPC(每时钟周期指令数)方面提升了4%到15%(提升幅度取决于具体的工作负荷和运算频率)。通过这些改进后,Carrizo APU的单核和多核性能都得到了提升。

“挖掘机”核心扩大了一级缓存,改进了预测机制,并且加入了新的指令集。
“挖掘机”核心扩大了一级缓存,改进了预测机制,并且加入了新的指令集。

动态UVD电源门控可以充分利用3/4的空载时间降低功耗。
动态UVD电源门控可以充分利用3/4的空载时间降低功耗。

UVD 6视频处理

视频播放也是大多数人在笔记本电脑上常用的功能,在进入高清时代后,视频的硬件解码是降低系统资源占用的主要方式,而越来越高级的视频压缩技术对硬件性能的需求也越来越高。Carrizo APU采用了改进的UVD 6统一视频解码器,提供了对HEVC/H.265、4K分辨率H.264硬件解码的支持,同时还利用视频稳定技术实现了对超高清视频的支持。改进的HEVC/H.265硬件解码技术不但可以解码新的流媒体视频,还可以提高播放效果,降低播放时的功耗,从而有助于提高笔记本电脑的实际续航时间。另外,AMD在国内还与迅雷、暴风影音等视频播放器合作,开发了针对APU优化的HEVC/H.265播放器版本。

一般来说,视频在视频解码器处理之后,还要交给GPU来做一些后处理,比如视频的写入、读取、缩放等,后再输出到屏幕。而UVD 6在视频解码处理的流程方面进行了一些改进,在视频播放的时候,后台会有一个额外的视频处理通道,确保视频播放能够更有效地执行,这个新的通道叫做底层支持(Underlay support)。通过底层支持,Carrizo APU在处理视频时不必通过GPU环节,因此不但处理的效率更高,可以实现对4K视频解码的支持,还能够实现超过500mW的功率节省。而且由于解码带宽的增加,Carrizo APU在1080p视频解码方面,所需要的时间只是上一代Kaveri APU的1/4,在帧与帧之间可以空余出更多的时间使机器处于闲置状态,从而降低功耗。在这种情况下,通过专门的电路设计,Carrizo APU可以充分利用帧与帧之间闲置的3/4时间,使整个处理器、运算单元处于关停状态,极大地降低了功耗。这种动态的UVD电源门控、功耗管理,能够让笔记本电脑的视频播放续航再增加半个小时。另外,UVD 6还支持4K MJPEG解码,这个功能可以降低使用USB摄像头进行视频聊天时处理视频的功耗。4K MJPEG解码加上H.264的4K视频输出,就构成了一套4K视频会议处理流程。

新的UVD 6可以让Carrizo APU视频解码播放的功耗降低一半。
新的UVD 6可以让Carrizo APU视频解码播放的功耗降低一半。

Carrizo APU采用第三代GCN核心。
Carrizo APU采用第三代GCN核心。

GCN、HSA

提到APU性能的提升,肯定离不开在其中占据重要位置的GPU核心,GPU是APU相对于竞争对手的传统优势。Carrizo APU拥有8个第三代GCN核心,能够实现819GFLOPS的运算速度。这8个第三代GCN核心拥有512KB的共享二级缓存,增加了16位浮点指令集,通过增加指令集进一步优化了CPU和GPU之间的共享。而在图形特性方面,第三代GCN核心优化了曲面细分性能,并且支持DirectX 12、Vulcan、Mantle等多线程API,可以在新的游戏中有更好的表现。此外凭借对DirectX 12的支持,相信Carrizo APU在Windows 10上会有不错的发挥。对于GCN核心的技术特性,我们在之前的文章中已经进行过全面的介绍,这里就不再赘述。另外,Carrizo APU是全面支持HSA 1.0架构的产品,对于存储统一调用和任务调度进行了进一步优化,相比上一代的Kaveri APU效率更高,对于复杂的应用来说可以显著提高效率,这也是Carrizo APU号称能够满足游戏、商业计算、高清视频等各种应用需求的信心来源。

写在后

从目前公开的技术资料来看,Carrizo APU在制程工艺不变的情况下,通过对芯片布局、模块整合、核心优化、技术改进等方式,实现了更低的功耗和不错的性能提升,而这两方面对于笔记本电脑乃至跨界产品来说都显得至关重要。而且全集成的SoC思路、HSA 1.0异构计算以及UVD、安全处理器的设置,让这款新的APU可以适应多种产品应用模式。现在,你是不是迫不及待地想要了解这款处理器的实际表现了呢?别着急,据悉采用该平台的笔记本电脑已经陆续上市,欢迎大家关注近期MC对Carrizo APU笔记本电脑的全面测试。

分享到:

用户评论

用户名:

密码: