大跨步提升 技术细节详细解析
对于Carrizo来说,在AMD的“25x20能效计划”中,是值得记住的一次提升,因为它跟上一代相比有了2.4倍的能效提升,远超计划中的1.7倍。
能效的飞跃
挖掘机是AMD用于Carrizo产品上的新一代X86核心的代号。对比上一代压路机的核心硅片面积,挖掘机的硅片面积减少了很多。而一般来说,如果在不迈进下一个制程节点的情况下,实现面积减少,很可能就会降低性能,但实际上Carrizo性能并没有减少,反而增加了。这是由于AMD采用了更高密度的“晶体管库”形式的设计,减少核心面积。
通过工艺改造,能够把核心面积缩小约26%到35%。由于面积更小,所以这些晶体管之间的距离就更紧凑,如果能够提高每时钟周期指令数,在运算过程中就能够降低功耗。
上图可以看到,蓝色的是新一代Carrizo,紫线是Kaveri,比较主流的15W到25W笔记本APU的功耗段上,实现了大概10到12W的功耗降低。
而为了实现性能上的提升,Carrizo提升了缓存的性能,增加了一倍的一级数据缓存的面积,这曾是上一代设计方面的瓶颈。其次,Carrizo拥有更好的分支预测,能够在CPU核心上对于下一拨要来的数据量做智能化预测。通过这样的优化,能够减少CPU等待数据时间,提高整体性能。第三,Carrizo降低了二级缓存的延迟时间,从原来的19时钟周期降到了18时钟周期,大概提升一个时钟周期的延迟时间。此外,Carrizo还加强了分支预测的准确性,大家知道分支预测是影响功耗的重要因素。AMD希望分支预测更加理性,不会做大量的无用功去执行错误或无效的分支预测,在这个过程中,就能够提高性能。
AMD也更新了指令集和在ModernStandby方面做了优化。Modern Standby意思是能够缩短读取CPU核心的时间,能够让过程更快。最终,Carrizo在每时钟周期指令数方面的提升保持在了4%到15%之间,提升幅度取决于具体的工作负荷和运算的频率。
综合来看,Carrizo有一个非常巨大的综合能力提升,而且是专门针对主流15瓦功耗的笔记本设计,在关键行业软件基准测试超过上一代产品高达55%的性能提升。
Carrizo有8个第三代GCN核心,512KB的共享二级缓存,更优化的曲面细分性能。HSA能够让所有的运算单元共享虚拟的存储空间。在性能提升方面,增加了缓存的面积,可以更好地利用GCN核心。
在HSA架构中,把上下文转换引入到了GPU核心中。GPU有两类处理任务,一类图形,一类是图形计算。图形的上行下行数据是非常巨大的,存储需要很长时间,所以把这一部分任务空间释放,进行图形计算,它被称为“任务预抢占”。在图形计算方面,上下文转换的数据是比较小的,所以可以像在CPU核心中一样,把它们进行存储,让所有的GPU计算共享GPU的核心。
现在的系统设计一般是CPU有搭载非常大的内存,然后GPU非常小。在电影行业里面去编辑一部影片的时候有一个两难的境地,要么是选择其中的一个片断,一帧一帧的去做比较深度、细节的渲染。或者用比较低的不注重细节、细腻感的渲染方式去对比较长的片断来渲染。
而HSA的一个特点就是更扁平、更宽的寻址空间,所以每个任务可以调取这样的地址,能够让空间被打开。有了HSA可以不用损失掉细节,也不用只是一帧一帧地来做渲染。可以把原来想要达到的效果,通过机器就能够来实现,可以看到整个全局。有了HSA,可以让艺术家保持十分清楚的理念,对于整部影片能够按照自己的思路来做编辑。
工业设计方面,现在一般的做法就是用计算机辅助设计系统,首先画出草图,然后去选择材质。要把数据拿到大的计算机,比如说到服务器上去做进一步的分析,看做的设计是否合理。比如选择的金属材料是否合适,在设计里面的方方面面包括压力、温度指标是否能够达标。所以是分两步走的做法,要有设计的草图,然后去验证设计的合理性。
有了HSA,就可以在一台机器上实现。一方面可以在前台做3D图形的设计,在后台就可以对设计出来的草图去做合理性的验证和分析。比如说关于设计是否考虑周全,是否选择了合适的金属材料,这些在一台机器上都可以实现了。通过这种办法就能够让设计师有更加明确的目标感,同时在工作效率方面也可以提升。
推荐经销商