时隔半年之后,英特尔于06年第三季度推出全新Core微架构处理器,其中桌面处理器Conroe、服务器处理器Woodcrest已经于刚刚过去的七月份问世。移动领域的Merom处理器步伐也日益临近,近日Core微架构移动处理器Merom将正式推出。为了区别在今年早些时候发布的Yonah核心处理器。两者在名称上略有区别。Yonah核心处理器也可以称之为Core Duo。Merom处理器则称之为Core 2 Duo,事实上就是第二代酷睿双核处理器。近日中关村在线评测室收到一款采用Merom T7400处理器笔记本电脑,相信大家一定充满了期待。
两代酷睿处理器标志
Merom处理器
Merom处理器依然延续了酷睿微架构一些优良特性。英特尔酷睿微体系结构,是一款领先高效能的新型微架构,为用户提供性能和能效最佳平衡点。今天我们的主角便是Merom移动处理器。
Merom处理器性能提升
众所周知的是Yonah核心处理器自1月19日以来,已经再次印证了英特尔在移动处理器市场上的霸主地位。Merom移动处理器的推出依然让人振奋不以,同时消费者对Merom充满了诸多疑问?从之前得到的信息上看,在同Core Duo T2600从处理器的对比中,Merom同频率处理器在性能提升百分之二十的基础上,功耗基本没有变化。实际测试结果是否如上所述?我们将在接下来的文章中找到答案。
在测试之前,让我们一起先了解一下Merom处理器一些细节信息。Merom处理器同Yonah核心处理器相比,Merom支持EM64T、最高支持4MB L2 SmartCache、FSB包括533MHz、667MHz、800MHz的产品、Macro Ops Fusion(宏融合操作)运算能力、micro-ops fusion(微操作融合)。Direct L1 /L2 Cache Transfer、更高速的L2 Cache to Core频宽、128Bit SSE2/3支持,单一周单可运算8个FP。对EM64T指令集的支持,在竞争对手一直宣称在64位运算的优势地位不复存在,为未来将要上市的Vista操作系统做好的准备。
以往英特尔在移动处理器,英特尔处理单元将指令分解为更小、更易于执行的单位。2003年问世的Banias使用了一种名为微融合的技术将来自同一指令的操作粘合起来,这减少了处理器为完成一个任务需要执行的操作数量。
采用Core微架构的芯片能够融合更多的微操作,Merom能够将更多更大的指令融合为一条指令,即宏操作融合,这种技术在提高了性能的同时还降低了能耗。
在大家比较关心的Merom处理器接口上,其采用的是mPGA478针设计。英特尔酷睿双核处理器采用插座微型倒装芯片针脚栅格阵列(Micro-FCPGA)和表面安装微型倒装芯片球栅格阵列(Micro-FCBGA)封装技术。微型FCPGA封装可插入479孔,即mPGA479M插座。从封装形式上看Merom处理器可以兼容英特尔945系列芯片组。
作为Yonah核心处理器的后续产品,Merom同样具有酷睿微体系架构一些优良特性。此外Merom并不是Yonah简单的升级产品,Merom具有更加智能的指令处理能力。新一代采用酷睿微体系架构的Merom究竟在那里给我们带来了惊喜,我们一起来探究一下。
英特尔宽位动态执行(Intel Wide Dynamic Execution)
英特尔宽位动态执行指的是通过提升处理器每个时钟周期完成的指令数量,达到提升处理器执行效率的目的。直观的可以理解为,采用酷睿微体系架构的Merom能够在每个时钟周期能够完成更多的指令。英特尔酷睿微架构拥有4组解码器,相比上代Pentium Pro (P6) / Pentium II/Pentium III / Pentium M架构拥有3组可多处理一组指令。此外处理器两个处理单元同时工作,进一步提升处理器整体执行效率。
英特尔宽位动态执行
除了拥有多达4组解码器以外,英特尔酷睿微体系结构为了增强在实际执行中的效率。加入宏融合(Macro-Fusion)技术,此技术可以让处理器在解码同时,将同类型指令合并为单一的指令。然后将合并后的一条指令作为一条指令执行,这样可以让处理器在每个时钟周期内处理更多的指令。此外为了配合宏融合(Macro-Fusion)技术能够顺利高效执行,酷睿微体系结构改良了ALU(算术逻辑单元),处理器可以迅速掌握同类型指令情况。
英特尔智能功率能力(Intel Intelligent Power Capability)
在移动处理器领域,提升性能与功耗控制称为同等重要的问题。那么Merom做到如何保证处理器在提供更好性能的前提下,达到最佳的能效比?首先新一代处理器在制作工艺上全面升级至更为先进的65nm应变硅技术、加入低K栅介质及增加金属层,相比上代90nm制程减少漏电达1000倍。
英特尔智能功率能力
英特尔加入了逻辑控制机能独立开关各运算单元。酷睿微体系结构采用先进的功率门控技术。此技术可以通过该特性,可以智能地打开当前需要运行的子系统,而那些不进行操作的部分则处于休眠状态,有效控制处理器功耗。
英特尔高级智能高速缓存(Intel Advanced Smart Cache)
早期的英特尔双核处理器,虽然采用了多核心设计的处理器,其每个核心的二级缓存是各自独立的,当多个核心之间需要数据交换时,必须要通过共享的前端串行总线和北桥来进行数据交换,影响了处理器工作效率。
英特尔高级智能高速缓存
英特尔酷睿微结构体系结构采用了共享二级缓存,两个核心可以共享二级缓存,大幅提高了二级高速缓存的命中率,从而可以较少通过前端串行总线和北桥进行外围交换机会。
此外每个核心都可以动态支配全部二级高速缓存。当某一个内核当前对缓存的利用较低时,另一个内核就可以动态增加占用二级缓存的比例。甚至当其中的一个内核关闭时,仍可以保持全部缓存在工作状态,另外也可以根据需求关闭部分缓存来降低功耗。
英特尔智能内存访问(Intel Smart Memory Access)
英特尔智能内存访问
英特尔智能内存访问是另一个能够提高系统性能的特性,通过缩短内存延迟来优化内存数据访问。英特尔智能内存访问能够预测系统的需要,从而提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执行程序的效率。
英特尔智能内存访问
英特尔智能内存访问
英特尔酷睿微体系结构中加入一项名为内存消歧的能力,它可以对内存读取顺序做出分析,智能地预测和装载下一条指令所需要的数据,这样能够减少处理器的等待时间,减少闲置,同时降低内存读取的延迟,而且它可以侦测出冲突并重新读取正确的资料及重新执行指令,保证运算结果不会出错误,大大提高了执行效率。
英特尔高级数字媒体增强(Intel Advanced Digital Media Boost)
英特尔高级数字媒体增强是为了提高每个时钟周期的指令数而诞生,它可以提高SIMD流指令扩展指令(SSE/SSE2/SSE3/SSE4)的执行效率。Intel酷睿微体系结构则拥有128位的SIMD执行能力,一个时钟周期就可以完成一条指令,效率提升明显。相对于之前的每个时钟周期64位的SIMD执行能力,可在一个时钟周期内完成。
英特尔高级数字媒体增强
英特尔高级数字媒体增强
单周期128位SIMD处理器能力令处理器拥有高能效表现。当前SSE指令集已经十分普遍地用于主流的软件中,包括绘图、影像、音频、加密、数学运算等用途。
英特尔动态总线暂停(Intel Dynamic Bus Parking)
此技术还是针对整个系统的功耗。在处理器处于低频模式状态时,芯片组自动断电,可以延长电池的使用时间,从而降低平台能耗。
增强型英特尔SpeedStep技术
支持增强型英特尔SpeedStep技术。包含从最低频率模式(LFM)到最高频率模式(HFM)的多个性能模式,可在最低功耗时提供最佳性能。根据CPU的需求,在多个性能模式之间实时动态切换电压和频率。无需重启电脑,即可通过转换总线倍频、内核工作电压和内核处理器速度实现以上切换。
前面我们一起了解了Merom处理器在技术上的一些特性,为了让用户更好的了解Merom处理器性能表现以及与Yonah处理器之间的性能差异?同时为了保证本次测试数据的准确性,我们选用相同的测试平台,仅更换测试平台中的处理器。处理器方面我们选用主频相同的Intel Core 2 Duo T7400 ,Intel Core Duo T2600。
测试平台硬件配置 | |
Intel Core 2 Duo T7400 /Intel Core Duo T2600 | |
60GB SATA 5400转 | |
Intel 945PM | |
GeForce Go 7400独立显卡 | |
液晶屏 |
14.1镜面宽屏LCD 分辨率1280 x 800 |
Intel Core 2 Duo T7400 ,Intel Core Duo T2600两款处理器主频相差并不大,前者运行频率均为2.13GHz,后者运行频率为2.16GHz,FSB均为667MHz。两者在二级缓存的容量上,前者拥有4M二级缓存,后者则拥有2M二级缓存。
CPU-Z—处理器信息
我们选用最新版CPU-Z 1.36版本,此软件基本上可以正确的识别出处理器相关信息。65nm制程,支持最新的SEE4多媒体指令集,EM64T(支持64位扩展)。Intel Core 2 Duo T7400拥有高达4M二级缓存。我们在上边的截图上会发现,此款处理器的图标无法正确的显示出来。
Intel Core Duo T2600处理器的信息已经被大家所熟知,这里我们就不再赘述了。
软件测试标准介绍:
硬件测试平台我们选用Windows XP SP2英文版,安装所测笔记本电脑最新官方驱动。将操作系统内置的Media Palyer升级为英文10.00.00.3802版本,然后安装测试软件,在性能测环节我们将电源管理选项调整为Home/Office Desk,关闭低电量报警。所有测试项目均在最佳分辨率下进行测试。
综合性能测试程序:
Sisoftware Sandra Professional 2007
Sisoftware Sandra Professional 2007是对整个笔记本电脑系统分析评测工具,内置多项测试指令,主要包括有CPU、驱动器、CD-ROM/DVD、内存、SCSI、APM/ACPI、鼠标、键盘、网络、主板、打印机等。全面支持当前各种 VIA、ALI 芯片组和 Pentium 4、AMD DDR平台。 我们选择CPU Arithmetic Benchmark、CPU Multi-Media Benchmark、Memory Bandwidth Benchmark和File System Benchmark。分别测试笔记本产品的算术运算性能、多媒体运算性能、内存带宽和磁盘子系统性能。
PCMark05 V1.01
PCMark05系列作为Futuremark推出的系统性能综合测试软件,已经成为了评测系统综合性能不可缺少的测试项目。PCMark采用部分真实应用程序替代大型应用程序和特殊创建代码,让PCMark提供精确的报告同时保证了安装程序不至于过大,并且PCMark的应用程序大都是自由开源软件方便大家查验程序的真实客观性。PCMark05将整个测试划分为5个项目:综合性能测试、CPU子系统、内存子系统、图形子系统及硬盘子系统,每个测试子项目下包含了许多相应测试项目,包含了生产力、互联网应用、娱乐及常规应用四类不同的应用程序。
MobileMark 05
MobileMark 05是BAPCo开发针对笔记本系统的测试软件,主要是用来衡量笔记本系统的电池续航能力,同时对笔记本系统在电池模式下的性能表现作出评估。众所周知,笔记本必须在性能和电池续航能力之间作出平衡,而MobileMark能够很只直观的看到笔记本在两者之间的取舍。MobileMark2005在测试环节电池及整机性能测试包括四个测试项目:DVD播放、无线应用、高强度办公、文档阅读。我们选择其中侧重于家庭娱乐以及商务应用的两个测试项目:DVD Playback 2005和Productivity 2002se。
单项性能测试程序:
3DMark05和3DMark06均针对笔记本电脑在3D方面的性能表现测试,我们运行其中的GameTest,记录系统默认分辨率下(1024*768*32Bit)时测试成绩。
CINEBENCH 9.5测试,记录两款双核处理器加载同一张图片测试成绩作对比。
Super π(mod 1.5XS)测试中,测试104万位(1M)运算,记录测试时间。
Processor Arithmetic主要侧重于处理器数学运算能力。Dhrystone是测试CPU在处理数学运算和逻辑关系处理上的性能;Whetstone是检验CPU浮点运算的性能。
在此项测试中,Merom处理器全面胜出,Whetstone得分为13807,Dhrystone得分为20091。和Yonah处理器相比,前者提升了34%,后者则提升了28%。
Processor Multi-Media主要侧重于处理器多媒体运算能力。其原理是生成一张分辨率为1024×768的真彩MANDELBROT分形图,并对每个象素进行255次循环计算。
由于Merom处理器加入了最新的SEE4多媒体指令集以及大容量二级缓存的使用,在此测试环节表现十分优秀。别是在Integer *8 iSSE4测试中,我们发现Merom处理器测试得分居然是Yonah处理器两倍以上。
在PCMark05测试中我们选择了整体得分和CPU测试得分进行对比。在整体性能得分以及CPU测试得分Merom处理器均占上风。提升幅度分别为7%,19%。
3DMarK05处理器测试中,CPU测试利用分辨率降到640x480的Game3和Game1场景进行,这里程序将顶点渲染工作由处理器完成。而且为了模拟真实的处理器负载,CPU承担软件Vertex计算,并且负责计算修正场景中各物体的运行路线。
3DMarK06处理器测试中,CPU测试方面使用了AGEIA公司的PhysX物理库,加入了模拟物理引擎计算和AI计算,这使测试更加贴近CPU在真实游戏中扮演的角色。
Merom处理器同样再次测试环节中一路高歌。特别是在3DMarK05处理器测试中,Merom处理器高出对手23%。
CINEBENCH 9.5是使用CINEMA 4D针对CPU和视频进行测试的软件,并且软件支持多处理器和超线程的测试。记录两款双核处理器加载同一张图片测试成绩。Merom处理器测试成绩为601分,Yonah处理器测试成绩为512分。前者性能得分要高于后者17%。
Super π主要用来测试处理器浮点运算能力和计算机稳定性性能,它的原理为通过计算不同数位的圆周率来考察计算机处理器性能,计算时间越短表明CPU浮点运算速度越快。此次我们选择π小数点后104万位为测试标准。
在其他配置相同情况下,Merom处理器T7400在104万位运算中以23.844秒获胜,超过T2600将近18%。
在之前普遍认为的Merom处理器在性能提升20%的情况下,功耗下降了20%。我们下面经过MobileMark05两个测试子项Producitivity、DVDPlayback中寻找答案。在这里需要说明的是我们选择的测试环境中,测试机型仅标配2600毫安锂电池,因此在电池续上时间上偏短是可以理解的。在之前的处理器测试性能测试中,我们已经看到Merom处理器的优秀表现,电池续上时间比Yonah处理器提升幅度并没有想象中的那么明显。
处理器正面
延用了Core 微架构的Merom处理器,无论是在性能提升方面,还是在功耗的控制上均表现相当抢眼。在测试过程中,我们感受到了采用新一代Core 微架构,在能效比方面的优秀表现。在抛弃了单纯依靠提升频率来提高性能模式之后,英特尔高级智能高速缓存、智能内存访问、宽位动态执行等技术的运用,让英特尔在Core 微架构处理指令更加高效。
在处理器领域,特别是移动处理器领域。Core 微架构让性能提升与电池续航时间上不再作为一对矛盾同时出现。在大幅度提升了能效比之后,英特尔在移动处理器领域给竞争对手上了很好的一课,那就是坚持不懈的创新。相信英特尔会在将来的移动处理器领域走的更远。