• 阅读1952
  • 回复8

Core架构以及EM64T效率测试

[复制链接]
发表于 2006-8-9 04:54 | 显示全部楼层 |阅读模式
 

随着英特尔的Core架构Conroe处理器的发布,众多的评论和测试已经出炉,很多人在探讨英特尔的Core架构并不能够很好的发挥64位应用的效率,那么真的是这样吗?今天我们的任务就是一起来探讨这个问题。

当然了对应Core架构来说,没有人会质疑它的合理性,基于这种架构的Core 2 Duo以及Core 2 Extreme处理器所表现出来的高效率获得所有人的认可。这种架构几乎代表了目前最高的X86架构设计理念和能力,即使频率不高,其依旧拥有大幅度超越Pentium D处理器的效率;即使面对原先执行效率颇高的Athlon 64处理器,Core架构还是游刃有余,同频下至少20%的效率优势,即使连AMD也没有太多的挑剔可言。

当然了这次英特尔处理器发布改变了以往的策略,Core 2系列处理器的售价将被定的比较合理,主流产品的定价已经不超过300美元,最低端的产品仅为200美元不到,这是原来英特尔发布新架构处理器很难做到的的,而这正是英特尔希望通过价格来更快的普及这种处理器。

由于64位应用以及对应操作系统的缺乏,更多的人还是会把处理器运行在32位模式下,不过我们还是应该理解Core 2 Duo处理器是支持英特尔的EnhANCed Memory 64 Technlogy(EM64T)技术的,由于Core酷睿架构更多的是脱胎于英特尔的Pentium M架构,以往的Pentium III、Pentium M以及Core Duo处理器均不提供对EM64T的支持,而第一次在这种短流水线设计的处理器中搭载EM64T技术,同时也是英特尔的以色列设计团队第一次应用这种技术。

六安论坛
 楼主| 发表于 2006-8-9 04:54 | 显示全部楼层

当然,虽然可能暂时EM64T应用并没有太大的实际意义,但是请千万不要小看这种X86-64扩展的重要性,明年第一季度等长的Windows Vista操作系统最重要的特色就是完全对诸如AMD64和EM64T这种64位扩展技术急性优化,并且微软也积极的推广64位应用,并且随着内存越来越大,32位操作系统仅能管理4GB的内存也已经不再和时宜,因此廉价的x86-64的普及意义还是很重大的。

虽然,目前支持64位扩展的操作系统不多,但是微软还是提供了Windows XP x64 Edition操作系统,虽然没有完全对这种扩展进行优化,单至少可以算做是微软第一次涉足这个领域的试验品,部分OEM厂商以及DCC应用提供商还是比较推荐这个操作系统的,毕竟可以部分体现64位应用优势也是大家所需要的。

不过从Corre微处理器架构来看,这种处理器并不算是经典的x86 64位扩展设计,我们知道X86-64需要更长的通用寄存器长度,同时也需要支持128bit的SSE寄存器和线性寄存器,不过目前很多x86-84并不能做到这点,当然也不同于真正基于64位设计的IA64处理器--Itanium(安腾)。 

其实AMD64和EM64对64位的扩展支持是比较类似的,所谓的64位扩展只是指是处理器单次操作数据宽度,或者是说处理器的General Purpose Register(通用寄存器)可以容纳下的数据位数(bit)。因此可以这么认为一个支持64位扩展处理器实际上就是一个通用寄存器可以容纳64位数据的处理器,64位指令也就是操作64位数据的指令。

在64位扩展处理器中的寄存器位数是32位处理器中的两倍,不过正在实行指令的指令寄存器(IR,Instruction register)却都是一样的。再次说明,数据流加倍而指令流不变,此外我们可以发现程序计数器(PC,Program Counter)也加倍了。

当然了无论是AMD64还是EM64T都采用了使用的是48位的虚拟寻址空间和40位的物理寻址空间,从理论数据上来说,48位的虚拟寻址空间最高可以达到282TB的寻址空间,而40位的物理寻址空间注定处理器拥有大约1TB左有物理内存的寻址空间大小,这样相比目前32位x86处理器最高4GB的内存容量支持度来说显然是提升了太多了。

那么究竟在Core架构中英特尔的EM64T支持是如何的呢?以下我们就简单的来看一下

六安论坛
 楼主| 发表于 2006-8-9 04:55 | 显示全部楼层

EM64T:Core架构中的实现模式

很多分析也指出了为生命Core 2 Duo处理器在64位模式下效率低下的原因,一方面是因为Coe架构处理器在64位模式下无法支持宏融合(Macrofusion)技术;其次,在开启EM64T技术的时候,Core架构的加法寄存器计算效率会下降;而这两点就是最大的原因。

宏融合的技术大家应该已经非常了解了,其可以帮助每个时钟周期提升指令的处理速度,理论情况下其最高可以实现一个时钟周期5条指令的处理能力。

但是宏融合技术的一个劣势就是无法在EM64T技术开启的时候实现,因为在64位模式下寻址的长度提升许多,在这种模式下,寄存器无法满足宏融合所需要的指令暂存,并且如果使用宏融合技术的话,效率并不会有太大的提升,甚至会降低处理速度。

宏融合其实也就是一种把短指令整合成长指令的技术,通过融合技术,让一个时钟周期运行更多的指令,这里再说一下,EM64T运行的指令长度均很长,这种模式下合并成处理器可以执行的长指令就比较困难,因为很少有比较短小的指令可以用来融合在一起,相对来说宏融合技术在这里并没有大展拳脚的机会。

不过,有一个好处开始让Core架构处理器拥有极强的性能,那就是其单次可以执行4条指令,这是原先的处理器所无法实现的,即使是K8处理器,其一个时钟周期也只能执行3条指令,虽然Core架构多出的一条指令运算只是允许进行简单的计算,但是对于总体效率的提升还是非常高的。

而这种技术被英特尔称为宽区动态执行技术,由于单次处理指令的增强,加上双核心设计,Core架构单次理论可以处理器8条指令,这要比K8双核心处理器的6条指令要效率高,而这可以很好的弥补64位模式下无法实现宏融合的缺陷,也就是说Core架构虽然在设计上并没有提供更多的64位扩展应用的优化,但是凭借更高的执行效率,却依旧可以帮助Core架构拥有非常出色的效率。

当然,这只是我们的猜测,最终究竟性能如何,我们还是需要通过测试来验证,随后我们来进行相关的测试:

六安论坛
 楼主| 发表于 2006-8-9 04:55 | 显示全部楼层
测试系统和配置:

今天的测试目的之一就是,我们需要看看32位应用在这种64位处理器架构上的表现;其次,我们也可以用来对比支持64位扩展的诸如Athlon 64 X2、Pentium D以及Core 2 Duo处理器之间的效率对比。 

  • 处理器:
    • AMD Athlon 64 FX-62 (Socket AM2, 2.8GHz, 2x1024KB L2)
    • intel Core 2 Extreme X6800 (LGA775, 2.93GHz, 1067MHz FSB, 4MB L2)
    • Intel Pentium Extreme Edition 965 (LGA775, 3.73GHz, 1067MHz FSB, 2x2MB)
  • 主板:
    • ASUS P5W DH Deluxe (LGA775, Intel 975X Express芯片组)
    • ASUS M2N32-SLI Deluxe (Socket AM2, Nvidia nForce 590 SLI芯片组)
  • 内存:
    • 2048MB DDR2-800 SDRAM (Mushkin XP2-6400PRO, 2 x 1024 MB, DDR2-800, 4-4-4-12).
  • 显示卡:PowerColor X1900 XTX 512MB (PCI-E x16).
  • 硬盘:Maxtor MaXLine III 250GB (SATA150).
  • 操作系统:
    • Microsoft Windows XP Professional SP2操作系统
    • Windows XP Professional x64 Edition操作系统

测试系统都使用最新的主板BIOS,并在BIOS进行最优化设置。

性能测试:真实的结果

我们测试的64位系统采用了Windows XP Professional x64 Edition操作系统,这是一个目前比较优秀的x86-64操作系统,操作系统允许运行32位兼容模式,我们部分32位操作系统均基于这种操作系统下。

首先我们进行的是SISoft Sandra 2007软件,这种软件支持32位和64位的测试,通过这款软件我们先来体察以下各种处理器在32位或者64位的应用性能。

从测试的结果来看还是非常有意的,首先在ALU测试下,Core架构处理器在64位模式下效率降低比较多,甚至效率已经类似于Pentium Extreme Edition 965以及Athlon 64 FX-62处理器了。不过Core 2 Duo处理器也有非常好的64位效率,在多媒体浮点运算中,64位模式要比32位模式提升大约40%左右的效率

六安论坛
 楼主| 发表于 2006-8-9 04:55 | 显示全部楼层

随后我们还是来看看ScienceMark 2.0的测试,这种应用也是一个同时支持64位应用和32位应用的软件,可以很好的体现处理器在科学计算上的真实效率。

首先进行的是Molecular Dynamics测试,这是基于分子热力学的科学模拟计算,从结果来看64位应用都可以帮助几款处理器获得比较高的效率,诸如K8处理器可以获得2.7倍于32位下的性能,而Core 2 Extreme X6800处理器也拥有211%的效率提升。

Primeordia测试则是原子计算模拟应用,在这里64位到并没有体现出比32位高很多的效率,其中效率提升最高的是Pentium Extreme Edition 965处理器,其拥有57%的效率提升,而Athlon 64 FX-62和Core 2 Extreme X6800处理器则在64位模式下提升了14%左右效率。

之后进行目前比较流行的7-Zip测试,这个软件同时支持32位的计算和64位的计算,非常有意思,所有测试的处理器只有Athlon 64 FX-62处理器效率会在64位下有效率提升,而其他两款处理器64位下的效率都低于32位模式。

不过在解压缩测试下,几款处理器都有一点效率提升,Core 2 Extreme X6800处理器提升效率为2.5%

六安论坛
 楼主| 发表于 2006-8-9 04:55 | 显示全部楼层

视频编码测试中非常有意思,Core 2 Extreme X6800和Athlon 64 FX-62处理器在64位模式下效率都会比32位模式低以西,降低的幅度大约未10%左右。

PDNBench测试中则显示出64位性能明显高于32位下的情况,英特尔处理器表现都不错,Core 2处理器会有42%的效率提升。

之后基于代数计算的MathemATIca 5.2的测试中,英特尔处理器在64位模式下都有一定的效率提升,而Athlon 64 FX-62处理器则降低了13%的运行效率。

Cinebench渲染测试显示的结果可以看出在64位模式下,各款处理器还是有所效率提升的,这其中Athlon 64 FX-62处理器的效率提升最高,达到了13%,而英特尔的处理器提升幅度仅在5%左右。

同其他OpenGL操作一样,64位应用效率并没有32位来的高,当然这主要还是由于显示卡驱动的问题造成的,如果驱动加以改进,这种情况会有所变化的

六安论坛
 楼主| 发表于 2006-8-9 04:56 | 显示全部楼层

POV Ray则是一款3D渲染软件,同样也支持64位和32位操作,在这里64位模式还是有所效率提升的,Athlon 64 FX-62获得的优势最为明显,大约14%左右,而Core 2处理器则仅提升4%左右的效率。

目前支持x86-64扩展的3D游戏并不算多,但UT2004就是其中比较流行的一款,从测试来看,64位提升的幅度还是比较小,在目前来看,UT2004下,64位应用并不能获得太多的效率提升。

当然了Pentium Extreme Edition 965处理器表现到是不错,64位比32位效率提升了9%,而Core 2仅有1%左右的提升。

测试总结:

并没有太出乎我们的医疗,英特尔Core架构搭载EM64T技术还是比较正常的,但是却并不能提供更高的64位应用效率。当然,之前很多人所说的Core 2处理器64位效率要低于32位的说法也是站不住脚的,因为在大部分测试中,其64位模式还是会比32位模式有所效率提升。即使之前很多人反应的Windows Media Encoder 9或者7-zip应用中,Core 2处理器效率低下的问题,在测试中也没有出现,看来至少对于架构来说,Core架构还是成功的,至少不是影响64位性能的关键问题。

64位应用同32位应用之间的性能比较图,绿色代表Athlon 64 FX-62处理器,蓝色代表Core 2处理器

总体来说,Athlon 64处理器在64位下同32位下效率提升的幅度会比较高,平均会拥有16%的效率提升,而Core 2 Extreme X6800处理器仅仅可以提升10%左右。理论上说,Athlon 64处理器会比Core 2处理器要有6%左右的优势,但是考虑到同频下,Core 2处理器要领先于Athlon 64处理器的实际情况,最后可以得出以下结论,即使Core架构处理器的64位扩展效率提升恐怕没有Athlon 64来的高,但是凭借更高的单位频率工作效率,Core 2依旧拥有最为出色的X86-64指令集的64位扩展效率

六安论坛
发表于 2006-8-17 07:07 | 显示全部楼层
没人顶,我来顶·
六安论坛
发表于 2006-8-20 00:24 | 显示全部楼层

看贴就要回!路过就要顶!

六安论坛
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

侵权举报:本页面所涉内容为用户发表并上传,相应的法律责任由用户自行承担;本网站仅提供存储服务;如存在侵权问题,请权利人与本网站联系删除!举报微信号:点击查看