超微挟AM2平台开创新局

西瓜 · 发表于 2006-8-6 19:12

计算机发烧友这几个星期来真是度日如年，巴不得超微这个取名为「AM2」新平台能够早日诞生，所有的臆测和官方报导甚嚣尘上，都是全新内容，所有包括处理器本身、系统平台、散热系统、芯片组、内存的信息犹如过江之鲫，随着Socket 940、Socket 939和754平台后，Socket AM2是2002年上市的Hammer架构以降的第四代接班人，超微不像强敌英特尔那么频繁的更换系统平台的架构，这次加快脚步的变动实属少见。

现在已经有好几个Socket AM2的处理器产品上市，从Dresden的Fab 36晶圆厂中，总共生产有17个分散在不同的市场区隔处理器应市，所有的半导体制程还是以90奈米为主，不过已经全部都更换为12吋晶圆来量产，而65奈米制程的导入估计在2006年年底。

所以有哪些产品呢？是否有标准的Athlon 64 X2和经济实用、学生市场为大宗的Sempron处理器？或是有独特、精细和高贵的Athlon 64 FX-62处理器呢？价位从70美元以下的Sempron 64 2800+起跳，一直到1200美元的Athlon 64 FX-62处理器，而中价位的产品则分布在300元到600美元间，从这个价格结构来看，超微很清楚的宣示其新世代的布局已经全部到位，价位上和英特尔等比齐观，一改过去超微顶级产品会高出30％的印象，留下来的问体，只剩下到底谁才能称霸于效能挂帅的市场？答案倒是呼之欲出，至少就现在来看，Athlon FX系列处理器当之无愧，自从Athlon 64 FX上市以来，超微就处于领先的地位，让英特尔的Pentium Extreme Edition处理器真是如坐针毡。

除了改头换面的内存接口外，技术上并无其它新意，顶级的机种就像Athlon 64 FX-62处理器，现在时脉速度已经可以飙到2.8 GHz，而且还配备两个处理器核心，另外，Athlon 64 X2 5000+和Athlon 64 4000+处理器也加入战局，就我们实验室的测试结果显示，这些超大时脉速度几乎到达其最大极限了。

此外，另一个日益升温的议题就是用电效率，也就是每消耗单位用电后，所能产生的最大运算效能的测量，这个长久以来一直让超微为人津津乐道的优点，如今又有进帐，除了超微普通等级处理器都有的省电设计，对于Athlon和Sempron有「EE」字尾型号的处理器，还有特别省电的优点，虽然「EE」字尾的处理器价格较贵，但是节省电费上不含糊。

基本上，要从Socket 939转到AM2系统平台是多此一举，其差别仅止于脚位避免弄反而已，就像115伏特和230伏特室内用电的插头上不同一样，至于，系统芯片组的部份仍然不是由超微所提供，而是由原来已经领先的ATI、Nvidia、硅统（SiS）和威盛（VIA）所生产，尤其是Nvidia的Nforce 5芯片组暂居领先的地位，其提供出连英特尔都难望其项背的优秀功能。

西瓜 · 发表于 2006-8-6 19:13

新Socket AM2平台配备DDR2内存

超微现在可以支持DDR2内存了，足足比全系列都支持DDR2内存的英特尔慢了几乎两年，现在终于跟上，事实上，也是不得不为，因为市场上DDR2内存已经跃升为主流。

超微的解决方案，与英特尔平台相比有一个大缺点，也就是其内存接口是整合在处理器里面，所以一旦有所变动时，就不仅仅是换掉系统芯片组就可解决的，这种将内存接口从北桥芯片搬到处理器的过程，确实产生许多问题：

• 处理器的核心需要更动

• 新的平台接口也需变动

这些问题使得超微一直等到今天才要采用DDR2技术，究其原因有三：

• DDR2内存初期开始的成本很高，足以让超微系统整体的吸引力落后于英特尔。

• 内存制造商直到现在才可以量产有足够速度的DDR2内存模块，因此，整个平台的效能才不会被拖累。

• DDR2内存接口整合到处理器，会因成本及产能瓶颈而无法在早期导入。

DDR2内存提供的优点

就理论值而言，DDR2内存模块所提供的频宽是普通DDR内存（现在或许有人称为DDR1）的两倍，举例来说，在Socket 939处理器上的DDR-400内存模块可以处理理论值为6.4 GB/sec的速度，而AM2平台处理器用400 MHz 的DDR2内存模块（DDR2-800）可以达到12.8 GB/sec的频宽。

不同速度下的DDR和DDR2内存理论上频宽的比较。

如果我们拿实际达到与理论值相比，会发现旧的Socket 939配上DDR1内存的表现看起来出奇的好，在6.2 GB/sec频宽下，DDR1内存居然可以达到理论值得97%的表现，当我们测试新平台之初，我们先假设DDR2内存也能达到相同的效率阶层，这样使用AM2 socket的处理器真的就可以一飞冲天了。

西瓜 · 发表于 2006-8-6 19:13

Socket AM2和Socket 939内存速度的对垒

超微以前就做下将内存接口整合到处理器内部的决定，这便于确保其享有完整的处理器时脉速度的好处，而且比起依靠北桥芯片连接到较慢总线的做法，有更高的频宽可资利用，不过，这也仅止于纸上谈兵理论的推论，但是对Socket 939处理器配上DDR内存的组合几乎是一个梦想的境界，尤其用时脉在2GHz（例如Athlon 64 X2 3200+）和2.8GHz（例如Athlon 64 FX-57）之间的处理器，从内存中的读写速度随着处理器时脉的成长而增加的趋势，几乎没有让人失望过。

为了分析综合频宽的变化，我们采用Everest诊断程序为2.80.575的Beta试用版本，其所传回来的资料非常的稳定，而且反复执行的结果也非常一致，尤其使用双核心或hyperthreading功能处理器时也不会整个走样。

内存读取效能

比较DDR1和DDR2内存读取速度，DDR2内存只有在高时脉时才掉下来。

但是在DDR2内存的接口之下，真是好景不常，在内存读取的数据传输率会在6.4到8.1 GB/sec间来回波动，在相同的处理器频宽之下，与先前DDR1世代内存相比，这个变动几乎到达有21%之多。

只有当时脉速度到达2.6 GHz以上时，DDR2内存接口的效能才真正有起色，这是因为DDR2内存要有好的资料吞吐量时需要配合较长的CAS延滞（CL4.0）所致，在DDR1可以用到CL2.0的延滞，我们测到在Athlon 64 X2 5000+处理器跑2.6 GHz时脉时，可以达到7.6 GB/sec，而2.8 GHz的Athlon 64 FX-62处理器可以到达8.1 GB/sec，是所有测试数值之冠。

西瓜 · 发表于 2006-8-6 19:13

内存写入效能

论内存写入效能，DDR2内存只有在高时脉速度才可以超越旧的DDR1。

在内存写入速度上，则就更差了，尤其在低时脉的处理器的效能真是惨不忍赌，在2 GHz时脉的处理器，例如Athlon 64 X2 3200+，其内存频宽到达离谱的200 MHz/sec，甚至比DDR1内存的5.6 GB/sec还差，只有在高时脉速度，例如2.4 GHz以上的处理器，才可以看到比旧的DDR1内存还好的表现。

由于DDR2内存和处理器时脉间紧密相依的关系，使得中价位处理器在搭配DDR2内存的效能低于搭配DDR1内存，这同时在实际应用的效能上也反应此一事实。

西瓜 · 发表于 2006-8-6 19:13

内存写入效能（续）

我们的测试系统跑CL4-4-4-8的内存时序设定参数。

在搭配DDR1内存，处理器支持command rate在1T的设定，但是即使用最高的内存电压的设定，整个系统还是无法稳定的运作。

为了比较起见，在DDR1系统中特地将command rate设定为1T。

西瓜 · 发表于 2006-8-6 19:14

内存写入效能（续）

超微送到我们实验室的测试系统是采用DDR2-800内存并用CL4.0-4-4-8的延迟设定，这个内存模块是由Corsair公司所制造，但是还无法在市面上买到。

AM2平台下的DDR2内存模块只有在特地挑选的样品才有完美的表现。

我们的DDR1测试系统采用由Geil制造的模块，所用的延迟参数为CL2.0-2-2-5。

Patriot Memory公司送来第一根DDR2-800内存模块有CL4的参数，应该很快就可以在门市中买到。

至于DDR1内存模块配合低延迟设定则平平无奇，但是价位上就比较便宜，如果你要用DDR2内存达到相同的效能，根据超微送来的参考系统表来看，那就会变得贵多了。

快速的DDR1内存模块价值约130美元。

DDR2-800内存模块配有较慢的时序，市面上尚属少见，应该会很贵。

实际上，我们觉得DDR2频宽有点奇怪，如果超微只能用一些特殊和精挑细选的DDR2内存的样品才能胜过老一辈的DDR1内存，那是必需要好好改善。

西瓜 · 发表于 2006-8-6 19:14

超微和英特尔的内存速度的对战

就实际测得的内存频宽的数值，拿英特尔的北桥解决分案来相比较，超微似乎是大大失策，英特尔的内存接口保持在200/266 MHz速度，无论处理器的时脉多少，频宽都会固定在6.3 GB/sec（200 MHz）和8.4 GB/sec（266 MHz）。

而在超微处理器内部的内存接口就需要较高的时脉速度才能产生相同效能。

看起来超微DDR2内存的引入反而减损了加快了的内存接口所得的优点。

西瓜 · 发表于 2006-8-6 19:14

超微和英特尔的内存速度的对战（续）

西瓜 · 发表于 2006-8-6 19:15

除频数（divider）的难题

我们所设的DDR2内存速度，例如Athlon 64 X2 4400+处理器下的736 MHz速度，并不是随便乱设的，这是处理器所指定的数字。回到先前DDR1内存接口搭配以前的Socket 939处理器时，我们发现处理器利用除频数（divider）将处理器时脉转成正确的内存速度来让内存得以顺利寻址工作，其内存内部则采用DDR400速度（200 MHz）。以下是实际的范例。

Athlon 64 X2 4200+: 2200 MHz / 11 = 200 MHz (DDR400)

Athlon 64 X2 3200+: 2000 MHz / 10 = 200 MHz (DDR400)

因为这个设计，超微只销售整数时脉速度的处理器，也就是能够整除得到200 MHz的处理器时脉的产品。

但转移到DDR2内存时，超微处理器时脉增加带来额外的难题，因为像DDR2-800内存固定用400 MHz时脉运作，但是先前处理器时脉反而无法全部被整除，所以变成最高的速度会可能无法到达400。

但是处理器的时脉面临无法被顺利整除而用到最大的内存时脉时，会有什么反应呢？

超微用了一个聪明的解决办法，也就是当除下来的时脉数字超过JEDEC兼容标准的内存时脉时（400, 533, 667, 800），其就会自动选取下一个除频数（divider），以免超过最大内存时脉，举例来说：

Athlon 64 X2 4800+: 2400 MHz / 6 = 400 MHz (DDR2-800)

Athlon 64 X2 4000+: 2000 MHz / 5 = 400 MHz (DDR2-800)

Athlon 64 X2 5000+: 2600 MHz / 7 = 371 MHz (DDR2-742)

Athlon 64 X2 4400+: 2200 MHz / 6 = 366 MHz (DDR2-733)

于是就产生一些奇怪的内存时脉数值，例如DDR2-742和DDR2-733等，这个自动选择的机制是无法被关闭或更动的。

因此，我们建议跃跃欲试的使用者在购买只前要先拿一台计算器算一算处理器时脉可以用多少的除频数（divider），这种状况会造成你纵使买了200MHz内存时脉的内存模块，但是因为处理器时脉能够被整除的数字受限，而可能实际上根本无法发挥最大效能的窘况。立如以下的例子所示。

Athlon 64 X2 4200+: 2200 MHz with DDR2-733

Athlon 64 X2 4000+: 2000 MHz with DDR2-800

如果因为上述的原因，将原本2200 MHz处理器强迫降低其内存时脉的效应，造成整体效能反而比价格便宜的4000+处理器时脉刚好可以整除的2000 MHz还差，那你可能得问自己，到底谁会搞清楚发生了什么事。

以下是整理出再标准时脉速度之下，所有可能内存设定。

用红字标示的内存时脉速度不是标准值，所以采四舍五入制，结果造成效能递减。

西瓜 · 发表于 2006-8-6 19:15

DDR2 SLI内存达到每秒10.3 GB的频宽

所有的AM2处理器设计成可以达到DDR2 800的最大内存时脉，但是这不能真的取悦于超频的使用者，因为市面上早就有DDR2 1066内存在销售了，所以可能是为了和Nvidia一起发展SLI双显示卡内存的原因，这看起来兹事体大，不过是一个单纯的构想。

市面上将会贩售这些称为「SLI memory」特殊的内存模块，Nvidia和超微配上Corsair公司的制造将会一起行销这个市场，这个技术是一个开放标准，所以还会有其它的制造商也会提供SLI内存模块，Corsair公司也宣称其XMS2内存模块将会全面支持SLI功能。

Corsair的SLI内存仍是测试前的样品，规格也一同印在卷标纸。

SLI内存如何运作？

再内存模块中纪录好几个超频的系统资料，以供你从BIOS设定中选用。

在BIOS中的SLI内存设定：在一些BIOS版本中可以看到SLI内存启用的情况。

在内存模块中的SPD（serial presence detect）EEPROM内存中存有其本身的速度与时脉的信息，还有一些额外资料也被输入整合在内。

SPD资料是存在这颗小小的EEPROM内存之中，其中有SLI内存和其它资料一并存入。

这个相应的标准称为加强效能参数（Enhanced Performance Profiles；EPP），由于EEPROM储存空间非常小，只能放两组完整的参数，但是也可以放到四组缩减版本的参数，下面是显示可能存在里面的资料。

在EEPROM里面的EPP内存信息
可用的信息	完整版本	缩减版本
电压值	X	X
Address Cmd Rate	X	X
Chip Select Drive Strength	X
Clock Drive Strength	X
Data Drive Strength	X
DQS Drive Strength	X
Address/Command Fine Delay	X
Address/Command Setup Time	X
Chip Select Delay	X
Chip Select Setup Time	X
Minimum Cycle at Sup. CAS延迟	X	X
CAS延迟	X	X
Minimum RAS to CAS延滞 (tRCD)	X	X
Minimum Row Precharge Time (tRP)	X	X
Minimum Active to Precharge Time (tRAS)	X	X
Write Recovery Time (tWR)	X
Minimum Active to Active/Refresh Time (tRC)	X

		自动登录	找回密码
密码			立即注册

超微挟AM2平台开创新局

浏览过的版块