楼主: 西瓜

显卡风云录:回忆曾经的经典之作

[复制链接]
 楼主| 发表于 2006-2-17 08:06 | 显示全部楼层
当前第11页:nVIDIA-决战的NV40和希望中的希望 本文共 50 页

10、决战-NV40

在2004年的4月14日,NVIDIA正式发布了最新最高端的GeForce 6系列显卡——GeForce 6800标准版和Ultra版(核心代号NV40)。NVIDIA方面表示,GeForce 6系列显卡具备众多新特性,其中包括更高速的架构、能够适应最新的软件、具备高精度编码解码芯片以及直接输出HDTV等功能。

从规格方面看,GeForce 6800 Ultra内建16条渲染管线,采用256MB GDDR3显存。而标准版GeForce 6800则只内建12条渲染管线,显存方面只有128MB,采用的也是普通的DDR1显存。NV40将NVIDIA特有的CineFX技术提升到了3.0版本,支持Pixel Shader 3.0? Vertex Shader 3.0、实时位移映射和Tone映射,最多支持16纹理/通道,支持16bit和32bit FP格式、sRGB纹理,支持DirectX和S3TC压缩、支持32bpp、64bpp和128bpp渲染以及更多的新视觉效果。

在内部结构上,NV40每条象素流水线都包含两个象素着色单元,他们可以一起按照不同的模式工作:它可以在一个时钟周期内进行三组件矢量操作和单元件标量操作,或者在每个时钟周期内进行两组双组件矢量操作。在一些我们称之为后处理的着色效果里,如发光、污点和一些自然的物体或者其它透镜效果一般是二维的,只有XY坐标。在这些方面,NV40流水线的两个像素单元独立工作的优势就体现出来了。

相对于原先nVIDIA的最高端产品5950Ultra,6800的晶体管数量的提升到了惊人的2亿2200万,几乎提高近50%,而他的核心频率却从5950的475MHz下降到了400MHz。

在特色技术方面,NV40加入了HPDR?High-Precision Dynamic-Range,高精确度动态范围? OpenEXR技术、支持FP滤波、纹理、混合。改进的Intellisample 3.0,支持16×AA,改善了压缩性能;支持HCT?高分辨率压缩?,它是一种全新的色彩、纹理和Z buffer在所有模式中的无损压缩算法,并具有高分辨率高频率和快速Z buffer清除功能。采用了UltraShadow Ⅱ技术,在大量阴影化应用游戏如Doom Ⅲ中,与上一代GPU相比可提高4倍性能。

另外geometry instancing也是很实用的功能之一,它可以让开发者批量处理大量琐碎的运算和小模件,把他们组成一个大的模块并有效的由总线传输到图像里面――这个功能对于即时战略游戏特别有用。通过geometry instancing的功能,程序只需要发送较少的绘图指令就可以批量处理所有的数据,从而大幅度减轻处理器的负担。

NV40还增强了温度监控和管理功能,增强了显示和视频输出功能,如NVIDIA Digital Vibrance Control ?DVC? 3.0和NVIDIA数字振动控制3.0。在API方面,NV40支持最新的DirectX 9.0和OpenGL 1.5。

另外,NV40还增加了渲染管线和CineFX3.0技术。渲染管线作为引擎最重要的功能之一,当3D模型制作完毕之后,美工会按照不同的面把材质贴图赋予模型,这相当于为骨骼蒙上皮肤,最后再通过渲染引擎把模型、动画、光影、特效等所有效果实时计算出来并展示在屏幕上。渲染管线就相当于处理这一系列工作的工作者。渲染管线的快慢直接影响图形最终生成的快慢,虽然GPU可以在一秒钟内处理相当多的三角形,但需要依赖渲染管线来进行贴图等即时处理。所以它的强大与否直接决定着最终的输出质量。

NV40采用了一个完全不同于NV30系列的着色器,尤其是对Shader Model 3.0(着色器模型3.0)的支持是目前独有的功能。Shader Model 3带来了三方面的改进:大大丰富了的编程模型,这样你可以编写更长的程序,可以进行更佳的程序流控制。因此从开发者的角度来看,他们在Shader Model 3上可以做更多他们感兴趣的事情,可以做过去在Shader Model 2上不能实现的功能,或者在Shader Model 3上更有效的去实现某些功能。例如复杂的人物动画片制作,在Shader Model 3的程序中当你需要略过某个角色或场景时,你可以分支或跳过一些暂时无用的代码,这样可以达到更快及更佳的效果,而在Shader Model 2你就必须去执行这些代码。由此来分析,Shader Model顶点纹理取码(vertex texture fetch)是相当值得关注的一项技术。顶点纹理取码允许应用程序直接从显存中提取纹理信息来作顶点处理,这种技术可以用在包括实时位移贴图(displacement mapping)等方面使用,通过这个功能你可以在顶点着色器3.0中实现各顶点的位移工作。

从象素的角度来说,NV40提供了一个更丰富的编程环境,你可以编写非常非常长的程序,它可以提供比Shader Model 2更多的指令数。你将得到一个真实的程序流控制模型,它可以提供循环及分支选项,就等同一个真实的编程环境。Sha

六安论坛
 楼主| 发表于 2006-2-17 08:06 | 显示全部楼层
当前第12页:ATI-开端-从3D RAGE、RAGE 128谈起 本文共 50 页

提起显卡,ATI公司如雷贯耳,ATI是一家股票上市公司,在多伦多(ATY)及纽约NASDAQ(ATYT)均有挂牌上市,营业额超过10亿美元,约有2200位员工分布于美国,欧洲及亚洲分公司。ATI公司全称为:Array Technology Industry,创立于1985年。是全球著名的3D 图形及多媒体技术供应商,专门设计、制造和销售适用于个人计算机的多媒体解决方案和图形元件。在3dfx、S3相继退出3D游戏显示舞台之后,目前ATI是唯一一家能和nVIDIA相抗衡的公司了。作为资格较老的图形显示芯片公司,多年征战使ATI累积了丰富的作战经验。好啦,下面我们就进入ATI的世界。

一、ATI的开端-从3D RAGE、RAGE 128谈起

ATI第一款3D显示芯片是ATI 3D RAGE,这也是第一代3D显卡的代表作。ATI 3D RAGE在当时提供了对光源的处理能力,是当时3D性能最全面的显卡,不过由于这一阶段显卡的3D性能尚未成为世人关注的焦点,而且ATI 3D RAGE显卡的兼容性存在一定的问题,所以很快就被人们所遗忘,在RAGE的前几款显卡当中,还有3D RAGE II、3D RAGE PRO两款加强版,但是实际上,真正的128bit芯片、也是ATI第二代3D显示芯片是从Rage 128开始的。

  实际上,ATI Rage 128是针对当时的Voodoo Ⅱ所推出的,从技术上上应该属于第三代3D显示芯片。Rage 128的性能在第三代显卡中可以说是比较高的,比当时nVIDIA的Riva TNT的性能要高一些,并它也有自己独到的地方,Rage 128的核心是专为32位渲染而设计的,32位渲染仅会造成不到5%的性能损失,所以在许多测试中它的性能与第四代3D显卡TNT2相差无几,甚至还略胜一筹,它具有优秀的2D、3D性能,是个多面手,但更偏重于商业应用和专业设计。

  Rage 128同Riva的TNT一样拥有单通道复合纹理处理功能。它还支持32位真彩模式,比起同样可以支持32位真彩模式的TNT和G200,Rage 128能保证在32位真彩模式下无任何性能降低,而其他显示芯片从16位转为32位模式,都存在不同程度的20%~50%的性能下降。Rage 128还内建了MPEG2解码以及动态补偿电路,可以流畅的播放DVD。另外Rage 128对OpenGL ICD的支持是众多显示芯片中最完善的,甚至获得了SGI公司的认证。Rage 128也分为GL和VR高低两种型号,以适应不同水品的用户。在当时,Rage 128的性能在低端机器中的表现不俗,特别是PII266或赛扬300于QuakeII的30 fps的得分,即使在高分辨率下性能也毫不减弱,另外,注意到Rage128在PII400或赛扬A超频到450Mhz时800 X 600模式下有突出的表现,所以受到了用户的青睐,然而由于它的推出时间一再推迟,使得它在上市之初就不得不面对Voodoo Ⅲ、RIVA TNT2、G400、等众多强大的竞争对手。

在这之后,1999年4月,ATI发布了他们的Rage 128 Pro图形芯片,相比Rage 128,Rage 128 Pro增加了非线性过滤,实现了对2048×2048的大纹理以及DirectX纹理压缩的支持,同时升级了三角形生产引擎,每秒能生成800万个三角形;3D性能比ATi Rage 128差不多提高了50%。Rage 128 Pro的预定对手是TNT2,而且其性能也与TNT2不分上下。此外,ATI Rage 128 Pro还可直接支持各项异性过滤,其性能比现在流行的三线过滤要好。它还支持数字液晶显示器、可通过24针DVI数字接口直接连接最新的液晶显示器。最后,ATI保持了传统的视频解压效果,提供了高级的硬件优化和丰富的软件支持,对于DVD解压来说绝对不在话下。

值得一提的是在Rage 128 Pro中应用了一种Dual ASIC双芯片技术。这种技术类似于Voodoo 2的SLI(Scan Line Interleave)技术,用同样的双芯片协同工作,最大程度上提高显示卡的性能,而当时的代表作是Rage Fury MAXX显示卡。

为了对抗NVIDIA的GeForce256,ATi发布了Rage Fury MAXX。ATI Rage Fury MAXX使用两颗Rage128 pro芯片,板载显存为三星G7共64MB,每颗芯片单独享有32M,这突破Rage 128绘图芯片在架构上最高支援32MB显示内存的限制。它使用ATI独特的AFR (Alternate Frame Rendering)多处理器技术,除了将显示内存支援容量提升至64MB以外,并拥有贴图速度加快及贴图着色正确的优点。该卡的填充率500 Mpixel/sec fill rate,完全的OpenGL ICD, Direct3D以及DirectX,支持AGP 1x/2x/4x和Hardware DVD。在任何分辨率下的全彩输出不失真,更不会降低运算效率。

后来针对家用

六安论坛
 楼主| 发表于 2006-2-17 08:07 | 显示全部楼层
当前第13页:ATI-再铸的辉煌-Radeon 256 本文共 50 页

二、再铸的辉煌-Radeon 256

  2000年,ATI终于发布了其第三代显示芯片—Radeon 256,这也是自nVIDIA推出GF256之后第二款GPU显示核心。
为了研制这块显卡 ,ATI公司花了很长时间进行产品的研发,他们的最终目标是取得高端显卡和游戏市场的龙头地位。众所周知,ATI
RAGE 128 PRO主要是依据RAGE 128来设计的,他们在整体的构架上几乎一模一样。而对于Radeon 256,ATI公司则重新设计了芯片,采用了完全不同的构架,采用200MHz的双像素通道架构,每个通道有3个纹理单元,那么最大的纹理填充率就等于:200MHz*2个通道 *3个纹理单元=1200M像素/秒。

  Radeon256采用了0.18微米的制造工艺,内建有3000万个晶体管,可在每秒生成3000万个三角形。Radeon256支持200MHz的DDR显存。ATI显卡的特点之一就是其出色的视频输入和输出,以及DVD解压功能,Radeon256也同样具备这些能力。Radeon256具有出色的3D角色动画技术,可良好支持DirectX7,并拥有真32位高分辨率,可达1.5G/S的渲染引擎。

  Radeon256最具特色的技术当推Charisma Engine几何引擎,它拥有的骨架动画技术和蒙皮技术等,可在硬件T&L打开的情况下,生成每秒3000万个三角形,并同时具有最高8个硬化的本地或无限远的光照能力,这些技术可令电脑的3D画面看起来更真实更平滑和柔和。

  作为市场上倍受赞誉的第二块GPU,Radeon 256采用硬件T&L技术无论对于消费者,研发人员,ATI公司甚至是nVIDIA,都是一个好消息。即使是T&L的开创者nVIDIA也只是采用了S3公司的一些技术但他们的驱动程序做的并不理想,以至实际效果差强人意 ,而ATI公司在这方面一直是强项。

  在设计Radeon 256的过程中,另一个复杂且困难的工作是对于通过硬件加快关键帧的插入,3D纹理的支持,及对三种贴图的支持-Direct-X Bump贴图,环境贴图和阴影贴图。而且Radeon 256同样提供硬件级的顶点皮肤渲染,在当时这是个非常先进的技术,至少比nVIDIA提供的要强,如果能够得到软件开发者们的支持及硬件厂商的肯定,那它一定会成为一个新标准,从而使软件和硬件的配合更紧密。具有四个建模的Radeon 256比起nVIDIA的两个建模要精确的多,并且速度也相当快,当然速度是很重要的一个方面。 

后来,对手逐渐稀少的市场,竞争却日益白热化,ATi和nVIDIA都使出浑身解数不断细化产品线,覆盖高中低全部阵线,打击对手,占领更多市场。RADEON、RADEON LE、RADEON VE、Radeon 7000、RADEON 7000VE、Radeon 7200都是在基于RADEON256的基础上通过改变频率或渲染管线的方法衍生而来,不过核心、显存工作频率下降到了183MHz/183MHz(DDR显存),在性能上基本与GeForce2系列产品线针锋相对。其中以Radeon 7200为代表,RADEON 7200 的特性包括32色快速3D图形、高级3D技术和强大的T&L图形处理引擎。ATI 的 CHARISMA ENGINE、Hyper Z 和 PIXEL TAPESTRY 可以提供高级的图形性能和处理能力,使图像更加形象逼真。

“Pixel Pipeline”数目减半,变成1条,而显存位宽也被缩减为64bit,支持双显示装置的第二RAMDAC和有关的零件(支持VGA+VGA,VGA+DVI,VGA+DVI+TV,VGA+TV),核心频率是166MHz,显存频率是332 MHz,其性能和GeForce2 MX差不多,此后又易名为Radeon 7000;Radeon LE,这是ATI针对中国市场推出的产品,在的Radeon基础上去掉了HyperZ功能并降低工作频率,但使用128bit显存带宽的DDR作为显存,工作频率为150/150MHz。(注:后来ATI还推出了Radeon LE的升级版—Radeon LE Ultra)

  ATI为了继续发掘Radeon核心的潜力,通过采用更先进的0.15制程、推出了工作频率更高的Radeon 7500版本,芯片工作频率达到290MHz,显存频率达到230MHZ,Radeon 7500也同样包括了Radeon 7500标准板和Radeon 7500 LE版。

  Radeon 7500标准版显卡按照核心频率不同分为290MHz 和270MHz两种,但搭配的64M DDR显存都是4纳秒规格,工作于230MHz。Radeon7500 LE是ATI面向中低端市场推出的一款廉价产品,它虽采用Radeon7500的核心,但工作频率降低为250MHz;在显存方面也没有使用DDR显存,而是使用了成本更加低廉的5纳秒SDRAM显存,容量为64M,工作频率为175MHz。

Radeon 7500相对于旧有Radeon最大的改变就是生产工艺,从原来的0.18改进到0.15,因此拥有更小的核心而且,芯片的核心速度也可以得到很大的提高。和Geforce2Ti系列的产品比较,ATi的Radeon 7500在芯片频率和显存频率这两个方面占据着明显的优势,这意味这它拥有更高的执行性能和显存带

六安论坛
 楼主| 发表于 2006-2-17 08:07 | 显示全部楼层
当前第14页:ATI-威胁nVIDIA的Radeon8500 本文共 50 页

三、威胁nVIDIA的Radeon8500

Radeon是ATI推出的第一款与nVIDIA相抗衡的显卡,在此后,ATI再接再厉,在2001年针对GeForce 3(NV20)推出了第四代高性能显卡Radeon8500!并且在这一年的5月宣布将显卡芯片的生产授权开放,这也意味着之后一些被授权的显卡生产厂商也可以生产ATI的显示卡了!消息一经传开,所有人都为ATI大胆的举动感到震撼,不过,事后证明,这一举措使得ATI结束了闭门造卡的路线,而是走上了一条更宽阔大道上。虽然nVIDIA公司马上作出反应,警告显卡厂商不得生产有ATI芯片的显卡,即使如此,很多厂商还是明确表示将会生产Radeon系列芯片的显卡。

RADEON8500采用0.15微米工艺制造,包括6000万个晶体管。并根据显卡的核心/显存频率分成不同的档次,这里包含275/550MHz的标准版RADEON8500,250/500MHz的RADEON 8500LE。

RADEON8500还具备双头显示功能,虽然这不是什么新技术,但是其他的高端产品却还都没有采用这个技术;由于nVIDIA的GeForce2 MX系列或者ATi的RADEON VE等双头显卡都是面向中低端的产品,所以nVIDIA根本没有计划将这项技术引入其高端产品,但是ATI却与时俱进,增加了这项功能。而RADEON7500/8500的双头显示配合“HydraVision桌面管理器”工具在实际操作中也非常灵活易用,可以分别定义两个显示器的显示分辨率和刷新率。RADEON7500/8500的双头显示包括:显示器和显示器搭配,显示器和DVI显示设备(如LCD)搭配,显示器和电视机搭配,电视机和DVI模式。

  Smoothvision属于ATI的反锯齿技术,全名可以成为全屏反锯齿技术,从明明上我们也可以看出它的先进,它是由MultiSampling技术而来,但是先前的MultiSampling反锯齿技术会让图像材质有一点模糊,这比起SuperSampling技术还是有一定的差距的。通过ATI推出的SmoothVision全屏反锯齿技术,使用者可以在最佳图像品质与最佳性能间选择一个平衡点。

RADEON8500还支持Truform技术。提起Truform技术,可以让我们联想起FSAA,的确,在当时对画面有直接重大影响的技术,除了FSAA,可以说就是Truform了,FSAA抗锯齿有效地降低了3D物体边缘的“锯齿效应”,而后者则可以在一定程度上解决游戏中人物多边形数量与游戏速度之间的矛盾。Truform可以说是一项非常有潜力的技术,这在之后ATI的显卡制造工艺上也有了充分的体现。

RADEON8500的RAMDAC(数字/模拟转换频率)也达到了创纪录的400MHz,在32bit色深下最高分辨率可以达到2048×1536,支持显示AGP4×接口;支持DriectX7.0、8.0、8.1以及OpenGL1.3硬件加速,以及硬件T&L加速。ATI还自行研发了HYPERZ II功能,这种功能可以有效增加显存带宽利用效率,加快显卡整体的速度;在其他功能中硬件DVD/MPEG2解码提供优秀的DVD播放效果。支持硬件DVD/MPEG2解码以最小的CPU占用率完成解码,VIDEO IMMERSIONTM II技术使得在平板显示器上的DVD显示效果更加真实。

Radeon8500采用128bit显存,主要有两款产品:8500标准板和8500LE板。Radeon8500标准版显卡的核心频率为275MHz,搭配3.6纳秒的64M DDR显存,同样工作于275MHz。Radeon8500 LE和标准版Radeon8500的唯一区别就是较低的工作频率,它同样搭载64M 3.6纳秒的DDR显存,但核心和显存的工作频率都为250MHz。Radeon8500 LE主要由第三方品牌的ATI兼容卡厂商推出,其品质一般也很不错,而且价格要比标准版Radeon8500低不少,性价比更高。

Radeon8500的出现让人们看到了ATI的信心!的确,经过不懈的努力,ATI终于能够与nVIDIA进行正面交锋了,虽然nVIDIA的GeForce3无论从性能上还是从品质上都还有很大的优势,而且在驱动程序方面Radeon8500还有些欠缺,但是Radeon8500的性价比却高的惊人,这使得Radeon8500抢占了nVIDIA不少市场,Radeon8500也成了nVIDIA最大的威胁。


盟创的Radeon8500显卡

六安论坛
 楼主| 发表于 2006-2-17 08:07 | 显示全部楼层
当前第15页:ATI-登峰造极的Radeon9700 本文共 50 页

四、登峰造极的Radeon9700

如果说2001年是ATI吹响抢占市场的冲锋号的一年的话,那么之后2002年则是ATI大展才华的一年!这一年的年初,nVIDIA率先推出了NV25、NV17芯片,也就是GF4全系列显卡,这次nVIDIA将显卡划分的更加细,高端具体分为GF4 Ti4600、Ti4400、Ti4200三个型号;而中低端的则是GF4 MX系列,具体型号为GF4 MX460、MX440、MX420。这使得nVIDIA一开始就抢得了先机,一时间,市场上到处都是nVIDIA最新的产品,nVIDIA也因此抢走了整个市场。显然,单靠ATI原有的显卡已经难以支撑局面。于是2002年7月17日ATI发布了支持DirectX 9的R300核心的Radeon 9700系列。

  采用了0.15微米制程的Radeon9700,核心与显存频率达到了325MHz/620MHz,这较之前期推出的Radeon系列来说都是相当高的了。Radeon9700的显存带宽也达到了空前的19.8GB/s,ATI声称,Radeon9700三倍于Geforce 4 Ti4600和Radeon8500的最主要原因是由于Radeon9700核心中改良的多重取样算法、色彩处理算法和精确子像素算法。其内部拥有8条渲染管道,这样就使得内部的晶体管数量达到了惊人的1.1亿,成为第一款内部晶体管数量超过一亿的图形芯片,而256bit的显存接口,也大大增加内部晶体管的数量。这么多的晶体管一起工作,发热量必然大大增加,耗电也非常厉害。于是,ATI采用了现在CPU最常用的Flip-Chip BGA(FCBGA)来封装。而且还需要单独的电源支持。

  Radeon9700完全支持DirectX 9和AGP 8×,而且新的架构包括256bit四通道交叉执行的显存架构接口、AGP 8×支持、全新的Vertex处理引擎、渲染引擎、Hyper-Z III处理技术、SMOOTHVISION 2.0的AA单元等等。除了性能外,在画质上也有所突破,以往全景反锯齿采用的最新的Supersampling算法会大大降低3D性能,但Radeon 9700采用了新的Multisampling算法,一种类似nVIDIA的反锯齿技术,可以有效提升3D性能。在视讯部份,ATI新的FullStream技术,可消除窄频视讯因为重度压缩后所产生的马赛克现象,提供更清楚的视讯画面。Radeon 9700系列显卡包括Radeon 9700 Pro和Radeon 9700,两者同样是采用R300核心,只是核心频率和显存频率有所区别。

  Radeon9700的出现彻底打碎了nVIDIA一统天下的梦想,而在各项测试性能中都轻松的击败了Geforce 4 Ti4600。市场再一次被平分了!与此同时,ATI在原R200的基础之上、改良推出了代号为RV250的Radeon9000系列。Radeon9000是针对Radeon8500所做的改良版本。Radeon9000是一颗AGP 4×规格,核心改良自Radeon8500,具备8500所有的功能,包含一样的内存架构、一样运作频率、一样的2D/3D/Video等强化引擎,当然也支持到DirectX 8.1的规格,差别只在Radeon9000把Radeon8500原先每组管线可处理的材质数减成1组(9700也是1组)。

  ATI推出的Radeon 9000有两种版本,一个是较高档的Radeon 9000 Pro,一个是中档的Radeon 9000,两者只差在频率的不同而已:9000Pro是275/275MHz的架构(跟8500频率一样),9000则是250/200MHz的架构。

2002年是ATI扬眉吐气的一年,在这一年,ATI的显卡第一次真正的超过了nVIDIA,由此,显卡市场进入了两家大厂商并驾齐驱的时代,ATI也用自己的实力证明了自己的强大!


Radeon9700显卡

六安论坛
 楼主| 发表于 2006-2-17 08:08 | 显示全部楼层
当前第16页:ATI-竞争白热化的Radeon9800 本文共 50 页

五、竞争白热化的Radeon9800

最新的显卡在紧锣密鼓的研制之中,两家公司的竞争也是你来我往,赶在nVIDIA的NV35发布前几个月,ATI于2003年的2月正是发布了其最新的显卡R350为图形芯片的Radeon9800系列显卡。从技术上来看,Radeon9800并不是十分先进的技术,可以说是R300的一个改进版本,但是改进的方式却并不是我们常说的只是时钟变化而已。

新核心仍然使用0.15微米工艺生产,R300证明了0.13微米工艺在当时还不是必须的。工作频率和显存频率为378/675MHz,虽然显存只有675MHz,但是千万不要轻视这块搭配675MHz 256bit的DDR显存得显卡,它的理论带宽比起GeForce FX 5800 Ultra的1000MHz 128bit显存还要高出40%。GeForce FX的频率优势在纹理填充率方面可以得到发挥,比Radeon 9800 Pro要高出1000MT/s。ATI和nVIDIA在象素填充率方面的竞争更加剧烈。而GeForce FX并非使用真正的8×1架构,虽然在某些情况下它的确可以在每个时钟周期内渲染8个象素,但一般情况下还是类似于传统的4×2架构。也就是说,GeForce FX的象素填充率并不固定,可以是2000MP/s也可以是4000MP/s,而ATI显然在这里可以大做文章。

公版的R350和R300一样提供S-Video,DVI和VGA输出。值得一提的是这块卡带有子卡接口,用于实现AIW版本的需要。另外Smoothvision的版本也升级到了2.1, 并且支持优化的Z缓冲(Hyper Z III+)以及更强的SMARTSHADER 2.1;显卡还可以使用最新的DDRII(仅限于256MB版本)内存。

改进的R350虽然比起R300没有根本性的改进,但是这块核心的性能依然引人注目,比起R300,R350有大约20%的提高。Radeon9800系列显卡共有三款,分别是Radeon9800、 Radeon9800 Pro和 Radeon9800 Pro 256MB,其主要区别在于核心频率和显存频率的差异。针对nVIDIA最新推向中端主流市场的GeForceFX 5600系列,ATI则推出R350—Radeon 9600系列来应对。这个系列也被具体分为Radeon9600 Pro和Radeon9600两个版本,Radeon9600 Pro的核芯/显存频率为400MHz/600MHz,Radeon9600版本的则是325MHz/400MHz。后来ATI还推出针对中国定制Radeon9800SE。

这一年中虽然ATI没有能够全面超过NV35,但是从市场的销售上来看,还是有了不少提高,但是真正能够超越nVIDIA或许才是ATI的最终目的!


Radeon 9800显卡

六安论坛
 楼主| 发表于 2006-2-17 08:08 | 显示全部楼层

六、又一力作!X800、X600、X300

时间走到2004年,nVIDIA 6800Ultra和ATi X800进入了人们的视线,在显卡迷们的眼中,又一个崭新的时代来临了!其实ATI是从9700开始了和nVIDIA争夺市场的计划的,随着它的驱动的成熟,所谓的兼容性问题一点点从我们记忆中消退。而ATI的显卡的性能画质却成为广大玩家津津乐道的话题,这令ATI一度被奉为画质显卡的典范。坐在宝座上的nVIDIA感到了摇摇欲坠。在9800pro之后,ATI又推出了9800XT,这是9800最终一个加强版本。随着nVIDIA 6800Ultra之后,ATI又紧随推出最新的X800系列产品,同9800XT相比X800的开发代号提高了很多,从R370一下提升到了R420,不过R420却是一款R370改进而来的产品,不过和9800pro和9800XT的关系不同,显然R420不会是R370的频率提升版,但它延续了9800系列的成功构架,而且事实证明这样设计还是非常成功的,不仅产品更新速度快,而且相对来说开发成本也低,同时也降低了开发风险。

相比9800系列X800的晶体管提升了5000万,不过大家不应该太担心它的热量问题,因为RADEON X800系列图形处理器采用了最先进的0.13微米low-k铜制制程,这个制程比9800系列所运用的0.15制程技术每单位约高出33%晶体管。并且,这会让晶体管多跑快100 MHz,而且完全不会增加电力和热量的负荷,因此我们可以看到X800的散热装置相比9800XT那个并没有“提升”很多。延续到功率方面X800的功率提升也不多,X800pro全速工作的功率为75w,这相对于nVIDIA的显卡的超级功率要好了很多很多。而在反锯齿上ATI仍然沿用了它一直使用的“多采样”技术,它通过“量”换质的方式,相对来说对于显卡运算的负荷不如“超采样”方式那么厉害。

在X800中共有6条可编程的顶点处理器,而每个顶点处理器中包含一个128位的浮点向量ALU以及一个32位的浮点标量ALU,以及一个控制器,它可以允许执行诸如循环、子程序、分支的执行。顶点运算引擎的固定功能部份,是专门处理顶点遮影程序完成之后产生的顶点数据。首先,去背功能先除去视野上已模糊的三角形,因为在影像成品上也看不到。接着,裁剪阶段会找出部份跑出窗口的三角形(或任何其它应用程序定义的区域),然后修掉三角形这些看不到的部份。然后在透视切割阶段调整与透视有关的顶点,产生立体深度感,最后,视角转换把3D 多角形投射在2D平面上。

由顶点运算单元得来的数据包括3 度空间位置信息、材质坐标、标准向量、颜色和质料信息。这些单元最基本的功能是将位置数据做转化,每个顶点位置通常含四个32-位的数值(x,y 和 z坐标值, 加上一个w 坐标值供计算透视图)。这类的转化过程需要一个4x4 矩阵乘法,并可将它们分割为4个向量乘积指令。RADEON X800中的每个128-位向量ALU 是设计来执行每个时脉周期产生的向量乘积指令。因为有六个这种ALUs,所以每个时脉周期共可处理1.5个顶点转化。

在X800当中,ATI还加入了3Dc技术;3Dc提供一个对于法线贴图压缩难题最为理想的解决方案。它提供了将近4:1的法线贴图压缩率,同时影像品质与未压缩前的图样几乎一致。此一技术系采用硬件加速,对影像表现的冲击最小。因此,研发人员可以不受限制的使用更高分辨率,甚至更加细致的法线贴图,同时/或是将它们套用在所有布景当中的所有对象上,而不只是选择性的套用在单一对象上。

不久X800pro和针对中低端市场的X600和X300相继推出,以对抗nVIDIA的NV40系列。


ASUS X800


GeCube Radeon X600


GeCube Radeon X300


在3DMark测试中X800一马当先

可以说,在这场旷日持久的大战当中,ATI扮演的角色无疑是一个英勇的战士,在风雨中一些人倒下了,一些人停滞不前了,只有ATI还在一如既往的和nVIDIA一次又一次的对决着,或许将来会有一天,人们会从新审视这段历史,会对一些往事津津乐道,但是其中的痛楚和艰难只有经过那个时代的人才会懂得。是的,这就是我们永远的ATI。

六安论坛
 楼主| 发表于 2006-2-17 08:09 | 显示全部楼层
当前第18页:Matrox-Matrox 3D时代的开始MGA-G100 本文共 50 页


一、Matrox 3D时代的开始MGA-G100

Matrox的MGA显示卡在2D引擎时代素有精良稳定之称,对比于其他的2D显卡,MGA显示卡拥有专业2D平面性能,速度出众,图像显示稳定,并且拥有良好的超频性能。这一状况一直到3D游戏出现时才被打破,一时间,玩家们一齐将目光投向了那些拥有绚丽画面的3D游戏,图形芯片厂商成了当时最忙碌的一个群体,新一代的3D显卡铺天盖地的涌入了市场,Matrox虽然在2D技术上拥有领先的技术,但是与众多从未涉足3D技术的新厂商一样,研制一款3D显卡成为了最重要的目标!在S3 Virge、Nvidia Riva128和Voodoo陆续登陆市场之后,Matrox在1997推出了其第一代3D图形加速卡—MGA-G100。

由于Matrox公司在2D技术上的优势,所以G100的设计方案很快就被定于在一块2D显卡增加一条3D渲染线,这应该不能算是一块真正的3D显卡,但是由于采用乐CPU的双缓存特性,其分辨率可以达到1600×1200,这在当时来说还是比较先进的。它最大可以使用8Mb SGRAM内存,具备每象素双线性及三线性过滤,超强高亮度,雾化及抗失真等3D特性。当然,每一款产品都含有自己的独特之处,G100也不例外,它内置自主研制的“分散聚集总线”技术和全硬件3D特性的结合,使处理器从繁重的图像工作中彻底解放出来,去进行其他的数据运算处理,大大提高了电脑的整体性能。在多媒体方面,它支持视频输入、视频CODEC和视频输出,可以和许多多媒体产品连接。G100还针对商用和家用推出两款系列的产品。

由于3D性能并不突出,所以这款G100没有被玩家所接受,加上造价昂贵,所以不多久,就被其他性价比高的3D显卡所取代。

六安论坛
 楼主| 发表于 2006-2-17 08:09 | 显示全部楼层
当前第19页:Matrox-重展雄风G200 本文共 50 页

二、重展雄风G200

  由于G100的失宠,Matrox受到了一定的打击,高层也已经发现依靠传统的2D性能已经无法满足市场的需要,所以在一番努力研究之后,Matrox在1998年5月初发布了其第二代3D图形加速芯片—MGA-G200。这款著名的芯片对Pentium II进行了优化,使用独一无二的128bit双总线结构,最多支持16MB SGRAM内存,并带有一个集成的230/250MHz RAMDAC以提供最高档的性能,这些都使它性能变得非常不错。

在这里我们即将谈到G200的独特之处,128bit双重独立总线技术,G200没有采用以往的64bit图形总线或128bit图形总线,而是将两条独立的64bit总线并行使用,使得2D图形操作的速度几乎加快了一倍!虽然当时的游戏大多不能达到128bit的数据宽度,所以比起当时流行的64bit显卡的性能只是略微有所提高。另一方面,G200还采用了“分散聚集总线技术”来解决传输和反馈周期时间过长的问题,配合双重独立结构使得在CPU系统中可以处理大量和频繁的运算,速度也有很大提高。

G200集成3D引擎与其前代相比有了较大的改进,他不但支持Direct3D、OpenGL API及大多数3D功能,而且支持在游戏中用于产生一些特殊效果的多纹理贴图。G200内置可编程的浮点安装和填充引擎,能产生每秒最高为1500000个三角形,安装引擎能够完成全功能的Direct3D和OpenGL三角形、条形、扇形和矢量计算任务,并能够升级3D管线。

  MGA-G200的 VCQ(Vibrant Color Quality Rendering)技术则可以使得你在渲染管线中准确使用32位色,并且能从源材质图中渲染32位色的图像,即使在设置为16位色的情况下,所有的内部操作仍然以32位方式进行,只是在最后才经过抖动处理转变为16位色,因此,VCQ结构能够提供高质量的彩色输出。而且G200支持高精度的32位Z-Buffering(Z缓冲),这个功能是众多CAD软件盼望已久的,这也是下一代3D游戏中必备的东西。

此外, G200芯片支持了AGP 2×接口,这使得其有了更大的技术优势,Matrox还特地在G200中采用了一个新的Symmetric Rendering Architecture(SRA,对称渲染结构)技术。通过允许在帧缓冲区和主内存之间高速传输位图,以及在主内存中直接进行所有的绘图操作,SRA还能够帮助提高2D加速和视频操作的性能。

在超频方面,G200芯片发挥了Matrox显示卡性能传统的稳定优势,这使得显示卡的时钟运行频率一直都保持在非常保守的地步,即便显示芯片和元件都支持高频率的运行,由于在显示卡出厂时,其运行频率调得非常低,所以对于那些喜欢给显示卡超频的人来说,不啻是一大福音。G200显示芯片使用新的0.25微米工艺制造,照理来说非常符合高频率下工作,但该卡的额定工作频率依然保持原状,并没有因此而提高,加上芯片散热量非常小,所以G200的超频性能因芯片工艺的改进而大幅提高。

从当时来看,G200采用的技术可以说是超前的,它优良的图像品质加上独特的功能使得Matrox在3D显卡制作上有了明显的进步;但是G200的3D性能尚未成熟,并不能和其他第三代显卡相提并论,在市场上无法与RIVA TNT以及VooDoo2分庭相争,而价格过高和不能良好支持OpenGL也使得它的性能有所减弱。


Matrox G200

六安论坛
 楼主| 发表于 2006-2-17 08:10 | 显示全部楼层
当前第20页:Matrox-G400 铸就Matrox的丰碑 本文共 50 页

三、G400 铸就Matrox的丰碑

如果说在1997年底我们震惊于Voodoo2的3D效果的话,那么在1999年我们也忘不了Matrox带来的2D画面的感动。G400对Matrox而言和Voodoo2对于3Dfx的重要性一样,它是一个品牌成功的开端,也在人们心中留下了它的影子。

提到G400,或许会激起不少玩家的感慨,的确这是一款为人称道的显示芯片。与G200相比,G400采用更先进的0.25微米技术来生产的,采用0.25微米技术生产的图形芯片现在已经很普遍了,它能使芯片运行在更高的时钟频率上,发出更少的热量,减低生产成本。由于采用了更先进的制程,G400的时钟频率提升到了125MHz,显存工作频率为150MHZ,而填充速率也达到了250Mpix/s的范围时。

与G200一样,G400身上依然集合了Matrox独有的特征,比如最新的256bit双重独立总线技术;它采用了和前辈G200一样128bit双重独立总线技术,创造出256bit双重独立总线结构。在图形芯片的内部采用了两条独立的单向传输的128bit总线,这两条数据通道一条负责把已经从显示内存中读取到的内部缓冲的数据传输给2D/3D内核,而另一条则可以把经过芯片内核处理好的最终结果送入缓冲以便输出到显存中显示出来,这样就不存在数据输出输出时相互等待的延时,而且图形芯片内核也可以保持在满负荷状态,不需要在输出数据时因无新数据处理而处于空闲状态。

而双头显示技术使得G400可以将两个同时发生的但在物理上独立存在的图像输出到两个不同的显示设备上。些设备可以是两台普通CRT显示器,可以是一台CRT和一台电视机,或者是一台CRT和一台平板显示器等等。这一创新性的设计使Matrox保持了对其他显卡的优势,尽管现在许多显卡都能视线双头输出,但却是G400开创了这一设计。

G400还独创了第二代明亮色彩着色(VCQ2)技术;采用全32bit精度的内部流水线,通过增加精度和内部管道缓冲来降低渲染过程中的累计误差和抖动失真,使色彩层次更加细腻逼真。而采用8bit滤波系数;提供了质量最好的双线性、三线性和各向异性过滤,使纹理渲染的精度得到极大的提高。采用了8bit模板缓冲以加速特定场景的渲染速度。在视频方面,G400在硬件上加速了DVD播放,并可以在4:3特征比率的电视机上播放16:9编码的DVD全屏幕影片而不在屏幕上下端产生黑边。

从性能上来看,G400虽然在3D处理上没有超过TNT2,但是在当时能和TNT2抗衡的也只有Matrox的G400了,但是成本太高,使得G400显卡的销售量没有质的提高。


G400的多个版本


G400的多个版本


G400的多个版本


G400的多个版本


G400的多个版本


G400的多个版本

六安论坛
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

侵权举报:本页面所涉内容为用户发表并上传,相应的法律责任由用户自行承担;本网站仅提供存储服务;如存在侵权问题,请权利人与本网站联系删除!举报微信号:点击查看