MCPLive > 杂志文章 > “Mark”不是万能 3DMark 11实战经验谈

“Mark”不是万能 3DMark 11实战经验谈

2011-03-30river《微型计算机》2011年3月上

新发布的3DMark 11支持DirectX 11,应用了目前流行的显卡技术,实现了如景深、曲面细分、HDAO等特色效果,在画质上达到了一个新的高度,被誉为新一代“显卡杀手”和“压力大师”——但它真的能够代表目前DirectX 11显卡的真实游戏性能吗?

以谁为准?3DMark 11测试结果与实际游戏不符

已经发布多代的3DMark系列基准测试软件,由于测试场景丰富,可以模拟图形应用的各个方面,因此一直是大家用来判断PC图形性能的软件。3DMark 11测试软件发布后,笔者在第一时间对其进行了测试,发现其测试结果和实际游戏不符。以笔者手中的GeForce GTX 460 1GB和Radeon HD 6850这两款定位类似的产品为例,在之前的3DMark Vantage测试中,GeForce GTX 460 1GB小幅领先Radeon HD 6850,反映在实际游戏中的测试结果也和3DMark Vantage相印证。在一些新的DirectX 11游戏测试中,GeForce GTX 460 1GB的领先幅度会更大。但在3DMark 11中,GeForce GTX 460 1GB和Radeon HD 6850性能的胜负关系换了一个位置,无论是在Performance模式还是EXtreme模式中,GeForce GTX 460 1GB显卡的性能都落后Radeon HD 6850。这又是怎么回事呢?——为什么两者在3DMark 11、3DMark Vantage以及实际游戏测试中的差距较大呢?

主流、高端齐上阵,实战3DMark 11

测试平台

CPU 英特尔Core i7 875K
主板 技嘉GAP55-UD6
内存 金邦DDR3 1600 2GB×2
显卡
GeForce GTX 460 1GB、Radeon HD 6850、
GeForce GTS 450 1GB、Radeon HD 5750 1GB

为了进一步找到问题的根源,笔者再次作了一次详细测试,同时补充了两款显卡进行验证:GeForce GTX 460 1GB和Radeon HD 6850代表高端显卡,GeForce GTS 450 1G和Radeon HD 5750 1GB代表主流显卡。这四款产品是目前点名率很高的DirectX 11显卡,代表了主流和高端市场,测试结果更有说服力。测试软件除了3DMark 11和3DMark Vantage以外,还加入了《孤岛惊魂2》(代表DirectX 10游戏性能);《失落的星球2》、《尘埃2》和《汤姆克兰西2》(代表DirectX 11游戏性能)以及Unigine Heaven Benchmark(DirectX 11基准测试软件,可以全面考察显卡的DirectX 11性能,特别是曲面细分性能)。

四款显卡测试成绩表

 
Radeon 
HD 6850
GeForce 
GTX 460
GeForce 
GTS 450
Radeon 
HD 5750
3DMark 11 Performance  P3226 P3167 P2106 P2125
3DMark 11 Extreme X1132  X1041 X677 X694
3DMark Vantage Performance P14080 P15716 P10483 P9135
GPU得分 11542 12930 8400 7732
《孤岛惊魂2》        
1920×1080 Ultrahigh 71.65 82.94 56.17 47.61
1920×1080 Ultrahigh 8AA 53.87 60.82 38.79 32.49
《失落的星球2》B测试画面        
1680×1050 Veryhigh 29.4 34.1 21.8 17.6
1680×1050 Veryhigh 23.4 28.6 17.9 13.5
Unigine Heaven Benchmark        
1680×1050 Tessellation(Extreme) 21.5 25.6 17.3 13.2
1680×1050 Tessellation(normal) 32.4 36.8 24.6 20.3
《尘埃2》        
1920×1080 Veryhigh 56.2 61.2 40.7 40.2
1920×1080 Veryhigh 4AA 47.3 53.3 34.4 35.9
《汤姆克兰西2》        
1920×1080 Veryhigh 79 116 81 55
1920×1080 Veryhigh 4AA 67 98 65 46

从测试结果来看,在高端显卡测试方面,GeForce GTX 460 1GB无论是在3DMark 11的Performance还是EXtreme模式中,都落后Radeon HD 6850 9%左右。不过在实际游戏中,GeForce GTX 460 1GB全面反超Radeon HD 6850,总体领先幅度在10%以上。特别是在DirectX 11游戏中,GeForce GTX 460 1GB的领先优势更大,例如在《尘埃2》和《汤姆克兰西2》的测试中,GeForce GTX 460 1GB的领先幅度则达到了20%左右。

中端显卡的测试结果与高端显卡类似,虽然GeForce GTS 450在3DMark 11的测试中以很小的差距落后于Radeon HD 5750,但在大量游戏实测中,GeForce GTS 450完全占据了上风。例如在Unigine Heaven Benchmark和《汤姆克兰西2》测试中,GeForce GTS 450的领先幅度都在20%以上。

以谁为准?3DMark 11测试结果分析

测试数据再次表明,3DMark 11的测试结果与实际游戏的测试结果反差较大,这是为什么呢?3DMark系列在业内一直被称之为理论性测试软件,之所以叫做理论性测试,是因为这款软件的测试结果在理论上可以提供一定的显卡性能排序参考。但这不足以完全衡量一款显卡的性能,还需要结合游戏测试进行综合判定。

下面,我们不妨来对3DMark 11进行分析。其使用了大量先进的DirectX 11技术,比如多线程优化、曲面细分、置换贴图等。但这些技术的应用比例和实际游戏中对这些技术的应用比例是不尽相同的,这就是3DMark 11与实际游戏的测试结果出现较大偏差的根本原因。

DirectX 11技术的核心,曲面细分解读

在进行细致分析前,我们不妨先来看看目前业界关注的焦点——DirectX 11中的曲面细分。在众多DirectX 11技术中,曲面细分是一个很重要的技术,它在DirectX 11中被首度引入。该设计让游戏更加逼真,细节表现更细致。无论是NVIDIA还是AMD都在努力提升各自产品在曲面细分应用中的性能。可以预见,未来游戏将进一步加重曲面细分技术的应用,这是未来游戏的发展方向。

软件对技术的应用和实际游戏有别

3DMark 11大量使用了高精度的纹理贴图来实现极为精美的物体表面效果,这一点和《Crysis》很相似。但这并不代表其他游戏也使用了如此高精度的纹理,一些新游戏可能更为偏重像素计算的比值,而纹理计算负载相对较低,这种游戏的实际测试成绩相比3DMark 11的测试分数就可能有一定的偏差。此外,3DMark 11中对曲面细分等新技术的应用并不特别深入,比如它内置测试程序只拥有高15级的曲面细分系数。而首款DirectX 11测试软件Unigine Heaven Benchmark的曲面细分系数则远远高于3DMark 11,另一款DirectX 11测试软件《绿巨人》的曲面细分系数也比较高。曲面细分是DirectX 11中重要的技术之一,目前已经广泛应用在DirectX 11游戏中。因此3DMark 11的测试结果就难以代表那些大量使用了曲面细分技术的游戏的水平。


纹理质量特别高是3DMark 11的特点之一

在光照效果、阴影处理甚至抗锯齿计算方面,3DMark11也有自己的独特要求和算法,这和实际游戏又有些不同,且实际游戏还可能偏向某些技术甚至对某一系列的显卡作出优化,比如更为偏向一些游戏特效的应用以实现更好的游戏画质体验和对NVIDIA或者AMD显卡进行特别优化等,这些都是实际存在并将长期持续的情况。比如同样是GeForce GTX 460 1GB和Radeon HD 6850,虽然前者的领先幅度较大,但后者在一些为其优化的游戏中也能获得不错的性能。这样就会终带来不同显卡在不同游戏测试中百花齐放、不尽相同的测试结果。

同为DirectX 11游戏,体验大不同

那么,为什么会出现这样的情况呢?从游戏开发过程来看,一款新游戏在面世之前,游戏开发者需要对自身的技术能力、游戏的市场定位、内容需求以及玩家喜好度有明确认识,并通过这些资料来确定游戏本身的开发目标,其中就包含了画质、可玩度和剧情等诸多内容。在画质的考量上,游戏开发者往往需要对游戏采用哪些技术作出综合判断,并决定该技术在游戏中的使用程度。

比如一些游戏虽然使用了DirectX 11技术,但并没有过多应用DirectX 11的特色技术,例如首款DirectX 11游戏《BattleForge》就没有加入曲面细分设计。这是因为游戏开发者虑到当时DirectX 11显卡刚推出,型号少,对曲面细分支持不够好,因此并没有加入曲面细分设计。这种仅有少量DirectX 11技术的游戏被称为“轻量级”DirectX 11游戏,这类游戏在DirectX 11发布早期普遍存在。而另外一些DirectX 11游戏开发时间较晚,已经开始大量使用诸如多线程、曲面细分、HDAO等特效,因此终画质表现上更完美,游戏体验和使用老API的游戏差距更大,这类游戏可以被称为“重量级”DirectX 11游戏,例如《失落的星球2》和《汤姆克兰西2》,它们都是目前检验DirectX 11性能的重要游戏,也是点名率很高的游戏,可玩性较强。

当然,在各种“重量级”DirectX 11游戏中,也存在不同的开发方向。比如一些游戏特别凸显光影效果,则对体积光照、HDAO和景深效果等应用特别多;一些游戏追求精细的画质,则对曲面细分、多重纹理贴图等技术应用特别多,甚至使用了DirectX 11新的纹理压缩格式等。总的来看,也正是由于各游戏厂商、开发者的开发初衷的差异,导致了我们终看到了各种游戏在显卡运行中的不同表现。

追求普遍性,不一定能代表真正游戏表现

3DMark 11作为一个理论性的测试软件,它只能在一定程度上代表了目前业界对DirectX 11技术应用的水平以及对未来DirectX 11应用的预期。它一般不会针对硬件作出明显优化,也很难体现特殊设计带来的性能优势。比如对物理引擎的使用方面,目前3DMark 11使用了开源物理引擎,虽然公正性毋庸置疑,但实际上我们可以发现,目前并没有一款游戏使用开源物理引擎,说严重一点就是3DMark 11的物理测试完全不能代表目前任何一款游戏的实际物理运行情况。这是因为这种开源物理引擎只能测试出C PU本身的计算能力,并不能代表整个系统在游戏运行时的实际表现。如果某款游戏使用了NVIDIA的PhysX引擎并进行GPU加速计算,那么对这款游戏来说,GeForce显卡的表现肯定要好于同档次Radeon显卡;反过来,如果Radeon显卡一旦支持开源物理引擎Bullet的GPU硬件加速,那么其性能表现也有可能比GeForce显卡更好或者更差,但这些都不是3DMark 11可以体现和检测出来的。


3DMark 11物理测试使用了开源物理场景

追求测试普遍适用性,就意味着放弃特殊优化,这是一个两难的选择。笔者认为,3DMark 11为了在公平性上尽可能做到好,在设计时并没有过多考虑游戏应用、软件发展以及未来趋势。因此可以看到3DMark 11的测试结果和不少游戏,特别是新的DirectX 11游戏的测试结果出现了一定偏差。

衡量显卡性能:实际游戏更重要

当然,笔者并非否定3DMark 11的积极意义,它作为权威的DirectX 11测试软件,它的立场和开发方向都可能会影响到未来游戏的发展。但从游戏本身角度来说,游戏开发者本身的选择,以及软硬件厂商的配合优化、引擎选择等,才是显著影响显卡性能的因素。

对玩家来说,3DMark 11只是一个理论性测试软件,它的测试数据对衡量系统性能有较大意义,可以大致衡量显卡的性能。笔者认为,一款性能出色的DirectX 11显卡,应该可以在各种DirectX 11负载、各种DirectX 11应用条件下不出现明显的性能瓶颈,同时在各个游戏中拥有基本均衡的性能表现。因此单凭3DMark 11一项测试成绩是无法全面衡量显卡性能的。

如果要全面衡量一款DirectX 11显卡的性能,必须加入大量的游戏对比测试,在不同分辨率、抗锯齿模式下对显卡进行全面测试,终得出综合测试结果,才能更好地对显卡性能进行排位。例如Unigine Heaven Benchmark、《绿巨人》、《失落的星球2》和《汤姆克兰西2》都是当下衡量DirectX 11显卡性能的优秀软件和游戏。Unigine Heaven Benchmark测试场景丰富,可以深度考察DirectX 11显卡多方面的性能,特别是曲面细分性能。《失落的星球2》和《汤姆克兰西2》则是当前具有代表性的DirectX 11游戏,加入了新的DirectX 11技术。另一方面,NVIDIA一直宣称其显卡是“真DX11”显卡,原因在于其产品专为DirectX 11设计,曲面细分单元更多,在DirectX 11游戏中的表现更好。而通过笔者的对比测试发现,NVIDIA在主流以及高端价位上的产品的综合性能确实要优于AMD同价位的产品,验证了NVIDIA的说法。

另一方面,虽然现在3DMark 11还不能完全代表DirectX 11显卡的真实性能,但随着DirectX 11技术和游戏的逐步应用和普及,未来我们不妨再利用该软件来进行相同的测试,看看情况是否有所变化。

分享到:

用户评论

共有评论(1)

用户名:

密码: