显卡性能深度解析

 时间:2018-07-01  贡献者:ghjvprince

导读:【高清图】 是否值得期待?hd6570m显卡性能解析图9,手把手教你识别显卡主要性能参数手把手教你识别显卡主要性能参数 初识显卡的玩家朋友估计在选购显卡的时候对显卡的各项性能参数有点摸不着头脑, 不知道谁对显卡的性能影 响

【高清图】 是否值得期待?hd6570m显卡性能解析图9
【高清图】 是否值得期待?hd6570m显卡性能解析图9

手把手教你识别显卡主要性能参数手把手教你识别显卡主要性能参数 初识显卡的玩家朋友估计在选购显卡的时候对显卡的各项性能参数有点摸不着头脑, 不知道谁对显卡的性能影 响最大、哪些参数并非越大越好以及同是等价位的显卡但在某些单项上 A 卡或者是 N 卡其中的一家要比对手强 悍等等。

这些问题想必是每个刚刚接触显卡的朋友所最想了解的信息,可以说不少卖场的销售员也正是利用这些 用户对显卡基本性能参数的不了解来欺骗和蒙蔽消费者。

今天显卡帝就来为入门级的显卡用户来详细解读显卡的 主要性能参数的意义。

显卡帝手把手教你识别显卡主要性能参数 关于显卡的性能参数,有许多硬件检测软件可以对显卡的硬件信息进行详细的检测,比如:Everest,GPU-Z, GPU-Shark 等。

这里我们以玩家最常用的 GPU-Z 软件来作为本文解析显卡性能参数的示例软件。

GTX590 的 GPU-Z 截图 首先我们对 GPU-Z 这款软件的界面进行一个大致分区的解读,从上至下共 8 个分区,其中每个分区的具体含 义是:①.显卡名称部分:名称/Name:此处显示的是显卡的名称,也就是显卡型号。

②.显示芯片型号部分:核心代号/GPU:此处显示 GPU 芯片的代号,如上图所示的:GF110、Antilles 等。

修订版本/Revision:此处显示 GPU 芯片的步进制程编号。

制造工艺/Technology:此处显示 GPU 芯片的制程工艺,如 55nm、40nm 等。

核心面积/Die Size: 此处显示 GPU 芯片的核心尺寸。

③.显卡的硬件信息部分:BIOS 版本/BIOS Version:此处显示显卡 BIOS 的版本号。

设备 ID/Device ID:此处显示设备的 ID 码。

制造厂商/Subvendor:此处显示该显卡 OEM 制造厂商的名称。

④.显示芯片参数部分:光栅操作单元/ROPs:此处显示 GPU 拥有的 ROP 光栅操作处理单元的数量。

总线接口/Bus Interface:此处显示显卡和主板北桥芯片之间的总线接口类型以及接口速度。

着色单元/Shaders:此处显示 GPU 拥有的着色器的数量。

DirectX 版本/DirectX Support:此处显示 GPU 所支持的 DirectX 版本。

像素填充率/Pixel Fillrate:此处显示 GPU 的像素填充率。

纹理填充率/Texture Fillrate:此处显示 GPU 的纹理填充率。

⑤.显存信息部分:显存类型/Memory Type:此处显示显卡所采用的显存类型,如:GDDR3、GDDR5 等。

显存位宽/Bus Width:此处显示 GPU 与显存之间连接的带宽。

显存容量/Memory Size:此处显示显卡板载的物理显存容量。

显存带宽/Bandwidth:此处显示 GPU-Z 与显存之间的数据传输速度。

⑥.驱动部分:驱动程序版本/Driver Version:此处为系统内当前使用的显卡驱动的版本号。

⑦.显卡频率部分:核心频率/GPU Clock:显示 GPU 当前的运行频率。

内存/Memory:显示显存当前的运行频率。

Shader/Shader:显示着色单元当前的运行频率。

默认核心频率/Default Clock:显示 GPU 默认的运行频率。

(默认)内存/Memory:显示显存默认的运行频率。

(默认)Shader/Shader:显示着色单元默认的运行频率。

⑧交火和运算能力部分: NVIDIA SLI 或 ATI Crossfire:显示是否开启 SLI 或者 Crossfire 多显卡交火。

运算能力:显示是否具备 OpenCL、CUDA、PhysX 和 DirectCompute 5.0 运算能力。

下面我们就重点为大将对显卡的性能参数做一个详尽的讲解,最后终结出哪些性能参数最能影响的显卡性能, 以及我们消费者在实际购买显卡时应该从哪方面去思考,以及怎么依靠显卡性能参数来对显卡进行大致的判断和 比较。

我们希望菜鸟读完本文能够对显卡有个大致的“轮廓”,老鸟读完本文能够对显卡的核心性能参数有个更深 入的认识。

显卡名称、芯片型号以及硬件信息显卡名称、芯片型号以及硬件信息 消费者在购买显卡的时候首先应该明确的就是我该购买的显卡的型号 (名称) 是什么, 也就是 GPU-Z 中的 Name 所示的参数信息,例如本例中的“GTX590”。

显卡 GPU-Z 截图中关于显卡名称、芯片型号和硬件信息的部分 而通过显卡芯片型号的解读, 我们又可以对显卡核心 GPU 的信息作进一步的了解。

从 GPU 这一项我们能够得 知显卡核心的 GPU 研发代号。

GPU 的代号一般来说往往是与显卡型号名称相对应,举例来说: GF110 对应: NVIDIA GeForce GTX590 GF100 对应: NVIDIA GeForce GTX480 Antilles 对应:Radeon HD 6990 RV870 对应:Radeon HD 5970 当然也有一个 GPU 代号对应多个显卡型号名称的,而这些往往是 JS 忽悠小白的地方。

例如: 基于 GF104 核心的显卡同时有 NVIDIA GeForce GTX 460 (768MB) 、 NVIDIA GeForce GTX 460 (1024MB) 和 NVIDIA GeForce GTX 460SE 共三款产品,如果消费者对这些显卡不大熟悉的话,很容量被商家所误导而购买 被“换型”的显卡产品。

同型号的三款 GTX460 的不同区别 从上面的对比图中我们可以很清楚的看到 768MB 和 1024MB 版的 GTX460 主要在显存容量和显存带宽上有很 大区别,而 GTX460SE 的区别主要在于 CUDA 处理器缩减至了 288 个。

有同一 GPU 代号对应多款显卡型号,自然也有同个显卡型号对应多个 GPU 代号,例如:Radeon HD5670。

HD5670 的两种版本 从上图我们可以看到两者的区别主要在于核心 GPU、流处理器数量以及核心面积,虽然同为 HD5670,但是 640SP 的 HD5670 性能已经几乎接近 HD5750 的程度。

通过上面的总结得知,我们玩家在选购显卡的时候一定要弄明白自己所要购买的显卡型号和显卡 GPU 核心代 号具体是什么,购买的时候最好当场对显卡进行简单的上机测试,用 GPU-Z 等相关测试软件看下显卡的硬件信 息是否有异常情况,这样玩家就可以尽可能的降低上当受骗的几率。

显卡芯片参数解析:悟透 ROPs显卡芯片参数解析:悟透 ROPs 这一部分是我们所要重点解读的内容, 因为不少初玩显卡的朋友或者老玩家对这些性能参数的都不是特别清晰, 下面就让我们来一起进行详尽的解读。

显卡芯片参数部分 首先一个重要的概念就是 ROPs(Raster Operations Units),即光栅化处理单元,表示显示 GPU 拥有的 ROP 光栅操作处理单元的数量。

通常来说:3D 图形处理可以分成四个主要步骤,几何处理、设置、纹理和光栅处理, 而 ROPs 就是处理光栅单元。

那么光栅化处理单元的多少对显卡性能有哪些影响了?

ROPs 架构图 ROPs(光栅化处理单元)主要负责游戏中的光线和反射运算,兼顾 AA、高分辨率、烟雾、火焰等效果。

游戏里的 AA(抗锯齿)和光影效果越厉害,对 ROPs(光栅化处理单元)的性能要求也就越高,否则就可能导致游戏帧数急剧下 降.比如同样是某个游戏的最高画质效果,8 个光栅单元的显卡可能只能跑 25 帧.而 16 个光栅单元的显卡则可以稳 定在 35 帧以上。

举一个例子:GTX550Ti 和 HD6790 前者是 24 个 ROPs 单元,后者是 16 个 ROPs 单元,虽然在 大部分测试项目中,HD6790 都是领先 GTX550Ti 的,但是在高 AA(抗锯齿)负载的情况下,HD6790 的弱点即 刻暴露出来, 16 个 ROPs 单元显得有点力不从心。

从 FarCry 2 中也印证出了这一点: 游戏中 4xAA 设置下 HD 6790 的落后幅度为 4%左右, 而开启 8xAA 后性能落后幅度则扩大至 15-17%之多。

(关于 GTX550Ti 和 HD6790 的 ROPs 数目,详见于此) 需要注意的是,AMD 显卡和 NVIDIA 显卡在 ROPs 的设计上是有区别的,N 卡的 ROPs 单元和流处理器是“捆 绑”的,即置于 SIMD 之内,所以倘若消减 N 卡的流处理数量,其 ROPs 单元也随之消减;而 A 卡则不一样,其 ROPs 单元和流处理器单元是没有关联的。

传统管线架构 第二个重要的概念:Shaders。

传统管线架构:以往显卡由顶点渲染管线和像素渲染管线组成,生成图像的过 程都是先由顶点渲染管线中的 Vertex Shader(顶点着色器)生成基础的几何图形骨架(由三角形构成),然后再 由像素渲染管线中的 Pixel Shader(像素着色器)进行填色,最后才是像素渲染管线中的纹理单元进行贴图。

而当 新的统一渲染架构提出之后,顶点着色器和像素着色器被合二为一,成为流处理器(Shaders),它将同时负责 顶点着色和像素着色,避免了负载不均衡的情况发生。

最先提出统一渲染架构的是微软的 DirectX 10。

步入 DX10 时代,shader 单元数量成为衡量显卡级别的重要参数之一 需要说明的是,N 卡和 A 卡的所采取的核心架构是不一样的,N 卡采用的是 MIMD 架构。

多指令流多数据流 (MultipleInstructionStreamMultipleDataStream,简称 MIMD),它使用多个控制器来异步地控制多个处理器,从 而实现空间上的并行性, 所以 N 卡是一个发射器; A 卡采用的是 SIMD 架构设计,即 Single Instruction Multiple Data (单指令流多数据流),A 卡是将 4 个简单指令+1 个复杂指令打包,再用一个发射器发出。

所以 A/N 两者不能 进行流处理器数量的简单对比。

最后我们要解析的是像素填充率(Pixel Fillrate)和纹理填充率(Texture Fillrate)。

像素填充率是指图形处理单元在每秒内所渲染的像素数量,单位是 GPixel/S(每秒十亿纹理) 像素填充率=核心频率× 光栅单元数目/1000 纹理填充速率是指在多边形每个面上填充的颜色的纹理,单位是 GPixel/S(每秒十亿像素) 纹理填充率=核心频率× 纹理单元数目/1000 这两个参数的值在 GPU-Z 中自然是越大则越能表明显卡所能处理的能力越强悍。

并且核心频率是像素填充率 (Pixel Fillrate)和纹理填充率(Texture Fillrate)的计算因数,显然显卡核心频率越高,这两个值越大。

而其中 的光栅单元数目即 ROPs 的值,ROPs 的值越大,像素填充率也就越大。

显存参数别忘了“位宽兄弟”显存参数别忘了“位宽兄弟”

显存的作用,说通俗点,其实和我们机器内部所使用的内存的作用是几乎相同的。

卖场里的销售人员也经常对 显存这个“卖点”来进行相关“炒作”, 当然不少“小白”也因此上当受骗。

下面显卡帝就来为初级玩家进行相关解析。

GPU-Z 截图关于显存的部分 Memory Type(显存类型), 现如今, 最新的主流高端级显卡都采用的是 GDDR5 的显存颗粒, 之前主流的 GDDR3 显存颗粒也正式退役至二线,而 GDDR4 显存颗粒仅仅是个过渡型产品,市售的显卡所见不多。

GDDR5 相对于 GDDR3 的核心优势在于显存带宽大幅度提升。

显存带宽(Bandwidth)=(显存位宽 × 显存工作频率)/ 8 从上面的计算公司我们可以清楚的看到,由于 GDDR5 显存颗粒具备两条数据总线,所以虽然采用的是和 GDDR3 同样的 8 位预取机制, 但显存的工作频率可以到达 GDDR3 的两倍。

最为典型的一个例子就是: 采用 GDDR5 显存的 GT240 显卡要比采用 GDDR3 显存的 GT240 显卡性能领先 16%左右,所以凭借强大的带宽优势,GDDR5 在同位宽的情况下可以全面超越 GDDR3。

Bus Width(位宽)往往是玩家最容易忽视的一个概念。

显存位宽是显存在一个时钟周期内所能传送数据的位 数,位数越大则瞬间所能传输的数据量越大。

可以说显存位宽对显卡性能的影响相比显存容量而言要大不少。

显卡对阵图 显卡显存位宽的权重到底有多大了,我们从上面这张显卡对阵图中来一起找找答案。

从大部分媒体的测试结果 来分析,我们给上述显卡在性能上进行一个简单的排序。

HD6850 > HD6790 > GTX550Ti > HD5770 我们重点关注下 HD6790 和 GTX550Ti 这两款显卡,虽然说 GTX550Ti 在核心频率和 ROPs 数量上均高于 HD6790, 但是在大部分的测试项目中为何又败下阵来了?首先 HD6790 采用的 HD6850 的缩减核心架构这一点自 然不用说, 其二就在显存位宽上, GTX550Ti 仅为 192Bit 位的显存位宽, 所以显存带宽的处理能力仅为 98.4GB/S, 而 HD6790 则采用的是 256Bit 的显存位宽,显存带宽处理能力达到了 134.4GB/S,相比 GTX550Ti 提升 36.58%。

而为什么 GTX550Ti 相比 HD5770 来说,又能够将 HD5770 全面压制了,其实道理也是一样的。

从显存带宽 (Bandwidth)=(显存位宽 × 显存工作频率)/ 8 这个公式我们也可以看到当都采用 GDDR5 显存颗粒的时候, 显存位宽就成为了影响性能的关键瓶颈。

最后我们需要提醒玩家注意的是显存容量 (Memory Size) 这个最经典的“骗局”, 就是利用 A 卡的 Hyper Memory (HM)或 N 卡的 Turbo Cache(TC)的动态共享系统内存技术来谎称显卡的显存容量,想必这样的招数在进过前些 年的“洗礼”之后,现在的不少消费者也逐渐对这样的雕虫小技都能够很快的精准识别。

显卡频率:核心频率>显存频率显卡频率:核心频率>显存频率 显卡的频率, 我们主要关注的是核心频率和显存频率。

两者相比较而言, 核心频率对显卡性能的影响权重较大。

所以我们玩家在超频的时候先提升的核心频率,再才是显存频率。

为什么说核心频率的重要性更大一些了?打个

比方,核心频率就相当于个人自身能力,而显存频率好比外在条件,而一个人的成功往往取决于个人能力而外在 条件仅在一定程度上对其有影响,简而言之:一个是内因而另一个是外因。

GPU-Z 中关于显卡频率部分的截图 需要说明的是由于核心架构的设计不同, N 卡的 GPU 核心频率和 Shader 频率呈现 2 倍的关系, 而 A 卡的 GPU 核心频率和 Shader 频率是一致的。

显存频率是指默认情况下,该显存在显卡上工作时的频率,以 MHz(兆赫兹)为单位。

GDDR5 显存颗粒 关于 GDDR5 显存频率,由于以往 GDDR1/2/3/4 和 DDR1/2/3 的数据总线都是采用的 DDR 技术(通过差分时钟 在上升沿和下降沿各传输一次数据),官方标称的频率 X2 就是数据传输率,也就是通常我们所说的等效频率。

而 GDDR5 则不同,它有两条数据总线,相当于 Rambus 的 QDR 技术,所以官方标称频率 X4 才是数据传输率。

比 如 GTX590 官方显存频率是 854MHz,而大家习惯称之为 3416MHz。

现在我们已经知道了显卡频率的对显卡性能的影响, 有个问题我们需要提出来讨论一下:显卡频率是不是越高 越好? 从旗舰显卡的频率设定来看,它们的核心频率设定都不是特别高,而且前段时间也爆出:AMD 对 HD6990 因 超频而致使显卡损坏的显卡用户不予质保,同时也有国外媒体在测试 GTX590 显卡的时候所出现的“烧毁”显卡的 现象。

由此可见,高频设定的高端显卡由于 GPU 核心温度的极高无比而致使显卡烧毁这样的一种玩卡方式确实 有些不大妥当。

毕竟玩家还是自己的显卡能够稳定运行。

当然,在中端显卡上我们也可以看到风冷情况下高频设 定的显卡,例如新近推出的 GTX550Ti,1G 核心频率设定的显卡产品也有一些。

高频显卡的意义何在,从另一个 角度去分析:不妨作为一种检测显卡品质的方法,因为能够在高频下运行的显卡需要很好的做工和强劲的显卡散 热器做支持。

其实我们玩家在大部分情况下应用的也就是显卡的默认频率设定,所以高频设定的显卡,我们也很 担心其寿命的长短。

故而我们并不推荐玩家刻意的追求极致高频,除非你是一个狂热的超频玩家。

驱动、交火和其他运算能力驱动、交火和其他运算能力 显卡的性能的表现在有些程度上与显卡驱动存在着一定的关系,因为 GPU 厂商会对显卡做针对性的优化。

所 以我们推荐玩家选择最新版的 WHQL 版驱动来体验你的显卡。

驱动、交火和运算能力 SLI 和 Crossfire 技术提供了多卡互联的技术解决方案。

关于什么样的显卡组建多卡互联系统会显得更具性价比 了?个人建议采用中断显卡组建系统会显的更划算一些,当然资金充裕的话,采用中高端显卡来组建多卡互联系 统也可以,如果采用低端的显卡来组建交火的话,这样就不大太划算,因为可能低端显卡组建的平台性能优势才 仅仅相当于中端卡的能力,而价格却已经超过了单块中端显卡的价钱。

SLI 速力技术平台Crossfire 交叉火力技术平台 最后我们来看看 Computing 计算能力这一项,OpenCL(全称 Open Computing Language,开放运算语言)、 CUDA(通用并行计算架构)、 PhysX(物理加速)和 DirectCompute 5.0 (是一种用于 GPU 通用计算的应用程序接口) 。

AMD HD6990 的相关截图 对比 A 卡,N 卡在 Computing 这项的表现上显得更加出色,N 卡全部支持四项运算能力,而 A 卡仅支持一项 DirectCompute 5.0。

倘若玩家对借助 CUDA 技术实现高清转码或者玩的游戏需要 PhysX 物理加速技术的支持,那 么玩家可以考虑购买 N 卡,因为这些正是 N 卡所强势的地方。

总结:“显卡性能参数排排坐”总结:“显卡性能参数排排坐” 进过了前面详细的介绍与分析,我们对显卡的主要性能参数有了一个相对全面的认识和了解。

玩家在购买显卡 的时候, 可能对这么多性能参数“有点晕”, 所以我们有必要对这些显卡性能参数的权重进行一个高低顺序的排序。

下面是笔者所总结的一个相对简洁的显卡性能排序: ①显卡核心和制程 显卡核心是关键,核心不行其他再好都是浮云,核心先进那么显卡的性能自然会提升一个很大的档次;制程越 先进,显卡的发热量和功耗越低。

②流处理器和 ROPs

流处理器数量上的增加或缩减对显卡的性能影响可谓是立竿见影,所以 GPU 厂商也常常利用这一方法来对显 卡产品进行市场细分。

ROPs 数量的多数影响在游戏画面中的 AA(抗锯齿)和光影特效等方面。

③核心频率和显存频率 核心频率影响的是像素填充速率和纹理填充率,而显存频率影响的是显存带宽,两者同时都作为影响因子,所 以参数值越大,自然显卡性能越强悍。

不过过高的频率设定对显卡自身有一定影响,合理的频率设定是我们所要 选择的显卡。

④像素填充速率和纹理填充率 像素填充率=核心频率× 光栅单元数目/1000 纹理填充率=核心频率× 纹理单元数目/1000 ⑤显存位宽和显存带宽 显存带宽=工作频率× 显存位宽/8(显存带宽 =显存位宽× 显存频率/8/1024) 显存位宽越大,那么瞬间所能传输的数据量越大。

显存带宽的作用好比桥梁一样,为显示核心和显存提供了一 条交换数据的通道。

⑥显存大小和其他参数 显存太小的话会导致在游戏过程中有帧数不稳定的显示。

以上排序作为玩家在购买显卡时分析性价比的几个方面,当然顺序并非完全固定,具体还得需要考虑到玩家自 身对显卡的详细要求。

但是有一点是肯定的,知道这些决定显卡性能的参数,我们玩家在购买显卡或与人谈论显 卡的时候会显得更加专业,让 JS 从此惧怕小白,这就是显卡帝为您写下此文的最终目的。

原文地址 :http://vga.zol.com.cn/227/227885 2_all.h tml