显卡参数详解

 时间:2019-03-25  贡献者:yuzongjuan7810

导读:桌面版nvidia rtx2080ti/2080/2070显卡参数解析,显卡参数详解关于显卡的性能参数,有许多硬件检测软件可以对显卡的硬件信息进行详 细的检测,比如:Everest,GPU-Z,GPU-Shark 等。这里我们以玩家最常用的 GPU-Z 软件来作为本文解析

桌面版nvidia rtx2080ti/2080/2070显卡参数解析
桌面版nvidia rtx2080ti/2080/2070显卡参数解析

显卡参数详解关于显卡的性能参数,有许多硬件检测软件可以对显卡的硬件信息进行详 细的检测,比如:Everest,GPU-Z,GPU-Shark 等。

这里我们以玩家最常用的 GPU-Z 软件来作为本文解析显卡性能参数的示例软件。

GTX590 的 GPU-Z 截图 首先我们对 GPU-Z 这款软件的界面进行一个大致分区的解读,从上至下共 8 个分区,其中每个分区的具体含义是: ①.显卡名称部分: 名称/Name:此处显示的是显卡的名称,也就是显卡型号。

②.显示芯片型号部分: 核心代号/GPU:此处显示 GPU 芯片的代号,如上图所示的:GF110、 Antilles 等。

修订版本/Revision:此处显示 GPU 芯片的步进制程编号。

制造工艺/Technology:此处显示 GPU 芯片的制程工艺,如 55nm、40nm 等。

核心面积/Die Size:此处显示 GPU 芯片的核心尺寸。

③.显卡的硬件信息部分: BIOS 版本/BIOS Version:此处显示显卡 BIOS 的版本号。

设备 ID/Device ID:此处显示设备的 ID 码。

制造厂商/Subvendor:此处显示该显卡 OEM 制造厂商的名称。

④.显示芯片参数部分:

光栅操作单元/ROPs:此处显示 GPU 拥有的 ROP 光栅操作处理单元的数量。

总线接口/Bus Interface:此处显示显卡和主板北桥芯片之间的总线接口 类型以及接口速度。

着色单元/Shaders:此处显示 GPU 拥有的着色器的数量。

DirectX 版本/DirectX Support:此处显示 GPU 所支持的 DirectX 版本。

像素填充率/Pixel Fillrate:此处显示 GPU 的像素填充率。

纹理填充率/Texture Fillrate:此处显示 GPU 的纹理填充率。

⑤.显存信息部分: 显存类型/Memory Type:此处显示显卡所采用的显存类型,如:GDDR3、 GDDR5 等。

显存位宽/Bus Width:此处显示 GPU 与显存之间连接的带宽。

显存容量/Memory Size:此处显示显卡板载的物理显存容量。

显存带宽/Bandwidth:此处显示 GPU-Z 与显存之间的数据传输速度。

⑥.驱动部分: 驱动程序版本/Driver Version:此处为系统内当前使用的显卡驱动的版本 号。

⑦.显卡频率部分: 核心频率/GPU Clock:显示 GPU 当前的运行频率。

内存/Memory:显示显存当前的运行频率。

Shader/Shader:显示着色单元当前的运行频率。

默认核心频率/Default Clock:显示 GPU 默认的运行频率。

(默认)内存/Memory:显示显存默认的运行频率。

(默认)Shader/Shader:显示着色单元默认的运行频率。

⑧交火和运算能力部分: NVIDIA SLI 或 ATI Crossfire:显示是否开启 SLI 或者 Crossfire 多显卡 交火。

运算能力:显示是否具备 OpenCL、CUDA、PhysX 和 DirectCompute 5.0 运 算能力。

显卡名称、芯片型号以及硬件信息 消费者在购买显卡的时候首先应该明确的就是我该购买的显卡的型号(名称) 是什么,也就是 GPU-Z 中的 Name 所示的参数信息,例如本例中的"GTX590"。

显卡 GPU-Z 截图中关于显卡名称、芯片型号和硬件信息的部分 而通过显卡芯片型号的解读,我们又可以对显卡核心 GPU 的信息作进一步 的了解。

从 GPU 这一项我们能够得知显卡核心的 GPU 研发代号。

GPU 的代号一 般来说往往是与显卡型号名称相对应,举例来说: GF110 对应:NVIDIA GeForce GTX590 GF100 对应:NVIDIA GeForce GTX480 Antilles 对应:Radeon HD 6990 RV870 对应:Radeon HD 5970 当然也有一个 GPU 代号对应多个显卡型号名称的,而这些往往是 JS 忽悠小 白的地方。

例如: 基于 GF104 核心的显卡同时有 NVIDIA GeForce GTX 460(768MB)、NVIDIA GeForce GTX 460(1024MB)和 NVIDIA GeForce GTX 460SE 共三款产品,如果消 费者对这些显卡不大熟悉的话,很容量被商家所误导而购买被"换型"的显卡产 品。

同型号的三款 GTX460 的不同区别

从上面的对比图中我们可以很清楚的看到 768MB 和 1024MB 版的 GTX460 主 要在显存容量和显存带宽上有很大区别,而 GTX460SE 的区别主要在于 CUDA 处 理器缩减至了 288 个。

有同一 GPU 代号对应多款显卡型号,自然也有同个显卡型号对应多个 GPU 代号,例如:Radeon HD5670。

HD5670 的两种版本 从上图我们可以看到两者的区别主要在于核心 GPU、流处理器数量以及核 心面积,虽然同为 HD5670,但是 640SP 的 HD5670 性能已经几乎接近 HD5750 的 程度。

通过上面的总结得知,我们玩家在选购显卡的时候一定要弄明白自己所要 购买的显卡型号和显卡 GPU 核心代号具体是什么,购买的时候最好当场对显卡 进行简单的上机测试,用 GPU-Z 等相关测试软件看下显卡的硬件信息是否有异 常情况,这样玩家就可以尽可能的降低上当受骗的几率。

显卡芯片参数解析:悟透 ROPs 这一部分是我们所要重点解读的内容,因为不少初玩显卡的朋友或者老玩 家对这些性能参数的都不是特别清晰,下面就让我们来一起进行详尽的解读。

显卡芯片参数部分 首先一个重要的概念就是 ROPs(Raster Operations Units),即光栅化处 理单元,表示显示 GPU 拥有的 ROP 光栅操作处理单元的数量。

通常来说:3D 图 形处理可以分成四个主要步骤,几何处理、设置、纹理和光栅处理,而 ROPs 就 是处理光栅单元。

那么光栅化处理单元的多少对显卡性能有哪些影响了? ROPs(光栅化处理单元)主要负责游戏中的光线和反射运算,兼顾 AA、高分 辨率、烟雾、火焰等效果。

游戏里的 AA(抗锯齿)和光影效果越厉害,对 ROPs(光 栅化处理单元)的性能要求也就越高,否则就可能导致游戏帧数急剧下降.比如同 样是某个游戏的最高画质效果,8 个光栅单元的显卡可能只能跑 25 帧.而 16 个 光栅单元的显卡则可以稳定在 35 帧以上。

举一个例子:GTX550Ti 和 HD6790 前

者是 24 个 ROPs 单元,后者是 16 个 ROPs 单元,虽然在大部分测试项目中, HD6790 都是领先 GTX550Ti 的,但是在高 AA(抗锯齿)负载的情况下,HD6790 的 弱点即刻暴露出来,16 个 ROPs 单元显得有点力不从心。

从 FarCry 2 中也印证 出了这一点:游戏中 4xAA 设置下 HD 6790 的落后幅度为 4%左右,而开启 8xAA 后性能落后幅度则扩大至 15-17%之多。

需要注意的是,AMD 显卡和 NVIDIA 显卡在 ROPs 的设计上是有区别的,N 卡 的 ROPs 单元和流处理器是"捆绑"的,即置于 SIMD 之内,所以倘若消减 N 卡的 流处理数量,其 ROPs 单元也随之消减;而 A 卡则不一样,其 ROPs 单元和流处 理器单元是没有关联的。

传统管线架构 第二个重要的概念:Shaders。

传统管线架构:以往显卡由顶点渲染管线和 像素渲染管线组成,生成图像的过程都是先由顶点渲染管线中的 Vertex Shader(顶点着色器)生成基础的几何图形骨架(由三角形构成),然后再由像素 渲染管线中的 Pixel Shader(像素着色器)进行填色,最后才是像素渲染管线中 的纹理单元进行贴图。

而当新的统一渲染架构提出之后,顶点着色器和像素着 色器被合二为一,成为流处理器(Shaders),它将同时负责顶点着色和像素着色, 避免了负载不均衡的情况发生。

最先提出统一渲染架构的是微软的 DirectX 10。

步入 DX10 时代,shader 单元数量成为衡量显卡级别的重要参数之一 需要说明的是,N 卡和 A 卡的所采取的核心架构是不一样的,N 卡采用的是 MIMD 架构。

多指令流多数据流 (MultipleInstructionStreamMultipleDataStream,简称 MIMD),它使用多个 控制器来异步地控制多个处理器,从而实现空间上的并行性,所以 N 卡是一个 发射器;A 卡采用的是 SIMD 架构设计,即 Single Instruction Multiple Data(单指令流多数据流),A 卡是将 4 个简单指令+1 个复杂指令打包,再用一 个发射器发出。

所以 A/N 两者不能进行流处理器数量的简单对比。

最后我们要解析的是像素填充率(Pixel Fillrate)和纹理填充率(Texture Fillrate)。

像素填充率是指图形处理单元在每秒内所渲染的像素数量,单位是 GPixel/S(每秒十亿纹理) 像素填充率=核心频率×光栅单元数目/1000 纹理填充速率是指在多边形每个面上填充的颜色的纹理,单位是 GPixel/S(每秒十亿像素) 纹理填充率=核心频率×纹理单元数目/1000 这两个参数的值在 GPU-Z 中自然是越大则越能表明显卡所能处理的能力越 强悍。

并且核心频率是像素填充率(Pixel Fillrate)和纹理填充率(Texture Fillrate)的计算因数,显然显卡核心频率越高,这两个值越大。

而其中的光栅 单元数目即 ROPs 的值,ROPs 的值越大,像素填充率也就越大。

显存参数别忘了"位宽兄弟" 显存的作用,说通俗点,其实和我们机器内部所使用的内存的作用是几乎 相同的。

卖场里的销售人员也经常对显存这个"卖点"来进行相关"炒作",当然 不少"小白"也因此上当受骗。

下面显卡帝就来为初级玩家进行相关解析。

GPU-Z 截图关于显存的部分 Memory Type(显存类型),现如今,最新的主流高端级显卡都采用的是 GDDR5 的显存颗粒,之前主流的 GDDR3 显存颗粒也正式退役至二线,而 GDDR4 显存颗粒仅仅是个过渡型产品,市售的显卡所见不多。

GDDR5 相对于 GDDR3 的 核心优势在于显存带宽大幅度提升。

显存带宽(Bandwidth)=(显存位宽×显存工作频率)/8 从上面的计算公司我们可以清楚的看到,由于 GDDR5 显存颗粒具备两条数 据总线,所以虽然采用的是和 GDDR3 同样的 8 位预取机制,但显存的工作频率 可以到达 GDDR3 的两倍。

最为典型的一个例子就是:采用 GDDR5 显存的 GT240 显卡要比采用 GDDR3 显存的 GT240 显卡性能领先 16%左右,所以凭借强大的带 宽优势,GDDR5 在同位宽的情况下可以全面超越 GDDR3。

Bus Width(位宽)往往是玩家最容易忽视的一个概念。

显存位宽是显存在一 个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大。

可以说显存位宽对显卡性能的影响相比显存容量而言要大不少。

显卡对阵图 显卡显存位宽的权重到底有多大了,我们从上面这张显卡对阵图中来一起 找找答案。

从大部分媒体的测试结果来分析,我们给上述显卡在性能上进行一 个简单的排序。

HD6850 HD6790 GTX550Ti HD5770 我们重点关注下 HD6790 和 GTX550Ti 这两款显卡,虽然说 GTX550Ti 在核心 频率和 ROPs 数量上均高于 HD6790,但是在大部分的测试项目中为何又败下阵 来了?首先 HD6790 采用的 HD6850 的缩减核心架构这一点自然不用说,其二就在 显存位宽上,GTX550Ti 仅为 192Bit 位的显存位宽,所以显存带宽的处理能力 仅为 98.4GB/S,而 HD6790 则采用的是 256Bit 的显存位宽,显存带宽处理能力 达到了 134.4GB/S,相比 GTX550Ti 提升 36.58%。

而为什么 GTX550Ti 相比 HD5770 来说,又能够将 HD5770 全面压制了,其实道理也是一样的。

从显存带 宽(Bandwidth)=(显存位宽×显存工作频率)/8 这个公式我们也可以看到当都采 用 GDDR5 显存颗粒的时候,显存位宽就成为了影响性能的关键瓶颈。

最后我们需要提醒玩家注意的是显存容量(Memory Size)这个最经典的"骗 局",就是利用 A 卡的 Hyper Memory(HM)或 N 卡的 Turbo Cache(TC)的动态共享 系统内存技术来谎称显卡的显存容量,想必这样的招数在进过前些年的"洗礼" 之后,现在的不少消费者也逐渐对这样的雕虫小技都能够很快的精准识别。

显卡频率:核心频率显存频率 显卡的频率,我们主要关注的是核心频率和显存频率。

两者相比较而言, 核心频率对显卡性能的影响权重较大。

所以我们玩家在超频的时候先提升的核 心频率,再才是显存频率。

为什么说核心频率的重要性更大一些了?打个比方, 核心频率就相当于个人自身能力,而显存频率好比外在条件,而一个人的成功

往往取决于个人能力而外在条件仅在一定程度上对其有影响,简而言之:一个 是内因而另一个是外因。

GPU-Z 中关于显卡频率部分的截图 需要说明的是由于核心架构的设计不同,N 卡的 GPU 核心频率和 Shader 频 率呈现 2 倍的关系,而 A 卡的 GPU 核心频率和 Shader 频率是一致的。

显存频率是指默认情况下,该显存在显卡上工作时的频率,以 MHz(兆赫兹) 为单位。

GDDR5 显存颗粒 关于 GDDR5 显存频率,由于以往 GDDR1/2/3/4 和 DDR1/2/3 的数据总线都是 采用的 DDR 技术(通过差分时钟在上升沿和下降沿各传输一次数据),官方标称 的频率 X2 就是数据传输率,也就是通常我们所说的等效频率。

而 GDDR5 则不同, 它有两条数据总线,相当于 Rambus 的 QDR 技术,所以官方标称频率 X4 才是数 据传输率。

比如 GTX590 官方显存频率是 854MHz,而大家习惯称之为 3416MHz。

现在我们已经知道了显卡频率的对显卡性能的影响,有个问题我们需要提 出来讨论一下:显卡频率是不是越高越好? 从旗舰显卡的频率设定来看,它们的核心频率设定都不是特别高,而且前 段时间也爆出:AMD 对 HD6990 因超频而致使显卡损坏的显卡用户不予质保,同 时也有国外媒体在测试 GTX590 显卡的时候所出现的"烧毁"显卡的现象。

由此可 见,高频设定的高端显卡由于 GPU 核心温度的极高无比而致使显卡烧毁这样的 一种玩卡方式确实有些不大妥当。

毕竟玩家还是自己的显卡能够稳定运行。

当 然,在中端显卡上我们也可以看到风冷情况下高频设定的显卡,例如新近推出 的 GTX550Ti,1G 核心频率设定的显卡产品也有一些。

高频显卡的意义何在,从 另一个角度去分析:不妨作为一种检测显卡品质的方法,因为能够在高频下运 行的显卡需要很好的做工和强劲的显卡散热器做支持。

其实我们玩家在大部分 情况下应用的也就是显卡的默认频率设定,所以高频设定的显卡,我们也很担 心其寿命的长短。

故而我们并不推荐玩家刻意的追求极致高频,除非你是一个 狂热的超频玩家。

驱动、交火和其他运算能力 显卡的性能的表现在有些程度上与显卡驱动存在着一定的关系,因为 GPU 厂商会对显卡做针对性的优化。

所以我们推荐玩家选择最新版的 WHQL 版驱动来 体验你的显卡。

驱动、交火和运算能力 SLI 和 Crossfire 技术提供了多卡互联的技术解决方案。

关于什么样的显 卡组建多卡互联系统会显得更具性价比了?个人建议采用中断显卡组建系统会显 的更划算一些,当然资金充裕的话,采用中高端显卡来组建多卡互联系统也可 以,如果采用低端的显卡来组建交火的话,这样就不大太划算,因为可能低端 显卡组建的平台性能优势才仅仅相当于中端卡的能力,而价格却已经超过了单 块中端显卡的价钱。

SLI 速力技术平台 Crossfire 交叉火力技术平台 最后我们来看看 Computing 计算能力这一项,OpenCL(全称 Open Computing Language,开放运算语言)、CUDA(通用并行计算架构)、PhysX(物理 加速)和 DirectCompute 5.0(是一种用于 GPU 通用计算的应用程序接口)。

AMD HD6990 的相关截图 对比 A 卡,N 卡在 Computing 这项的表现上显得更加出色,N 卡全部支持四 项运算能力,而 A 卡仅支持一项 DirectCompute 5.0。

倘若玩家对借助 CUDA 技 术实现高清转码或者玩的游戏需要 PhysX 物理加速技术的支持,那么玩家可以 考虑购买 N 卡,因为这些正是 N 卡所强势的地方。

总结 进过了前面详细的介绍与分析,我们对显卡的主要性能参数有了一个相对 全面的认识和了解。

玩家在购买显卡的时候,可能对这么多性能参数 "有点晕",

所以我们有必要对这些显卡性能参数的权重进行一个高低顺序的排序。

下面是 笔者所总结的一个相对简洁的显卡性能排序: ①显卡核心和制程 显卡核心是关键,核心不行其他再好都是浮云,核心先进那么显卡的性能 自然会提升一个很大的档次;制程越先进,显卡的发热量和功耗越低。

②流处理器和 ROPs 流处理器数量上的增加或缩减对显卡的性能影响可谓是立竿见影,所以 GPU 厂商也常常利用这一方法来对显卡产品进行市场细分。

ROPs 数量的多数影 响在游戏画面中的 AA(抗锯齿)和光影特效等方面。

③核心频率和显存频率 核心频率影响的是像素填充速率和纹理填充率,而显存频率影响的是显存 带宽,两者同时都作为影响因子,所以参数值越大,自然显卡性能越强悍。

不 过过高的频率设定对显卡自身有一定影响,合理的频率设定是我们所要选择的 显卡。

④像素填充速率和纹理填充率 像素填充率=核心频率×光栅单元数目/1000 纹理填充率=核心频率×纹理单元数目/1000 ⑤显存位宽和显存带宽 显存带宽=工作频率×显存位宽/8(显存带宽=显存位宽×显存频率/8/1024) 显存位宽越大,那么瞬间所能传输的数据量越大。

显存带宽的作用好比桥 梁一样,为显示核心和显存提供了一条交换数据的通道。

⑥显存大小和其他参数 显存太小的话会导致在游戏过程中有帧数不稳定的显示。

引用于在此通告特别声明:1:资料来源于互联网,版权归属原作者 2:资料内容属于网络意见,与本账号立场无关 3:如有侵权,请告知,立即删除。