CPU基本参数知识详解

 时间:2012-07-16 05:24:20 贡献者:红彤彤的笑1019

导读:CPU 基本参数知识详解在电子技术中,脉冲信号是一个按一定电压幅度,一定时间间隔 连续发出的脉冲信号。脉冲信号之间的时间间隔称为周期;而将在单 位时间(如 1 秒)内所产生的脉冲

CPU基本参数知识详解
CPU基本参数知识详解

CPU 基本参数知识详解在电子技术中,脉冲信号是一个按一定电压幅度,一定时间间隔 连续发出的脉冲信号。

脉冲信号之间的时间间隔称为周期;而将在单 位时间(如 1 秒)内所产生的脉冲个数称为频率。

频率是描述周期性 循环信号(包括脉冲信号)在单位时间内所出现的脉冲数量多少的计 量名称;频率的标准计量单位是 Hz(赫)。

电脑中的系统时钟就是 一个典型的频率相当精确和稳定的脉冲信号发生器。

频率在数学表达 式中用“f”表示,其相应的单位有:Hz(赫)、kHz(千赫)、MHz (兆赫)、GHz(吉赫)。

其中 1GHz=1000MHz,1MHz=1000kHz, 1kHz=1000Hz。

计算脉冲信号周期的时间单位及相应的换算关系是:s (秒)、ms(毫秒)、μ s(微秒)、ns(纳秒),其中:1s=1000ms, 1 ms=1000μ s,1μ s=1000ns。

CPU 的主频,即 CPU 内核工作的时钟频率(CPU Clock Speed)。

通常所说的某某 CPU 是多少兆赫的,而这个多少兆赫就是“CPU 的主 频”。

很多人认为 CPU 的主频就是其运行速度,其实不然。

CPU 的主 频表示在 CPU 内数字脉冲信号震荡的速度, CPU 实际的运算能力并 与 没有直接关系。

主频和实际的运算速度存在一定的关系,但目前还没 有一个确定的公式能够定量两者的数值关系, 因为 CPU 的运算速度还 要看 CPU 的流水线的各方面的性能指标(缓存、指令集,CPU 的位数 等等)。

由于主频并不直接代表运算速度,所以在一定情况下,很可

能会出现主频较高的 CPU 实际运算速度较低的现象。

比如 AMD 公司的 AthlonXP 系列 CPU 大多都能已较低的主频,达到英特尔公司的 Pentium 4 系列 CPU 较高主频的 CPU 性能,所以 AthlonXP 系列 CPU 才以 PR 值的方式来命名。

因此主频仅是 CPU 性能表现的一个方面, 而不代表 CPU 的整体性能。

CPU 的主频不代表 CPU 的速度,但提高主频对于提高 CPU 运算速 度却是至关重要的。

举个例子来说,假设某个 CPU 在一个时钟周期内 执行一条运算指令,那么当 CPU 运行在 100MHz 主频时,将比它运行 在 50MHz 主频时速度快一倍。

因为 100MHz 的时钟周期比 50MHz 的时 钟周期占用时间减少了一半,也就是工作在 100MHz 主频的 CPU 执行 一条运算指令所需时间仅为 10ns 比工作在 50MHz 主频时的 20ns 缩短 了一半,自然运算速度也就快了一倍。

只不过电脑的整体运行速度不 仅取决于 CPU 运算速度,还与其它各分系统的运行情况有关,只有在 提高主频的同时, 各分系统运行速度和各分系统之间的数据传输速度 都能得到提高后,电脑整体的运行速度才能真正得到提高。

提高 CPU 工作主频主要受到生产工艺的限制。

由于 CPU 是在半导 体硅片上制造的,在硅片上的元件之间需要导线进行联接,由于在高 频状态下要求导线越细越短越好, 这样才能减小导线分布电容等杂散 干扰以保证 CPU 运算正确。

因此制造工艺的限制,是 CPU 主频发展的 最大障碍之一。

什么是总线? 微机中总线一般有内部总线、系统总线和外部总线。

内部总线是微机 内部各外围芯片与处理器之间的总线,用于芯片一级的互连;而系统 总线是微机中各插件板与系统板之间的总线,用于插件板一级的互 连;外部总线则是微机和外部设备之间的总线,微机作为一种设备, 通过该总线和其他设备进行信息与数据交换,它用于设备一级的互 连。

什么是前端总线:“前端总线”这个名称是由 AMD 在推出 K7 CPU 时 提出的概念, 但是一直以来都被大家误认为这个名词不过是外频的另 一个名称。

我们所说的外频指的是 CPU 与主板连接的速度,这个概念 是建立在数字脉冲信号震荡速度基础之上的, 而前端总线的速度指的 是数据传输的速度, 由于数据传输最大带宽取决于所有同时传输的数 据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)÷8。

目前 PC 机上所能达到的前端总线频率有 266MHz、333MHz、400MHz、 533MHz、800MHz、1066MHz、1333MHz 几种,前端总线频率越大,代 表着 CPU 与内存之间的数据传输量越大, 更能充分发挥出 CPU 的功能。

现在的 CPU 技术发展很快,运算速度提高很快,而足够大的前端总线 可以保障有足够的数据供给给 CPU。

较低的前端总线将无法供给足够 的数据给 CPU,这样就限制了 CPU 性能得发挥,成为系统瓶颈。

前端总线的英文名字是 Front Side Bus,通常用 FSB 表示,是将 CPU 连接到北桥芯片的总线。

选购主板和 CPU 时,要注意两者搭配问题, 一般来说,如果 CPU 不超频,那么前端总线是由 CPU 决定的,如果主 板不支持 CPU 所需要的前端总线,系统就无法工作。

也就是说,需要 主板和 CPU 都支持某个前端总线,系统才能工作,只不过一个 CPU 默 认的前端总线是唯一的, 因此看一个系统的前端总线主要看 CPU 就可 以。

北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,并和南桥芯 片连接。

CPU 就是通过前端总线(FSB)连接到北桥芯片,进而通过 北桥芯片和内存、显卡交换数据。

前端总线是 CPU 和外界交换数据的 最主要通道, 因此前端总线的数据传输能力对计算机整体性能作用很 大,如果没足够快的前端总线,再强的 CPU 也不能明显提高计算机整 体速度。

数据传输最大带宽取决于所有同时传输的数据的宽度和传输 频率,即数据带宽=(总线频率×数据位宽)÷8。

目前 PC 机上所能 达到的前端总线频率有 266MHz、333MHz、400MHz、533MHz、800MHz 几种,前端总线频率越大,代表着 CPU 与北桥芯片之间的数据传输能 力越大,更能充分发挥出 CPU 的功能。

现在的 CPU 技术发展很快,运 算速度提高很快, 而足够大的前端总线可以保障有足够的数据供给给 CPU,较低的前端总线将无法供给足够的数据给 CPU,这样就限制了 CPU 性能得发挥,成为系统瓶颈。

显然同等条件下,前端总线越快, 系统性能越好。

外频与前端总线频率的区别:前端总线的速度指的是数据传输的速 度,外频是 CPU 与主板之间同步运行的速度。

也就是说,100MHz 外 频特指数字脉冲信号在每秒钟震荡一千万次;而 100MHz 前端总线指 的是每秒钟 CPU 可接受的数据传输量是 100MHz×64bit=6400Mbit/s=800MByte/s(1Byte=8bit)。

二级缓存CPU 缓存(Cache Memoney)位于 CPU 与内存之间的临时存储器,它 的容量比内存小但交换速度快。

在缓存中的数据是内存中的一小部 分,但这一小部分是短时间内 CPU 即将访问的,当 CPU 调用大量数据 时, 就可避开内存直接从缓存中调用, 从而加快读取速度。

由此可见, 在 CPU 中加入缓存是一种高效的解决方案,这样整个内存储器(缓存 +内存)就变成了既有缓存的高速度,又有内存的大容量的存储系统 了。

缓存对 CPU 的性能影响很大,主要是因为 CPU 的数据交换顺序和 CPU 与缓存间的带宽引起的。

缓存的工作原理是当 CPU 要读取一个数据时,首先从缓存中查 找,如果找到就立即读取并送给 CPU 处理;如果没有找到,就用相对 慢的速度从内存中读取并送给 CPU 处理, 同时把这个数据所在的数据 块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不

必再调用内存。

正是这样的读取机制使 CPU 读取缓存的命中率非常高(大多数 CPU 可达 90%左右),也就是说 CPU 下一次要读取的数据 90%都在缓 存中,只有大约 10%需要从内存读取。

这大大节省了 CPU 直接读取内 存的时间,也使 CPU 读取数据时基本无需等待。

总的来说,CPU 读取 数据的顺序是先缓存后内存。

最早先的 CPU 缓存是个整体的,而且容量很低,英特尔公司从 Pentium 时代开始把缓存进行了分类。

当时集成在 CPU 内核中的缓存 已不足以满足 CPU 的需求, 而制造工艺上的限制又不能大幅度提高缓 存的容量。

因此出现了集成在与 CPU 同一块电路板上或主板上的缓 存,此时就把 CPU 内核集成的缓存称为一级缓存,而外部的称为二 级缓存。

一级缓存中还分数据缓存 (I-Cache) 和指令缓存 (D-Cache) 。

二者分别用来存放数据和执行这些数据的指令, 而且两者可以同时被 CPU 访问,减少了争用 Cache 所造成的冲突,提高了处理器效能。

英 特尔公司在推出 Pentium 4 处理器时,还新增了一种一级追踪缓存, 容量为 12KB.随着 CPU 制造工艺的发展, 二级缓存也能轻易的集成在 CPU 内核 中,容量也在逐年提升。

现在再用集成在 CPU 内部与否来定义一、二 级缓存,已不确切。

而且随着二级缓存被集成入 CPU 内核中,以往二

级缓存与 CPU 大差距分频的情况也被改变, 此时其以相同于主频的速 度工作,可以为 CPU 提供更高的传输速度。

二级缓存是 CPU 性能表现的关键之一, CPU 核心不变化的情况 在 下,增加二级缓存容量能使性能大幅度提高。

而同一核心的 CPU 高低 端之分往往也是在二级缓存上有差异, 由此可见二级缓存对于 CPU 的 重要性。

CPU 在缓存中找到有用的数据被称为命中,当缓存中没有 CPU 所 需的数据时(这时称为未命中),CPU 才访问内存。

从理论上讲,在 一颗拥有二级缓存的 CPU 中,读取一级缓存的命中率为 80%。

也就是 说 CPU 一级缓存中找到的有用数据占数据总量的 80%,剩下的 20%从 二级缓存中读取。

由于不能准确预测将要执行的数据,读取二级缓存 的命中率也在 80%左右(从二级缓存读到有用的数据占总数据的 16%)。

那么还有的数据就不得不从内存调用,但这已经是一个相当 小的比例了。

目前的较高端的 CPU 中,还会带有三级缓存,它是为读 取二级缓存后未命中的数据设计的—种缓存,在拥有三级缓存的 CPU 中,只有约 5%的数据需要从内存中调用,这进一步提高了 CPU 的效 率。

为了保证 CPU 访问时有较高的命中率, 缓存中的内容应该按一定 的算法替换。

一种较常用的算法是“最近最少使用算法” (LRU 算法) ,

它是将最近一段时间内最少被访问过的行淘汰出局。

因此需要为每行 设置一个计数器,LRU 算法是把命中行的计数器清零,其他各行计数 器加 1。

当需要替换时淘汰行计数器计数值最大的数据行出局。

这是 一种高效、科学的算法,其计数器清零过程可以把一些频繁调用后再 不需要的数据淘汰出缓存,提高缓存的利用率。

CPU 产品中,一级缓存的容量基本在 4KB 到 18KB 之间,二级缓 存的容量则分为 128KB、256KB、512KB、1MB 等。

一级缓存容量各产 品之间相差不大,而二级缓存容量则是提高 CPU 性能的关键。

二级缓 存容量的提升是由 CPU 制造工艺所决定的, 容量增大必然导致 CPU 内 部晶体管数的增加,要在有限的 CPU 面积上集成更大的缓存,对制造 工艺的要求也就越高。

双核心 CPU 的二级缓存比较特殊,和以前的单核心 CPU 相比,最 重要的就是两个内核的缓存所保存的数据要保持一致, 否则就会出现 错误,为了解决这个问题不同的 CPU 使用了不同的办法:Intel 双核心处理器的二级缓存 目前 Intel 的双核心 CPU 主要有 Pentium D、Pentium EE、Core Duo 三种,其中 Pentium D、Pentium EE 的二级缓存方式完全相同。

Pentium D 和 Pentium EE 的二级缓存都是 CPU 内部两个内核具有互 相独立的二级缓存,其中,8xx 系列的 Smithfield 核心 CPU 为每核

心 1MB,而 9xx 系列的 Presler 核心 CPU 为每核心 2MB。

这种 CPU 内 部的两个内核之间的缓存数据同步是依靠位于主板北桥芯片上的仲 裁单元通过前端总线在两个核心之间传输来实现的, 所以其数据延迟 问题比较严重,性能并不尽如人意。

Core Duo 使用的核心为 Yonah,它的二级缓存则是两个核心共享 2MB 的二级缓存,共享式的二级缓存配合 Intel 的“Smart cache” 共享缓存技术,实现了真正意义上的缓存数据同步,大幅度降低了数 据延迟,减少了对前端总线的占用,性能表现不错,是目前双核心处 理器上最先进的二级缓存架构。

今后 Intel 的双核心处理器的二级缓 存都会采用这种两个内核共享二级缓存的“Smart cache”共享缓存 技术。

AMD 双核心处理器的二级缓存 Athlon 64 X2 CPU 的核心主要有 Manchester 和 Toledo 两种, 他们的二级缓存都是 CPU 内部两个内核具有互相独立的二级缓存, 其 中,Manchester 核心为每核心 512KB,而 Toledo 核心为每核心 1MB。

处理器内部的两个内核之间的缓存数据同步是依靠 CPU 内置的 System Request Interface(系统请求接口,SRI)控制,传输在 CPU 内部即可实现。

这样一来,不但 CPU 资源占用很小,而且不必占用内 存总线资源,数据延迟也比 Intel 的 Smithfield 核心和 Presler 核 心大为减少,协作效率明显胜过这两种核心。

不过,由于这种方式仍 然是两个内核的缓存相互独立, 从架构上来看也明显不如以 Yonah 核

心为代表的 Intel 的共享缓存技术 Smart Cache。

CPU 封装技术 所谓“CPU 封装技术”是一种将集成电路用绝缘的塑料或陶瓷材 料打包的技术。

以 CPU 为例,我们实际看到的体积和外观并不是真正 的 CPU 内核的大小和面貌,而是 CPU 内核等元件经过封装后的产品。

CPU 封装对于芯片来说是必须的,也是至关重要的。

因为芯片必 须与外界隔离, 以防止空气中的杂质对芯片电路的腐蚀而造成电气性 能下降。

另一方面,封装后的芯片也更便于安装和运输。

由于封装技 术的好坏还直接影响到芯片自身性能的发挥和与之连接的 PCB(印制 电路板)的设计和制造,因此它是至关重要的。

封装也可以说是指安 装半导体集成电路芯片用的外壳,它不仅起着安放、固定、密封、保 护芯片和增强导热性能的作用, 而且还是沟通芯片内部世界与外部电 路的桥梁——芯片上的接点用导线连接到封装外壳的引脚上, 这些引 脚又通过印刷电路板上的导线与其他器件建立连接。

因此,对于很多 集成电路产品而言,封装技术都是非常关键的一环。

目前采用的 CPU 封装多是用绝缘的塑料或陶瓷材料包装起来, 能

起着密封和提高芯片电热性能的作用。

由于现在处理器芯片的内频越 来越高, 功能越来越强, 引脚数越来越多, 封装的外形也不断在改变。

封装时主要考虑的因素:芯片面积与封装面积之比为提高封装效率,尽量接近 1:1 引脚要尽量短以减少延迟,引脚间的距离尽量远,以保证互不干扰, 提高性能 基于散热的要求,封装越薄越好 作为计算机的重要组成部分,CPU 的性能直接影响计算机的整体 性能。

CPU 制造工艺的最后一步也是最关键一步就是 CPU 的封装技 而 术,采用不同封装技术的 CPU,在性能上存在较大差距。

只有高品质 的封装技术才能生产出完美的 CPU 产品。

CPU 芯片的封装技术:DIP 封装DIP 封装(Dual In-line Package),也叫双列直插式封装技术, 指采用双列直插形式封装的集成电路芯片, 绝大多数中小规模集成电 路均采用这种封装形式,其引脚数一般不超过 100。

DIP 封装的 CPU 芯片有两排引脚,需要插入到具有 DIP 结构的芯片插座上。

当然,也 可以直接插在有相同焊孔数和几何排列的电路板上进行焊接。

DIP 封

装的芯片在从芯片插座上插拔时应特别小心,以免损坏管脚。

DIP 封 装结构形式有:多层陶瓷双列直插式 DIP,单层陶瓷双列直插式 DIP, 引线框架式 DIP(含玻璃陶瓷封接式,塑料包封结构式,陶瓷低熔玻 璃封装式)等。

DIP 封装具有以下特点: 1.适合在 PCB(印刷电路板)上穿孔焊接,操作方便。

2.芯片面积与封装面积之间的比值较大,故体积也较大。

最早的 4004、8008、8086、8088 等 CPU 都采用了 DIP 封装,通 过其上的两排引脚可插到主板上的插槽或焊接在主板上。

QFP 封装这种技术的中文含义叫方型扁平式封装技术 (Plastic Quad Flat Pockage),该技术实现的 CPU 芯片引脚之间距离很小,管脚很细, 一般大规模或超大规模集成电路采用这种封装形式, 其引脚数一般都 在 100 以上。

该技术封装 CPU 时操作方便,可靠性高;而且其封装外 形尺寸较小,寄生参数减小,适合高频应用;该技术主要适合用 SMT 表面安装技术在 PCB 上安装布线。

QFP 封装 这种技术的中文含义叫方型扁平式封装技术 (Plastic Quad Flat Pockage),该技术实现的 CPU 芯片引脚之间距离很小,管脚很细,

一般大规模或超大规模集成电路采用这种封装形式, 其引脚数一般都 在 100 以上。

该技术封装 CPU 时操作方便,可靠性高;而且其封装外 形尺寸较小,寄生参数减小,适合高频应用;该技术主要适合用 SMT 表面安装技术在 PCB 上安装布线。

PFP 封装该技术的英文全称为 Plastic Flat Package,中文含义为塑料 扁平组件式封装。

用这种技术封装的芯片同样也必须采用 SMD 技术将 芯片与主板焊接起来。

采用 SMD 安装的芯片不必在主板上打孔,一般 在主板表面上有设计好的相应管脚的焊盘。

将芯片各脚对准相应的焊 盘,即可实现与主板的焊接。

用这种方法焊上去的芯片,如果不用专 用工具是很难拆卸下来的。

该技术与上面的 QFP 技术基本相似,只是 外观的封装形状不同而已。

PGA 封装该技术也叫插针网格阵列封装技术(Ceramic Pin Grid Arrau Package),由这种技术封装的芯片内外有多个方阵形的插针,每个 方阵形插针沿芯片的四周间隔一定距离排列,根据管脚数目的多少, 可以围成 2~5 圈。

安装时,将芯片插入专门的 PGA 插座。

为了使得 CPU 能够更方便的安装和拆卸, 486 芯片开始, 从 出现了一种 ZIF CPU

插座,专门用来满足 PGA 封装的 CPU 在安装和拆卸上的要求。

该技术 一般用于插拔操作比较频繁的场合之下。

BGA 封装BGA 技术(Ball Grid Array Package)即球栅阵列封装技术。

该技术的出现便成为 CPU、主板南、北桥芯片等高密度、高性能、多 引脚封装的最佳选择。

但 BGA 封装占用基板的面积比较大。

虽然该技 术的 I/O 引脚数增多,但引脚之间的距离远大于 QFP,从而提高了组 装成品率。

而且该技术采用了可控塌陷芯片法焊接,从而可以改善它 的电热性能。

另外该技术的组装可用共面焊接,从而能大大提高封装 的可靠性;并且由该技术实现的封装 CPU 信号传输延迟小,适应频率 可以提高很大。

BGA 封装具有以下特点:1.I/O 引脚数虽然增多,但引脚之间的距离远大于 QFP 封装方式,提 高了成品率 2.虽然 BGA 的功耗增加,但由于采用的是可控塌陷芯片法焊接,从而 可以改善电热性能 3.信号传输延迟小,适应频率大大提高 4.组装可用共面焊接,可靠性大大提高

目前较为常见的封装形式:OPGA 封装 OPGA(Organic pin grid Array,有机管脚阵列)。

这种封装的 基底使用的是玻璃纤维,类似印刷电路板上的材料。

此种封装方式 可以降低阻抗和封装成本。

OPGA 封装拉近了外部电容和处理器内核 的距离,可以更好地改善内核供电和过滤电流杂波。

AMD 公司的 AthlonXP 系列 CPU 大多使用此类封装。

mPGA 封装 mPGA,微型 PGA 封装,目前只有 AMD 公司的 Athlon 64 和英特尔 公司的 Xeon(至强)系列 CPU 等少数产品所采用,而且多是些高端 产品,是种先进的封装形式。

CPGA 封装 CPGA 也就是常说的陶瓷封装,全称为 Ceramic PGA。

主要在 Thunderbird(雷鸟)核心和“Palomino”核心的 Athlon 处理器上采 用。

FC-PGA 封装 FC-PGA 封装是反转芯片针脚栅格阵列的缩写,这种封装中有

针脚插入插座。

这些芯片被反转,以至片模或构成计算机芯片的处理 器部分被暴露在处理器的上部。

通过将片模暴露出来,使热量解决方 案可直接用到片模上,这样就能实现更有效的芯片冷却。

为了通过隔 绝电源信号和接地信号来提高封装的性能,FC-PGA 处理器在处理器 的底部的电容放置区域(处理器中心)安有离散电容和电阻。

芯片底 部的针脚是锯齿形排列的。

此外,针脚的安排方式使得处理器只能以 一种方式插入插座。

FC-PGA 封装用于奔腾 III 和英特尔 赛扬 处理 器,它们都使用 370 针。

FC-PGA2 封装 FC-PGA2 封装与 FC-PGA 封装类型很相似, 除了这些处理器还具 有集成式散热器 (IHS)。

集成式散热器是在生产时直接安装到处理器 片上的。

由于 IHS 与片模有很好的热接触并且提供了更大的表面积 以更好地发散热量,所以它显著地增加了热传导。

FC-PGA2 封装用于 奔腾 III 和英特尔赛扬处理器 (370 针) 和奔腾 4 处理器 (478 针) 。

OOI 封装 OOI 是 OLGA 的简写。

OLGA 代表了基板栅格阵列。

OLGA 芯片也 使用反转芯片设计,其中处理器朝下附在基体上,实现更好的信号完 整性、更有效的散热和更低的自感应。

OOI 有一个集成式导热器 (IHS),能帮助散热器将热量传给正确安装的风扇散热器。

OOI 用于 奔腾 4 处理器,这些处理器有 423 针。

PPGA 封装 “PPGA”的英文全称为“Plastic Pin Grid Array”,是塑针栅格 阵列的缩写,这些处理器具有插入插座的针脚。

为了提高热传导性, PPGA 在处理器的顶部使用了镀镍铜质散热器。

芯片底部的针脚是锯 齿形排列的。

此外,针脚的安排方式使得处理器只能以一种方式插入 插座。

S.E.C.C.封装 “S.E.C.C.”是“Single Edge Contact Cartridge”缩写,是 单边接触卡盒的缩写。

为了与主板连接,处理器被插入一个插槽。

它 不使用针脚,而是使用“金手指”触点,处理器使用这些触点来传递 信号。

S.E.C.C. 被一个金属壳覆盖,这个壳覆盖了整个卡盒组件的 顶端。

卡盒的背面是一个热材料镀层,充当了散热器。

S.E.C.C. 内 部,大多数处理器有一个被称为基体的印刷电路板连接起处理器、二 级高速缓存和总线终止电路。

S.E.C.C. 封装用于有 242 个触点的英 特尔奔腾 II 处理器和有 330 个触点的奔腾 II 至强和奔腾 III 至 强处理器。

S.E.C.C.2 封装 S.E.C.C.2 封装与 S.E.C.C. 封装相似,除了 S.E.C.C.2 使 用更少的保护性包装并且不含有导热镀层。

S.E.C.C.2 封装用于一些

较晚版本的奔腾 II 处理器和奔腾 III 处理器(242 触点)。

S.E.P.封装 “S.E.P.”是“Single Edge Processor”的缩写,是单边处理器 的缩写。

“S.E.P.”封装类似于“S.E.C.C.”或者“S.E.C.C.2”封 装,也是采用单边插入到 Slot 插槽中,以金手指与插槽接触,但是 它没有全包装外壳,底板电路从处理器底部是可见的。

“S.E.P.”封 装应用于早期的 242 根金手指的 Intel Celeron 处理器。

PLGA 封装 PLGA 是 Plastic Land Grid Array 的缩写,即塑料焊盘栅格阵 列封装。

由于没有使用针脚,而是使用了细小的点式接口,所以 PLGA 封装明显比以前的 FC-PGA2 等封装具有更小的体积、 更少的信号传输 损失和更低的生产成本,可以有效提升处理器的信号强度、提升处理 器频率,同时也可以提高处理器生产的良品率、降低生产成本。

目前 Intel 公司 Socket 775 接口的 CPU 采用了此封装。

CuPGA 封装CuPGA 是 Lidded Ceramic Package Grid Array 的缩写,即有盖陶瓷栅格阵列封装。

其与普通陶瓷封装最大的区别是增加 了一个顶盖,能提供更好的散热性能以及能保护 CPU 核心免受损坏。

目前 AMD64 系列 CPU 采用了此封装。

“CPU 适用类型”是指该处理器 所适用的应用类型,针对不同用户的不同需求、不同应用范围,CPU

被设计成各不相同的类型,即分为嵌入式和通用式、微控制式。

嵌入 式 CPU 主要用于运行面向特定领域的专用程序,配备轻量级操作系 统,其应用极其广泛,像移动电话、DVD、机顶盒等都是使用嵌入式 CPU。

微控制式 CPU 主要用于汽车空调、自动机械等自控设备领域。

而通用式 CPU 追求高性能,主要用于高性能个人计算机系统(即 PC 台式机)、服务器(工作站)以及笔记本三种。

台式机的 CPU,就是平常大部分场合所提到的应用于 PC 的 CPU, 平常所说 Intel 的奔腾 4、赛扬、AMD 的 AthlonXP 等等都属于此类 CPU。

应用于服务器和工作站上的 CPU,因其针对的应用范围,所以此 类 CPU 在稳定性、处理速度、同时处理任务的数量等方面的要求都要 高于单机 CPU。

其中服务器(工作站)CPU 的高可靠性是普通 CPU 所 无法比拟的,因为大多数的服务器都要满足每天 24 小时、每周 7 天 的满符合工作要求。

由于服务器(工作站)数据处理量很大,需要采 用多 CPU 并行处理结构,即一台服务器中安装 2、4、8 等多个 CPU, 需要注意的是, 并行结构需要的 CPU 必须为偶数个。

对于服务器而言, 多处理器可用于数据库处理等高负荷高速度应用;而对于工作站,多 处理器系统则可以用于三维图形制作和动画文件编码等单处理器无 法实现的高处理速度应用。

另外许多 CPU 的新技术都是率先开发应用 于服务器(工作站)CPU 中。

在最早期的 CPU 设计中并没有单独的笔记本 CPU,均采用与台式 机的 CPU,后来随着笔记本电脑的散热和体积成为发展的瓶颈时,才 逐渐生产出笔记本专用 CPU。

受笔记本内部空间、散热和电池容量的 限制, 笔记本 CPU 在外观尺寸、 功耗 (耗电量) 方面都有很高的要求。

笔记本电池性能是十分重要的性能,CPU 的功耗大小对电池使用时间 有着最直接的影响, 所以为了降低功耗笔记本处理器中都包含有一些 节能技术。

在无线网络将要获得更多应用的现在,笔记本 CPU 还增加 了一些定制的针对无线通信的功能。

服务器 CPU 和笔记本 CPU 都包含有各自独特的专有技术, 都是为 了更好的在各自的工作条件下发挥出更好的性能。

比如服务器的多 CPU 并行处理,以及多核多线程技术;笔记本 CPU 的 SpeedStep(可 自动调整工作频率及电压)节能技术。

封装方式三者也有不同之处, 笔记本 CPU 是三者中最小最薄的一 种,因为笔记本处理器的体积需要更小,耐高温的性能要更佳,因此 在制造工艺上要求也就更高。

三者在稳定性中以服务器 CPU 最强, 因为其设计时就要求有极低 的错误率,部分产品甚至要求全年满负荷工作,故障时间不能超过 5 分钟。

台式机 CPU 工作电压和功耗都高于笔记本 CPU,通常台式机 CPU 的测试温度上限为 75 摄氏度,超过 75 摄氏度,工作就会不稳定,甚 至出现问题;;而笔记本 CPU 的测试温度上限为 100 摄氏度;服务器 CPU 需要长时间的稳定工作,在散热方面的要求就更高了。

在选购整机尤其是有特定功能的计算机(如笔记本、服务器等) 时,需要注意 CPU 的适用类型,选用不适合的 CPU 类型,一方面会影 响整机的系统性能,另一方面会加大计算机的维护成本。

单独选购 CPU 时候也要注意 CPU 的适用类型,建议按照具体应用的需求来购买 CPU。

倍频CPU 的倍频,全称是倍频系数。

CPU 的核心工作频率与外频之间存在 着一个比值关系,这个比值就是倍频系数,简称倍频。

理论上倍频是 从 1.5 一直到无限的,但需要注意的是,倍频是以以 0.5 为一个间隔 单位。

外频与倍频相乘就是主频,所以其中任何一项提高都可以使 CPU 的主频上升。

原先并没有倍频概念,CPU 的主频和系统总线的速度是一样的, 但 CPU 的速度越来越快,倍频技术也就应允而生。

它可使系统总线工 作在相对较低的频率上,而 CPU 速度可以通过倍频来无限提升。

那么

CPU 主频的计算方式变为: 主频 = 外频 x 倍频。

也就是倍频是指 CPU 和系统总线之间相差的倍数,当外频不变时,提高倍频,CPU 主频也 就越高。

多媒体指令集CPU 依靠指令来计算和控制系统,每款 CPU 在设计时就规定了一系列 与其硬件电路相配合的指令系统。

指令的强弱也是 CPU 的重要指标, 指令集是提高微处理器效率的最有效工具之一。

从现阶段的主流体系 结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运 用看,如 Intel 的 MMX(Multi Media Extended)、SSE、 SSE2 (Streaming-Single instruction multiple data-Extensions 2) 和 AMD 的 3DNow!等都是 CPU 的扩展指令集,分别增强了 CPU 的多媒 体、图形图象和 Internet 等的处理能力。

我们通常会把 CPU 的扩展 指令集称为"CPU 的指令集"。

1、精简指令集的运用在最初发明计算机的数十年里,随着计算机功能日趋增大,性能 日趋变强,内部元器件也越来越多,指令集日趋复杂,过于冗杂的指 令严重的影响了计算机的工作效率。

后来经过研究发现, 在计算机中, 80%程序只用到了 20%的指令集,基于这一发现,RISC 精简指令集

被提了出来,这是计算机系统架构的一次深刻革命。

RISC 体系结构 的基本思路是:抓住 CISC 指令系统指令种类太多、指令格式不规范、 寻址方式太多的缺点,通过减少指令种类、规范指令格式和简化寻址 方式,方便处理器内部的并行处理,提高 VLSI 器件的使用效率,从 而大幅度地提高处理器的性能。

RISC 指令集有许多特征,其中最重要的有:指令种类少,指令格式规范:RISC 指令集通常只使用一种或少数几 种格式。

指令长度单一(一般 4 个字节),并且在字边界上对齐,字 段位置、特别是操作码的位置是固定的。

寻址方式简化:几乎所有指令都使用寄存器寻址方式,寻址方式总数 一般不超过 5 个。

其他更为复杂的寻址方式,如间接寻址等则由软件 利用简单的寻址方式来合成。

大量利用寄存器间操作:RISC 指令集中大多数操作都是寄存器到寄 存器操作,只以简单的 Load 和 Store 操作访问内存。

因此,每条指 令中访问的内存地址不会超过 1 个, 访问内存的操作不会与算术操作 混在一起。

简化处理器结构:使用 RISC 指令集,可以大大简化处理器的控制器 和其他功能单元的设计,不必使用大量专用寄存器,特别是允许以硬 件线路来实现指令操作,而不必像 CISC 处理器那样使用微程序来实 现指令操作。

因此 RISC 处理器不必像 CISC 处理器那样设置微程序控

制存储器,就能够快速地直接执行指令。

便于使用 VLSI 技术:随着 LSI 和 VLSI 技术的发展,整个处理器(甚 至多个处理器)都可以放在一个芯片上。

RISC 体系结构可以给设计 单芯片处理器带来很多好处,有利于提高性能,简化 VLSI 芯片的设 计和实现。

基于 VLSI 技术,制造 RISC 处理器要比 CISC 处理器工作 量小得多,成本也低得多。

加强了处理器并行能力:RISC 指令集能够非常有效地适合于采用流 水线、超流水线和超标量技术,从而实现指令级并行操作,提高处理 器的性能。

目前常用的处理器内部并行操作技术基本上是基于 RISC 体系结构发展和走向成熟的。

正由于 RISC 体系所具有的优势,它在高端系统得到了广泛的应 用,而 CISC 体系则在桌面系统中占据统治地位。

而在如今,在桌面 领域,RISC 也不断渗透,预计未来,RISC 将要一统江湖。

2、CPU 的扩展指令集对于 CPU 来说,在基本功能方面,它们的差别并不太大,基本的 指令集也都差不多,但是许多厂家为了提升某一方面性能,又开发了 扩展指令集,扩展指令集定义了新的数据和指令,能够大大提高某方 面数据处理能力,但必需要有软件支持。

MMX 指令集

MMX(Multi Media eXtension,多媒体扩展指令集)指令集是 Intel 公司于 1996 年推出的一项多媒体指令增强技术。

指令集中 MMX 包括有 57 条多媒体指令,通过这些指令可以一次处理多个数据,在 处理结果超过实际处理能力的时候也能进行正常处理, 这样在软件的 配合下,就可以得到更高的性能。

MMX 的益处在于,当时存在的操作 系统不必为此而做出任何修改便可以轻松地执行 MMX 程序。

但是,问 题也比较明显, 那就是 MMX 指令集与 x87 浮点运算指令不能够同时执 行,必须做密集式的交错切换才可以正常执行,这种情况就势必造成 整个系统运行质量的下降。

SSE 指令集 SSE(Streaming SIMD Extensions,单指令多数据流扩展)指令 集是 Intel 在 Pentium III 处理器中率先推出的。

其实,早在 PIII 正式推出之前,Intel 公司就曾经通过各种渠道公布过所谓的 KNI (Katmai New Instruction)指令集,这个指令集也就是 SSE 指令集 的前身, 并一度被很多传媒称之为 MMX 指令集的下一个版本, MMX2 即 指令集。

究其背景,原来"KNI"指令集是 Intel 公司最早为其下一代 芯片命名的指令集名称, 而所谓的"MMX2"则完全是硬件评论家们和媒 体凭感觉和印象对"KNI"的 评价,Intel 公司从未正式发布过关于 MMX2 的消息。

而最终推出的 SSE 指令集也就是所谓胜出的"互联网 SSE"指令

集。

SSE 指令集包括了 70 条指令,其中包含提高 3D 图形运算效率的 50 条 SIMD(单指令多数据技术)浮点运算指令、12 条 MMX 整数运算 增强指令、8 条优化内存中连续数据块传输指令。

理论上这些指令对 目前流行的图像处理、浮点运算、3D 运算、视频处理、音频处理等 诸多多媒体应用起到全面强化的作用。

指令与 3DNow!指令彼此互 SSE 不兼容,但 SSE 包含了 3DNow!技术的绝大部分功能,只是实现的方 法不同。

SSE 兼容 MMX 指令,它可以通过 SIMD 和单时钟周期并行处 理多个浮点数据来有效地提高浮点运算速度。

SSE2 指令集 SSE2(Streaming SIMD Extensions 2,Intel 官方称为 SIMD 流 技术扩展 2 或数据流单指令多数据扩展指令集 2)指令集是 Intel 公 司在 SSE 指令集的基础上发展起来的。

相比于 SSE,SSE2 使用了 144 个新增指令,扩展了 MMX 技术和 SSE 技术,这些指令提高了广大应用 程序的运行性能。

MMX 技术引进的 SIMD 整数指令从 64 位扩展到了 随 128 位,使 SIMD 整数类型操作的有效执行率成倍提高。

双倍精度浮 点 SIMD 指令允许以 SIMD 格式同时执行两个浮点操作,提供双倍精 度操作支持有助于加速内容创建、财务、工程和科学应用。

除 SSE2 指令之外,最初的 SSE 指令也得到增强,通过支持多种数据类型(例 如,双字和四字)的算术运算,支持灵活并且动态范围更广的计算功 能。

SSE2 指令可让软件开发员极其灵活的实施算法,并在运行诸如 MPEG-2、MP3、3D 图形等之类的软件时增强性能。

Intel 是从

Willamette 核心的 Pentium 4 开始支持 SSE2 指令集的,而 AMD 则是 从 K8 架构的 SledgeHammer 核心的 Opteron 开始才支持 SSE2 指令集 的。

SSE3 指令集 SSE3(Streaming SIMD Extensions 3,Intel 官方称为 SIMD 流 技术扩展 3 或数据流单指令多数据扩展指令集 3)指令集是 Intel 公 司在 SSE2 指令集的基础上发展起来的。

相比于 SSE2,SSE3 在 SSE2 的基础上又增加了 13 个额外的 SIMD 指令。

SSE3 中 13 个新指令的主 要目的是改进线程同步和特定应用程序领域,例如媒体和游戏。

这些 新增指令强化了处理器在浮点转换至整数、 复杂算法、 视频编码、 SIMD 浮点寄存器操作以及线程同步等五个方面的表现, 最终达到提升多媒 体和游戏性能的目的。

Intel 是从 Prescott 核心的 Pentium 4 开始 支持 SSE3 指令集的, AMD 则是从 2005 年下半年 Troy 核心的 Opteron 而 开始才支持 SSE3 的。

但是需要注意的是, 所支持的 SSE3 与 Intel AMD 的 SSE3 并不完全相同,主要是删除了针对 Intel 超线程技术优化的 部分指令。

3D Now!(3D no waiting)指令集 3DNow!是 AMD 公司开发的 SIMD 指令集,可以增强浮点和多媒体 运算的速度,并被 AMD 广泛应用于其 K6-2 、K6-3 以及 Athlon(K7) 处理器上。

3DNow!指令集技术其实就是 21 条机器码的扩展指令集。

与 Intel 公司的 MMX 技术侧重于整数运算有所不同, 3DNow!指令 集主要针对三维建模、坐标变换 和效果渲染等三维应用场合,在软 件的配合下,可以大幅度提高 3D 处理性能。

后来在 Athlon 上开发了 Enhanced 3DNow!。

这些 AMD 标准的 SIMD 指令和 Intel 的 SSE 具有相 同效能。

因为受到 Intel 在商业上以及 Pentium III 成功的影响,软 件在支持 SSE 上比起 3DNow!更为普遍。

Enhanced 3DNow!AMD 公司继 续增加至 52 个指令,包含了一些 SSE 码,因而在针对 SSE 做最佳化 的软件中能获得更好的效能。

 
 

微信扫一扫 关注一点知道
微信提问题 答案马上自动回复