|

- UID
- 107645
- 帖子
- 595
- i贡献值
- 4 点
- We用劵
- 0 张
- 注册时间
- 2006-3-15
- 最后登录
- 2009-7-2
|
1#
发表于 2008-4-8 16:39
| 只看该作者
本文主要参考资料是RWT(realworldtech)网站的文章,我自己翻译过来。另外,对于参考资料有矛盾的地方,尽量以这次上海IDF的英文PPT为准(感谢坛友itany提供)。由于写得匆忙,水平有限,错误难免。对于文中有错误的地方,谢谢各位提出指正,也欢迎各位补充有更新的资料。欢迎大家进行技术讨论。
该文属于自娱自乐,严禁转载用于商业目的。
下文中介绍的Nehalem的技术指标主要是以Nehalem-EP(Gainestown)为范例来介绍的,该核心将会用于Xeon DP,就是用于服务器的双路CPU。Nehalem是4核心、8线程、64bit、4超标量发射、乱序执行的CPU,有16级流水线、48bit虚拟寻址和40bit物理寻址。
简单说来,Nehalem还是基本建立在Core微架构(Core Microarchitecture)的骨架上,外加增添了SMT、3层Cache、TLB和分支预测的等级化、IMC、QPI和支持DDR3等技术。比起从Pentium 4的NetBurst架构到Core 微架构的较大变化来说,从Core 微架到Nehalem架构的基本核心部分的变化则要小一些,因为Nehalem还是4指令宽度的解码/重命名/撤销。
Nehalem的核心部分比Core 微架构新增加的功能主要有以下几方面:
New SSE4.2 Instructions (新增加SSE4.2指令)
Improved Lock Support
(改进的锁定支持)
Additional Caching Hierarchy (新的缓存层次体系)
Deeper Buffers (更深的缓冲)
Improved Loop Streaming (改进的循环流)
Simultaneous Multi-Threading (同步多线程)
Faster Virtualization (更快的虚拟化)
Better Branch Prediction (更好的分支预测)
一、QPI总线技术
Nehalem使用的QPI总线是基于数据包传输(packet-based)、高带宽、低延迟的点到点互连技术(point to point interconnect),速度达到6.4GT/s(每秒可以传输6.4G次数据)。每一条连接(link)是20bit位宽的接口,使用高速的差分信号(differential signaling)和专用的时钟通道(dedicated clock lane),这些时钟通道具有失效备援(failover)。QPI数据包是80bit的长度,发送需要用4个周期。尽管数据包是80bit,但只有64bit是用于数据,其它的数据位则是用于流量控制、CRC和其它一些目的。这样,每条连接就一次传输16bit(2Byte)的数据,其余的位宽则是用于CRC。由于QPI总线可以双向传输,那么一条QPI总线连接理论最大值就可以达到25.6GB/s(2×2B×6.4GT/s)的数据传送。单向则是12.8GB/s。
对于不同市场的Nehalem,可以具有不同的QPI总线条数。比如桌面市场的CPU,具有1条或者半条QPI总线(半条可能是指单向?);DP服务器(双CPU插座)的CPU,每个具有2条QPI总线;而MP服务器(4个或8个CPU插座)的,则每个具有4条或更多的QPI总线。 |
-
1
评分次数
-
|