本文从技术方面深度分析了AMD四核Opteron处理器与Intel相应产品Xeon的特性,有惊喜,也有失望,希望以此能明晰AMD的长期前景。
四年以后,尘埃终于落定,AMD在其为工作站和服务器设计的四核CPU中首次实现了K10微架构。不出所料,首次发布的是2GHz和1.9GHz版产品,2.5G将在“11月推出”。
AMD想要战胜Intel的地方其实概括起来只有三个词:
1. Front
2. Side
3. Bus
每一个核都可以单独钟控(AMD的术语:独立动态核技术)。每一个核都可以选择性的将无需工作的部分进行门控时钟处理以节省功耗(Coolcore技术)。核和内存控制器有两个独立的电源层(双动态电源管理)。
每个核专门配备128Kbytes的一级缓存,512Kbyte的二级缓存。四个核共享2Mbytes的三级缓存。
高效交叉开关使得四核都可存取两个72位宽的DDR2-667内存控制器,通过HyperTransport 2.0链路可以与其他CPU交互。
当比较AMD与Intel双核和四核结构时,我的重心在前端总线(FSB)上。Intel CPU(还)不是单管芯的四核设计,相反,它们将两个双核堆叠在一个封装中;它的管芯内不含有内存控制器,相反,DRAM控制器由独立的核逻辑芯片组-北桥芯片提供;而且它们没有专用的CPU间互连通道(至少一年内不会有)。 这一切意味着Intel用来连接管芯与管芯之间,CPU与CPU之间以及CPU与芯片组之间的FSB会承载很多对时序敏感的关键数据。表面上看,这些特性会让Intel处于劣势,但是,考虑以下几点:
Xeon CPU的每一个双核管芯都有两个64Kbyte的一级缓存阵列(一对一),再加上4Mbyte的共享二级缓存,没有三级缓存。与巴塞罗那比较一下缓存的大小和类型,特别是一级对一级,二级对二级(注意一级缓存性能通常优于二级,二级快于三级)。
Xeon5300系列FSB有1066MHz和1333MHz两种,而至今Xeon 7300系列只提供了1066MHz的FSB。AMD最新四核Opteron产品线和之前基于K8微结构的双核处理器还另有两个特征:
芯片的虚拟化支持经扩展后包含有硬件的虚拟-物理地址转换加速器,而之前是速度较慢的软件转换;
AMD加强了每个核的浮点能力,从单指令64比特的FPU升级为双指令128bit的FPU。
首先看虚拟化,注意AMD用先前的3GHz双核CPU与2GHz的四核进行benchmark对比。虽然这并不反映芯片或制程的一个基本问题,但它还是反映出AMD期望四核的后续产品不仅能够从芯片的管脚角度还可以从功耗和热辐射方面做到直接替代。不考虑时钟速度的不同,考虑到新的芯片具有增强的虚拟化硬件异常分支指令和两倍的CPU核数量,在这样的条件下79%的虚拟化性能提升并不算出人意料。
Intel有NetBurst-to-Core微架构,AMD也试图改善功耗,但目前我还没有ACP的对比数据。在比较AMD与Intel的功耗时,要记得Opteron内含DRAM控制器,而Intel的Xeon没有。AMD也继续使用DDR2 SDRAM,而Intel采用Rambus-reminiscent串行接口方案FB-DIMM。有报告称在系统空闲或低负荷时,FB-DIMM比DDR2 SDRAM功耗高,而在系统高负荷时,FB-DIMM在每瓦性能和总功耗方面比较有吸引力。
对比一下AMD先后送给我的两个文档可以有以下发现:
AMD也玩Intel和其OEM伙伴Apple之间的“速度”游戏。"_rate"版的SPECint (整数)和SPECfp (浮点)按照系统中的CPU数目并行跑多个Benchmark程序,在AMD与AMD的SPECint比较中,虽然四核CPU主频有33%的降低,但四核是双核核心的双倍,所以50%的性能提升是再正常不过的。
AMD没有就SPECint做与Intel的比较,重心相应放在了SPECfp和其它浮点相关的测试。这反应出AMD在K8向K10的演进中将重心部分放在了每核的FPU上。
不出所料AMD做了很多核到核、CPU到CPU以及CPU到内存的Benchmark测试,以此来对比竞争对手Intel的共享FSB。
在其中一份文档中AMD做了其高端2GHz CPU与Intel 2.33GHz处理器的Benchmark对比,注意这款Intel产品并不是Xeon 53xx系列最高端的产品。
有些人已经拿到了基于四核Opteron的系统,虽然简短的测试不能说明什么问题,我还是在一些测评中发现了些问题:
四核可相互利用对方二级缓存和共享三级缓存在目前的测试中并没有比需要FSB交互的Intel Xeon系列在性能上有明显优势。部分上这与AMD三级缓存太长导致的延时有关。Intel的总缓存带宽好像也超过了AMD的三级缓存方案。
Intel在整型数性能上似乎还保有优势,同时,AMD加强的FPU在浮点数性能上也没有达到我和其他人的预期;
AMD不再依赖共享的FSB,交叉开关模式和集成的DRAM控制器以及低延时(与FB-DIMM)的DDR2 SDRAM的使用都使得Opteron在“流”类型数据处理上很有优势,因为它们需要不断读取系统主内存。
AMD值得怀疑的四核Opteron性能,加上其竞争性的定价,这都是我长久以来对AMD长期财务健康担心的缘由。
在Intel的大幅降价下,我想AMD会占据中等的市场规模。理想情况下,新结构的发布都会有一个较高的定价,代表着新芯片的附加值和其前期的低产量。但不幸的是,同Intel已经推出9个月的CPU相比,AMD没能提升价格,这样的话四核可以盈利吗?
现在我对AMD接下来几个月的举动比较感兴趣:
AMD会以怎样的速度开始2GHz产品的铺货;
AMD多久可以推出2. 5G以及更高速率的产品;
还会有哪些深层的测试;
AMD多久可以推出针对消费类市场的k10微架构
上一篇:利用直接时钟控制技术实现存储器接口数据采集
下一篇:基于ARM核处理器的机器人手臂控制系统
推荐阅读最新更新时间:2024-05-13 18:38
- NXP 2.5亿美元收购Aviva,但车载SerDes领域依然处于战国时期
- 应对 AI 时代的云工作负载,开发者正加速向 Arm 架构迁移
- 沉浸式体验漫威宇宙,英特尔锐炫显卡为《漫威争锋》提供Day 0支持
- 艾迈斯欧司朗与法雷奥携手革新车辆内饰,打造动态舱内环境
- 《嵌入式-STM32开发指南》第二部分 基础篇 - 第7章DMA(HAL库)
- 【“源”察秋毫系列】DC-DC电源效率测试,确保高效能与可靠性的关键步骤
- NVIDIA 推出高性价比的生成式 AI 超级计算机
- Mapbox与Arm合作推出虚拟主机 加速软件定义汽车导航
- 移植tslib和Qt5.6到三星s5pv210开发板
- 智能座舱新赛点在哪? 看这四款重磅新车