AMD四核处理器巴塞罗那的深度分析

发布者:科技梦行者最新更新时间:2007-09-19 来源: EDN China关键字:动态  缓存  时钟  总线 手机看文章 扫描二维码
随时随地手机看文章

本文从技术方面深度分析了AMD四核Opteron处理器与Intel相应产品Xeon的特性,有惊喜,也有失望,希望以此能明晰AMD的长期前景。

四年以后,尘埃终于落定,AMD在其为工作站和服务器设计的四核CPU中首次实现了K10微架构。不出所料,首次发布的是2GHz和1.9GHz版产品,2.5G将在“11月推出”。

AMD想要战胜Intel的地方其实概括起来只有三个词:

1. Front
2. Side
3. Bus

每一个核都可以单独钟控(AMD的术语:独立动态核技术)。每一个核都可以选择性的将无需工作的部分进行门控时钟处理以节省功耗(Coolcore技术)。核和内存控制器有两个独立的电源层(双动态电源管理)。

每个核专门配备128Kbytes的一级缓存,512Kbyte的二级缓存。四个核共享2Mbytes的三级缓存。

高效交叉开关使得四核都可存取两个72位宽的DDR2-667内存控制器,通过HyperTransport 2.0链路可以与其他CPU交互。

当比较AMD与Intel双核和四核结构时,我的重心在前端总线(FSB)上。Intel CPU(还)不是单管芯的四核设计,相反,它们将两个双核堆叠在一个封装中;它的管芯内不含有内存控制器,相反,DRAM控制器由独立的核逻辑芯片组-北桥芯片提供;而且它们没有专用的CPU间互连通道(至少一年内不会有)。   这一切意味着Intel用来连接管芯与管芯之间,CPU与CPU之间以及CPU与芯片组之间的FSB会承载很多对时序敏感的关键数据。表面上看,这些特性会让Intel处于劣势,但是,考虑以下几点:

Xeon CPU的每一个双核管芯都有两个64Kbyte的一级缓存阵列(一对一),再加上4Mbyte的共享二级缓存,没有三级缓存。与巴塞罗那比较一下缓存的大小和类型,特别是一级对一级,二级对二级(注意一级缓存性能通常优于二级,二级快于三级)。

Xeon5300系列FSB有1066MHz和1333MHz两种,而至今Xeon 7300系列只提供了1066MHz的FSB。AMD最新四核Opteron产品线和之前基于K8微结构的双核处理器还另有两个特征:

芯片的虚拟化支持经扩展后包含有硬件的虚拟-物理地址转换加速器,而之前是速度较慢的软件转换;

AMD加强了每个核的浮点能力,从单指令64比特的FPU升级为双指令128bit的FPU。

首先看虚拟化,注意AMD用先前的3GHz双核CPU与2GHz的四核进行benchmark对比。虽然这并不反映芯片或制程的一个基本问题,但它还是反映出AMD期望四核的后续产品不仅能够从芯片的管脚角度还可以从功耗和热辐射方面做到直接替代。不考虑时钟速度的不同,考虑到新的芯片具有增强的虚拟化硬件异常分支指令和两倍的CPU核数量,在这样的条件下79%的虚拟化性能提升并不算出人意料。

Intel有NetBurst-to-Core微架构,AMD也试图改善功耗,但目前我还没有ACP的对比数据。在比较AMD与Intel的功耗时,要记得Opteron内含DRAM控制器,而Intel的Xeon没有。AMD也继续使用DDR2 SDRAM,而Intel采用Rambus-reminiscent串行接口方案FB-DIMM。有报告称在系统空闲或低负荷时,FB-DIMM比DDR2 SDRAM功耗高,而在系统高负荷时,FB-DIMM在每瓦性能和总功耗方面比较有吸引力。

对比一下AMD先后送给我的两个文档可以有以下发现:

AMD也玩Intel和其OEM伙伴Apple之间的“速度”游戏。"_rate"版的SPECint (整数)和SPECfp (浮点)按照系统中的CPU数目并行跑多个Benchmark程序,在AMD与AMD的SPECint比较中,虽然四核CPU主频有33%的降低,但四核是双核核心的双倍,所以50%的性能提升是再正常不过的。

AMD没有就SPECint做与Intel的比较,重心相应放在了SPECfp和其它浮点相关的测试。这反应出AMD在K8向K10的演进中将重心部分放在了每核的FPU上。

不出所料AMD做了很多核到核、CPU到CPU以及CPU到内存的Benchmark测试,以此来对比竞争对手Intel的共享FSB。

在其中一份文档中AMD做了其高端2GHz CPU与Intel 2.33GHz处理器的Benchmark对比,注意这款Intel产品并不是Xeon 53xx系列最高端的产品。

有些人已经拿到了基于四核Opteron的系统,虽然简短的测试不能说明什么问题,我还是在一些测评中发现了些问题:

四核可相互利用对方二级缓存和共享三级缓存在目前的测试中并没有比需要FSB交互的Intel Xeon系列在性能上有明显优势。部分上这与AMD三级缓存太长导致的延时有关。Intel的总缓存带宽好像也超过了AMD的三级缓存方案。

Intel在整型数性能上似乎还保有优势,同时,AMD加强的FPU在浮点数性能上也没有达到我和其他人的预期;

AMD不再依赖共享的FSB,交叉开关模式和集成的DRAM控制器以及低延时(与FB-DIMM)的DDR2 SDRAM的使用都使得Opteron在“流”类型数据处理上很有优势,因为它们需要不断读取系统主内存。

AMD值得怀疑的四核Opteron性能,加上其竞争性的定价,这都是我长久以来对AMD长期财务健康担心的缘由。

在Intel的大幅降价下,我想AMD会占据中等的市场规模。理想情况下,新结构的发布都会有一个较高的定价,代表着新芯片的附加值和其前期的低产量。但不幸的是,同Intel已经推出9个月的CPU相比,AMD没能提升价格,这样的话四核可以盈利吗?

现在我对AMD接下来几个月的举动比较感兴趣:

AMD会以怎样的速度开始2GHz产品的铺货;
AMD多久可以推出2. 5G以及更高速率的产品;
还会有哪些深层的测试;
AMD多久可以推出针对消费类市场的k10微架构

关键字:动态  缓存  时钟  总线 引用地址:AMD四核处理器巴塞罗那的深度分析

上一篇:利用直接时钟控制技术实现存储器接口数据采集
下一篇:基于ARM核处理器的机器人手臂控制系统

推荐阅读最新更新时间:2024-05-13 18:38

STM32系统时钟树分析
下面是一个STM32芯片的时钟树图 1、LSI是低速内部时钟,RC振荡器,频率为32kHz左右。供独立看门狗和自动唤醒单元使用。 2、LSE是低速外部时钟,接频率为32.768kHz的石英晶体。这个主要是RTC的时钟源。 3、HSE是高速外部时钟,课接石英/陶瓷谐振器,或者接外部时钟源,频率范围为4MHz~26MHz。我们开发板接的是8M的晶振。HSE也可以直接作为系统时钟或者PLL输入。 4、HSI是高速内部时钟,RC振荡器,频率为16MHz。可以直接作为系统时钟或者用作PLL输入。 5、PLL为锁相环倍频输出。STM32F4有两个PLL: (1)主PLL由HSE或者HSI提供时钟信号,并具有两个不同的输出时钟。 第一个输出P
[单片机]
STM32系统<font color='red'>时钟</font>树分析
基于CAN 总线的电动汽车电源管理通信设计
电动汽车的电源管理方案,涉及到了发动机、电动机、蓄电池的工作状况、车辆行驶速度、行驶阻力以及驾驶员的操作等诸多参数,利用CAN总线技术,把以上参数的测控装置连接起来,是实现电动汽车的电源管理的关键步骤,本文主要论述了基于CAN 总线的电动汽车电源管理中的通信系统设计与实现技术。 随着石油价格的上涨以及环保要求的提高,电动已经成为是未来汽车发展的一个重要方向。对于以电池供电的全电动力系统或者以发动机和蓄电池混合动力系统而言,电源管理系统设计是关系车辆性能的一个重要因素,设计时需要考虑综合车辆总体设计方案和外部使用环境,为了节约电源,还需要设计一定的控制策略保证电源的最佳利用。所以很有必要对全电车辆的电源管理系统进行深入探讨。
[单片机]
基于CAN <font color='red'>总线</font>的电动汽车电源管理通信设计
STM32 SysTick滴答时钟分析
利用系统sysTick()时钟产生延时函数Delay_ms()的分析 SysTick 定时器, SysTick 是一个 24 位的倒计数定时器,当计数到 0 时,将从 RELOAD 寄存器中自动重装载定时初值,开始新一轮计数。只要不把它在 SysTick 控制及状态寄存器中的使能位清除,就永不停息。 sysTick时钟来自系统时钟的8倍频。 一般作用于操作系统的节拍,此处我们可以依据此定时器作为延时函数。 /** * @brief Inserts a delay time. * @param nTime: specifies the delay time length, in milliseconds. * @retval
[单片机]
新能源汽车动态无线充电或替代大型的电池组
     据电子工程专辑网报道,Strategy Analytics(全球著名的信息技术,通信行业和消费科技市场研究机构)发布最新研究报告《汽车厂商混合动力车和电动车战略:强制减排法规将提升需求》。分析指出,限制有害气体排放和进一步提升燃油经济性的长期提案,及对跟真实驾驶条件很吻合的驾驶测试周期的审核,可能会迫使汽车厂商提升汽车电气化程度。     虽然汽车厂商们在可承受的范围内一直在提升内燃机的效率,使之能够顺应短期和中期的法规要求,但新提案要求更高程度的提升效率,这将迫使一些汽车厂商采取新的战略以顺应法规。此外,还有一些提案关注在市中心打造低排放区域,以及进一步降低氮氧化合物和颗粒物排放,这会对与之相背的柴油动力系统产生影
[汽车电子]
AT89C52单片机实现日历时钟芯片DS12C887显示的设计
在银行或者其他的公共场合中,经常会看到显示实时信息的显示屏,其中包括年、月、日、星期、时间等,本例子的功能是在51单片机系统中设置、获取、记录实时的日历时钟信息并通过数码管显示,选用日历时钟芯片DS12C887作为实时时钟芯片,为系统提供详细的时间信息,次款芯片内部有锂电池,可以带掉电的情况下保存10年以上。 主要器件: 1、 AT89C52单片机芯片,用于对时钟芯片的控制和初始化,并控制数码管显示。 2、 日历时钟芯片DS12C887。 试验流程图; 试验电路图: 试验程序代码: //CalendarClk.h程序 #ifndef _CALENDARCLK_H // 防止CalendarClk.h被重复引用 #def
[单片机]
AT89C52单片机实现日历<font color='red'>时钟</font>芯片DS12C887显示的设计
浅谈现场总线控制系统在水处理系统中的应用
1 引言     现场总线是指安装在制造或过程区域的现场装置与控制室内的自动装置之间的数字式、串行、多点通信的数据总线。简单说,现场总线就是以数字通信替代了传统4-20mA模拟信号及普通开关量信号的传输。   现场总线的技术基础是一种全数字化、双向、多站的通信系统,是应用于各种计算机控制领域的工业总线,因现场总线潜在着巨大的商机,世界范围内的各大公司投入相当大的人力、物力、财力来进行开发研究。当今现场总线技术一直是国际上各大公司激烈竞争的领域,由于现场总线技术的不断创新,过程控制系统由第四代的DCS发展至今的FCS(Fieldbus Control System)系统,已被称为第五代过程控制系统。而FCS和DCS的真正区别
[嵌入式]
深入分析本土测试测量企业的现状和挑战
测试测量 和仪器产业,是国防装备必须的保障,也是研发前沿科技的利器,同时更是任何电子技术都避不开的一个重要环节。然而,无论从国防还是民用需求,我们接触到的测试系统以及测试仪器,在高性能应用上无一例外都是进口品牌。 据统计,测试仪器产业所占电子工业的产值大约只有不足2%,而电子工业的产值不过占世界总产值的2%左右,但依靠测试仪器拉动的新技术带来的附加价值却可以占70%-75%的全世界每年新增的价值。作为一种应用遍及基础研究到生产线的基础性产品和技术,电子测试仪器行业的强大,完全可以拉动一个国家创新带动的新增价值。 作为一个高技术、资本密集、横跨多个学科并且强调多年技术积累的行业,我们在测试仪器方面与国外企业的差距是全方位
[测试测量]
基金会现场总线FF技术在焦炉计算机控制系统的应用
•  项目概述      (一)、 项目背景   天津市第二煤气厂炼焦车间是全厂生产的核心和经济效益、社会效益的重要来源,其生产自动化程度和管理、调度水平直接关系到每一炉气、每一炉焦的生产和质量。炼焦车间有三座焦炉,一、二号炉是八十年代初期建造的,生产参数的监测和控制系统的调节采用的全部是模拟仪表, 90年一、二号炉采用BITBUS采集站,在车间级、厂级调度系统中只实现了监测,但随着科学技术的发展,原系统已不能更好地满足生产需要,随着计算机技术的发展,系统的硬件也已被更新换代,维护非常困难。而90年建造的三号焦炉,采用的则是DCS系统,只对三号炉实行了监控,相对一、二号炉是一个独立系统。随着生产的发展,越来越迫切地需要对一
[嵌入式]
小广播
最新应用文章

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 安防电子 医疗电子 工业控制

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved