AMD四核处理器巴塞罗那的深度分析

发布者:数字梦想最新更新时间:2007-09-19 来源: EDN China关键字:动态  缓存  时钟  总线 手机看文章 扫描二维码
随时随地手机看文章

本文从技术方面深度分析了AMD四核Opteron处理器与Intel相应产品Xeon的特性,有惊喜,也有失望,希望以此能明晰AMD的长期前景。

四年以后,尘埃终于落定,AMD在其为工作站和服务器设计的四核CPU中首次实现了K10微架构。不出所料,首次发布的是2GHz和1.9GHz版产品,2.5G将在“11月推出”。

AMD想要战胜Intel的地方其实概括起来只有三个词:

1. Front
2. Side
3. Bus

每一个核都可以单独钟控(AMD的术语:独立动态核技术)。每一个核都可以选择性的将无需工作的部分进行门控时钟处理以节省功耗(Coolcore技术)。核和内存控制器有两个独立的电源层(双动态电源管理)。

每个核专门配备128Kbytes的一级缓存,512Kbyte的二级缓存。四个核共享2Mbytes的三级缓存。

高效交叉开关使得四核都可存取两个72位宽的DDR2-667内存控制器,通过HyperTransport 2.0链路可以与其他CPU交互。

当比较AMD与Intel双核和四核结构时,我的重心在前端总线(FSB)上。Intel CPU(还)不是单管芯的四核设计,相反,它们将两个双核堆叠在一个封装中;它的管芯内不含有内存控制器,相反,DRAM控制器由独立的核逻辑芯片组-北桥芯片提供;而且它们没有专用的CPU间互连通道(至少一年内不会有)。   这一切意味着Intel用来连接管芯与管芯之间,CPU与CPU之间以及CPU与芯片组之间的FSB会承载很多对时序敏感的关键数据。表面上看,这些特性会让Intel处于劣势,但是,考虑以下几点:

Xeon CPU的每一个双核管芯都有两个64Kbyte的一级缓存阵列(一对一),再加上4Mbyte的共享二级缓存,没有三级缓存。与巴塞罗那比较一下缓存的大小和类型,特别是一级对一级,二级对二级(注意一级缓存性能通常优于二级,二级快于三级)。

Xeon5300系列FSB有1066MHz和1333MHz两种,而至今Xeon 7300系列只提供了1066MHz的FSB。AMD最新四核Opteron产品线和之前基于K8微结构的双核处理器还另有两个特征:

芯片的虚拟化支持经扩展后包含有硬件的虚拟-物理地址转换加速器,而之前是速度较慢的软件转换;

AMD加强了每个核的浮点能力,从单指令64比特的FPU升级为双指令128bit的FPU。

首先看虚拟化,注意AMD用先前的3GHz双核CPU与2GHz的四核进行benchmark对比。虽然这并不反映芯片或制程的一个基本问题,但它还是反映出AMD期望四核的后续产品不仅能够从芯片的管脚角度还可以从功耗和热辐射方面做到直接替代。不考虑时钟速度的不同,考虑到新的芯片具有增强的虚拟化硬件异常分支指令和两倍的CPU核数量,在这样的条件下79%的虚拟化性能提升并不算出人意料。

Intel有NetBurst-to-Core微架构,AMD也试图改善功耗,但目前我还没有ACP的对比数据。在比较AMD与Intel的功耗时,要记得Opteron内含DRAM控制器,而Intel的Xeon没有。AMD也继续使用DDR2 SDRAM,而Intel采用Rambus-reminiscent串行接口方案FB-DIMM。有报告称在系统空闲或低负荷时,FB-DIMM比DDR2 SDRAM功耗高,而在系统高负荷时,FB-DIMM在每瓦性能和总功耗方面比较有吸引力。

对比一下AMD先后送给我的两个文档可以有以下发现:

AMD也玩Intel和其OEM伙伴Apple之间的“速度”游戏。"_rate"版的SPECint (整数)和SPECfp (浮点)按照系统中的CPU数目并行跑多个Benchmark程序,在AMD与AMD的SPECint比较中,虽然四核CPU主频有33%的降低,但四核是双核核心的双倍,所以50%的性能提升是再正常不过的。

AMD没有就SPECint做与Intel的比较,重心相应放在了SPECfp和其它浮点相关的测试。这反应出AMD在K8向K10的演进中将重心部分放在了每核的FPU上。

不出所料AMD做了很多核到核、CPU到CPU以及CPU到内存的Benchmark测试,以此来对比竞争对手Intel的共享FSB。

在其中一份文档中AMD做了其高端2GHz CPU与Intel 2.33GHz处理器的Benchmark对比,注意这款Intel产品并不是Xeon 53xx系列最高端的产品。

有些人已经拿到了基于四核Opteron的系统,虽然简短的测试不能说明什么问题,我还是在一些测评中发现了些问题:

四核可相互利用对方二级缓存和共享三级缓存在目前的测试中并没有比需要FSB交互的Intel Xeon系列在性能上有明显优势。部分上这与AMD三级缓存太长导致的延时有关。Intel的总缓存带宽好像也超过了AMD的三级缓存方案。

Intel在整型数性能上似乎还保有优势,同时,AMD加强的FPU在浮点数性能上也没有达到我和其他人的预期;

AMD不再依赖共享的FSB,交叉开关模式和集成的DRAM控制器以及低延时(与FB-DIMM)的DDR2 SDRAM的使用都使得Opteron在“流”类型数据处理上很有优势,因为它们需要不断读取系统主内存。

AMD值得怀疑的四核Opteron性能,加上其竞争性的定价,这都是我长久以来对AMD长期财务健康担心的缘由。

在Intel的大幅降价下,我想AMD会占据中等的市场规模。理想情况下,新结构的发布都会有一个较高的定价,代表着新芯片的附加值和其前期的低产量。但不幸的是,同Intel已经推出9个月的CPU相比,AMD没能提升价格,这样的话四核可以盈利吗?

现在我对AMD接下来几个月的举动比较感兴趣:

AMD会以怎样的速度开始2GHz产品的铺货;
AMD多久可以推出2. 5G以及更高速率的产品;
还会有哪些深层的测试;
AMD多久可以推出针对消费类市场的k10微架构

关键字:动态  缓存  时钟  总线 引用地址:AMD四核处理器巴塞罗那的深度分析

上一篇:基于WinCE操作系统的通用USB数控键盘设计
下一篇:基于ARM核处理器的机器人手臂控制系统

推荐阅读最新更新时间:2024-03-30 21:24

stm32f1 的停止休眠时钟问题
之前在学习低功耗时,遇到了关于休眠的一些问题。主要总结下停止休眠的。 并且,有一句: 所以,在唤醒后,使用了内部时钟,显示出的效果是led闪烁变慢。我在代码中添加了定时器定时休眠,结果就发现了:尽管其他的IO处于休眠的状态,但用JLink调试时,可以看到我的定时器值还在变化,而且变得速度比原先慢了很多。还有一个现象就是,在读取按键时,显示的结果也变得凌乱。在网上找的案例中,有用函数clock(自己写的)来重新初始化。但我作为初学者还得让我改时钟的配置,倒不如直接用SystemInit:`void EXTI2_IRQHandler(void) { EXTI_ClearITPendingBit(EXTI_Line2); LED1=1
[单片机]
充电桩 CAN总线
随着CAN总线在电动汽车、充电桩、电力电子、轨道交通等电磁环境比较恶劣的场合应用越来越多,信号干扰的问题已经严重影响到使用者对CAN总线的信任。究竟如何才能抗干扰?本文展示了致远电子CAN总线抗干扰的6条“军规”。 在汽油车时代,CAN总线遇到的干扰少之又少,即使有一些继电器和电磁阀的脉冲, 也不会有很大影响,稍微进行双绞处理,完全可以实现零错误帧。 可是到了电动汽车年代,逆变器、电动机、充电机等大功率设备对CAN的影响足以中断通讯,或者损坏CAN节点,就是被逆变器干扰的CAN波形。 面对干扰,各个汽车厂、零部件厂,测试诊断设备的厂商都纷纷研究抗干扰之“妙方”,以保证CAN稳定运行。本文就以广州致远电子有限公司15年的CAN现场故
[电源管理]
基于PXI总线的空调设备自动检测与故障诊断系统
  一、系统概述   本系统主要用于对空调设备的关键器件进行自动检测和故障诊断。该系统由自动检测系统和故障诊断系统两个分系统组成。自动检测系统可以进行温度、湿度、制冷剂压力、强电电压/电流、标准电流信号等多个信号的测量和数据采集处理,并将检测结果传输到便携式计算机中;故障诊断系统通过故障诊断系统对自动检测系统传入的数据进行分析,对空调设备所出现的故障进行定位并给出具体的解决方法。   二、系统设计与实现   1. 系统硬件设备   本系统主要基于NI公司的信号采集和调理设备搭建硬件平台,它主要由一系列PXI和SCXI板卡组成;同时,为了方便连接传感器,自制了集成接线箱。该系统的工作原理如图1所示,机箱PXI-104
[嵌入式]
USB总线接口芯片CH371及其应用
摘要:CH371是一种新型USB通用总线接口芯片。利用该芯片可在不了解任何USB协议或固件程序甚至驱动程序的情况下,轻松地将并口或串口产品升级到USB接口。文中介绍了该接口芯片的主要特点和引脚功能,给出了CH371与其它总线进行接口的几种应用电路,同时给出了CH371与MCS-51单片机的接口程序。 关键词:USB 总线接口芯片 CH371 单片机 1 引言 CH371是一种USB总线通用接口芯片。该芯片具有8位数据总线以及读、写、片选控制线和中断输出,可以方便地挂接到单片机、DSP、MCU等控制器的系统总线上;在计算机系统中,通过CH371的配套软件可提供简洁易用的操作接口,从而使其与本地端的单片机通讯就如同读写硬盘中的
[应用]
LonWorks现场总线技术在楼宇自动化温度测控系统中的应用
  目前,智能建筑得以迅猛发展,其关键是楼宇自动化系统BAS技术,其中楼宇温度测控的子系统用以实现室内温度的合理调节。目前,国内大都采用以单片机为核心组成区域控制系统,但由于这种系统在本质上采用了RS232、RS422/RS485等专用通信协议而形成“自动化孤岛”。应用现场总线控制系统FCS将系统的分散控制转换到现场控制,形成开放性的控制网络。   本文应用LonWorks现场总线技术设计了基于主机的Neuron智能节点,并通过单总线(1-Wire)数字温度传感器DS18B20与智能节点构成温度测控网络,有效地实现了对室内温度的实时监控与调节。 1 LonWorks技术   1.1LonWorks技术要点   Lo
[嵌入式]
单片机编程技巧--功能强大的时钟中断
在单片机程序设计中,设置一个好的时钟中断,将能使一个CPU发挥两个CPU的功效,大大方便和简化程序的编制,提高系统的效率与可操作性。我们可以把一些例行的及需要定时执行的程序放在时钟中断中,还可以利用时钟中断协助主程序完成定时、延时等操作。 下面以6MHz时钟的AT89C51系统为例,说明时钟中断的应用。 定时器初值与中断周期 时钟中断无需过于频繁,一般取20mS(50Hz)即可。如需要百分之一秒的时基信号,可取10mS(100Hz)。这里取20mS,用定时器T0工作于16位定时器方式(方式1)。T0的工作方式为:每过一个机器周期自动加1,当计满0FFFFh,要溢出时,便会产生中断,并由硬件设置相应的标志位供软件查询。即中断
[单片机]
USB总线接口芯片CH374介绍
    1、概述     CH374 是一个USB总线的通用接口芯片,支持USB-HOST主机方式和USB-DEVICE/SLAVE 设备方式,内置3 端口HUB 根集线器,支持低速和全速的控制传输、批量传输、中断传输以及同步/等时传输。在本地端,CH374 具有8 位数据总线和读、写、片选控制线以及中断输出,可以方便地挂接到单片机/DSP/MCU/MPU等控制器的系统总线上。除此之外,CH374还提供了节约I/O引脚的SPI串行通讯方式,通过3 线或者4 线SPI 串行接口以及中断输出与单片机/DSP/MCU/MPU 等相连接。    2、特点   ● 支持1.5Mbps低速和12Mbps 全速USB 通讯,兼
[嵌入式]
FPGA DCM时钟管理单元原理简介
DCM概述 DCM内部是DLL(Delay Lock Loop(?)结构,对时钟偏移量的调节是通过长的延时线形成的。DCM的参数里有一个PHASESHIFT(相移),可以从0变到255。所以我们可以假设内部结构里从clkin到clk_1x之间应该有256根延时线(实际上,由于对不同频率的时钟都可以从0变到255,延时线的真正数目应该比这个大得多)。DCM总会把输入时钟clkin和反馈时钟clkfb相比较,如果它们的延时差不等于所设置的PHASESHIFT,DCM就会改变在clkin和clk_1x之间的延时线数目,直到相等为止。这个从不等到相等所花的时间,就是输出时钟锁定的时间,相等以后,lock_flag标识才会升高。
[工业控制]
FPGA DCM<font color='red'>时钟</font>管理单元原理简介
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
最新工业控制文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved