AMD首款Bulldozer(推土机)处理器将会在2011年上市,Bulldozer是面向服务器和桌面的CPU,独立于之前的K8和K10架构,是一款全新开发的架构,采用32nm SOI工艺制作。今天我们对Bulldozer的架构信息进行了整理汇总,接下来就让我们来一一了解Bulldozer的方方面面。
首先AMD Bulldozer采用集群化的微架构,Bulldozer集群化的微架构就是CPU内核的集群化;具体来说是融合了两个CPU内核,两个内核共享浮点运算单元和命令解码器等资源。
AMD将融合了两个内核的Bulldozer架构称之为“Bulldozer Module”,基本单位是两线程并列的组件。由于Bulldozer聚合了多个单元,所以可以很方便实现更多核心架构扩展。例如,要是4核Bulldozer CPU的话,可以装载2个Bulldozer Module,减少完全重新设计核心的麻烦。
Bulldozer的集群化微架构可以在一个组件内同时实现2个线程。这种在一个CPU内实现双线程的技术看上和Intel的Hyper-Threading有些类似,其实是有很大不同的。
Intel的Hyper-Threading(超线程)可以使操作系统或者应用软件的多个线程,同时运行于一个超线程处理器上,其内部的两个逻辑处理器共享一组处理器执行单元。而AMD CPU的两个线程使用各自的单元,但两个线程是共享命令解码器和浮点运算等资源的。因为是整数运算,所有线程之间没有冲突,因此吞吐量有所提高。
负责Bulldozer开发的AMD首席技术官Chuck Moore曾在2005年的AMD分析日上提到了集群化架构的优点,只是增加50%的CPU内核资源,吞吐量提升80%。根据这个说明,和Hyper-Threading一样的SMT资源和性能也有一些提升。
Moore在“2009 Financial Analyst Day”分析日上再次提到这种架构可以提高吞吐量达80%。同时,AMD也把这种集群化架构申请了多项专利(United States Patent Application 20090006814、20090024836等)。
下图是Bulldozer的具体结构,可以看到一个Bulldozer有2个整数运算的内核,每个内核有4个整数运算通道。4个通道内,2个ALU和AGU为一组,而现在AMD的架构是3个ALU和AGU为一组,最大能实现3个x86整数运算命令。如果是4个ALU和AGU一组的话,那么一个整数运算内核要比现有CPU内核大,如果是2个ALU和AGU一组的话,大约是现有内核的2/3。
Bulldozer模块的指令获取和解码,每个周期可处理4条指令,而计算指令与在寄存器操作的x86指令会被分成8个内部微操作指令(uOPs),整数运算管道中ALU和AGU则两两成对,正好吻合。
在浮点运算单元方面,则准备了两个整合的128bit SIMD单元,这将兼容英特尔的256bit AVX指令集,AVX将在这两个128bit SIMD单元中执行。AMD已经确定改变了原有在Bulldozer上的SSE5计划,将支持英特尔的256bit的SIMD指令集AVX。而对于浮点运算单元来说,每个时钟循环中都可以在两个处理器核心之间单独或共享使用。
与代号为Llano的APU产品一样,Bulldozer(推土机)将支持先进功耗管理功能以及数码测温功能,很显然在TDP设计允许的情况下以及多个核心处于待机状态下时,Bulldozer(推土机)处理器将可以实现频率的大幅提升。
明年无论是AMD还是Intel将会引来处理器微架构的升级,新一轮较量已经开始,让我们拭目以待吧。
- Allegro MicroSystems 在 2024 年德国慕尼黑电子展上推出先进的磁性和电感式位置感测解决方案
- 左手车钥匙,右手活体检测雷达,UWB上车势在必行!
- 狂飙十年,国产CIS挤上牌桌
- 神盾短刀电池+雷神EM-i超级电混,吉利新能源甩出了两张“王炸”
- 浅谈功能安全之故障(fault),错误(error),失效(failure)
- 智能汽车2.0周期,这几大核心产业链迎来重大机会!
- 美日研发新型电池,宁德时代面临挑战?中国新能源电池产业如何应对?
- Rambus推出业界首款HBM 4控制器IP:背后有哪些技术细节?
- 村田推出高精度汽车用6轴惯性传感器
- 福特获得预充电报警专利 有助于节约成本和应对紧急情况