Sandy Bridge架构:让GPU CPU融为一体

发布者:WhisperingLight最新更新时间:2010-11-04 来源: 51CTO关键字:GPU  CPU 手机看文章 扫描二维码
随时随地手机看文章

    秋风一起,眼见2010年就要过去了。去年这个时候,大家还在展望32纳米的新酷睿Westmere 处理器——第一颗了 “吞并”了主流GPU(图形处理单元,显卡核心)的CPU。而大家今天的话题则更多的转向英特尔新一代的架构Sandy Bridge,其中的亮点之一就是显示核心(GPU)的全新实现方案——无缝融合。

    2010年初发布的新酷睿处理器(Westmere)采用的方案是32纳米的CPU核心加上45纳米的GPU核心。拆开Westmere 处理器的封装可以清楚地看到CPU+GPU的 “1+1”两个核心的组合。

    明年第一季度将要发布的Sandy Bridge 则做的更彻底,这个新的处理器微架构不只是 “吞并”,而是把GPU “消化”并融入CPU芯片中,成为自己身体不可缺少的 “一部分”。 用户购买了这样的CPU,同时也就拥有主流性能的”显卡”了,显卡以一块”卡”的形式存在于电脑中也越来越无形了。特别是笔记本电脑,用户不再为以往的集成显卡性能不佳而烦恼,也不用为焊上独立显卡芯片的笔记本电脑太热太吵以及电池迅速耗尽而苦恼。因为融合于CPU之中的核显,具有更高更智能的性能和更精良的能耗管理,以及和CPU其它计算单元之间更协调的均衡计算。

    从“图一”可以清楚地看到,一颗4个物理核心的Sandy Bridge处理器具有一个核显(GPU)了,它已经是CPU芯片的整体不可分割的一个部分,同样采用英特尔最先进的32纳米处理器制造工艺来实现。如果有机会拆开Sandy Bridge的处理器封装,我们所看到将是浑然一起的一颗32纳米芯片,GPU完全融合在CPU之中,非专业人士已经很难区分哪个区域是原来的CPU主要单元,哪个部分是GPU。

图一: 核显融合在Sandy Bridge 处理器中

    在 “图一”中,4个物理核心、核显、内核管理、内存控制器(IMC)等等都可以使用最后一级的可共享的高速缓存,具体实现中这级高速缓存就是我们所熟知的三级共享的英特尔智能高速缓存。图中看到高速缓存分成了4个部分,不要误解它们是每个核心专属的一级和二级高速缓存,图中没有细化到把核心0到核心4的一级和二级高速缓存都画出来。图中所示的是共享的三级高速缓存,它被分成物理上的4个片段,逻辑上由处理器内部的各个核心单元共享。

    既然融为一体,Sandy Bridge中的核显(GPU)带来的优势是之前的酷睿处理器(Westmere)中的GPU不能比拟的:Sandy Bridge的核显可以直接使用共享的三级高速缓存了,它与各个核心能够直接在高速缓存交换数据而不仅限于之前的系统内存。因此,我们称之为 “核芯显卡”就更为贴切。也就是我们图中简称的 “核显”。

    Sandy Bridge 中还设计了创新的高速环形联通架构,各个核心、各个高速缓存段、核显、内核管理中心等等可以通过这个高速的双向环形架构进行数据的交换。图二可以看到这个环形架构将Sandy Bridge 内部的各个单元连接起来,其中核显就是这个环形联通架构上的重要一个节点。

图二:Sandy Bridge的环形联通架构

Sandy Bridge融合架构让我们看到这样几个趋势:

    (1) 采用CPU的制造工艺,融合的GPU(显卡)的性能将得到进一步的提升,它的发展和CPU休戚以共,共同进退。(2) GPU从此成为CPU的标准单元,CPU的定义拓展了,具有主流图形能力和性能的CPU将是常态。反之,没有GPU单元(没有显卡功能)的CPU将成为 “前辈”。(3) GPU 单元在CPU的核心设计中将继续融合,边界更加模糊,甚至在指令集上进行融合和相互补充。(4) 中高端独立显卡将在高端应用上继续存在,但是主流市场的退缩已经在所难免了。(5) 只要摩尔定律继续有效,CPU作为中央处理单元将继续融合更多目前还是独立的单元。

关键字:GPU  CPU 引用地址:Sandy Bridge架构:让GPU CPU融为一体

上一篇:GE新的3U VPX单板计算机拥有8核处理器,可实现最佳每瓦效能
下一篇:TI 推出频率高达1.5GHz的嵌入式处理器

推荐阅读最新更新时间:2024-05-02 21:11

蔡崇信:中国一定能制造高端GPU芯片 不一定要用英伟达
阿里巴巴集团董事会主席蔡崇信近日接受了挪威主权财富基金投资总监Nicolai Tangen的采访。谈及芯片短缺和限制,他认为中国有能力自己制造高端GPU,并不一定要用英伟达。 对于美国收紧向中国出口芯片和相关技术,蔡崇信直言这会影响云计算和高阶运算业务,并在中短期内持续产生影响,但长远来看,中国将能够制造高端GPU。 他表示,目前中国企业的芯片存货可以支持AI大模型未来18个月的训练需求,并指出AI大模型的建立非常需要高运算能力,但在下一阶段的应用,即业界所称的“推论(Inference)”阶段,市场上有很多选择,并不一定要使用英伟达最顶级的高端芯片。 在被问及近年来投资界最热门的人工智能发展时,蔡崇信认为,中国目前落后于最顶尖的
[嵌入式]
51单片机开发之中断
4.2 中断 4.2.1 中断介绍 中断系统是为使CPU具有对外界紧急事件的实时处理能力而设置的。 当中央处理机CPU正在处理某件事的时候外界发生了紧急事件请求,要求CPU暂停当前的工作,转而去处理这个紧急事件,处理完完后,再回到原来被中断的地方,继续原来的工作,这样的过程称为中断,实现这种功的部件称为中断系统,请示CPU中断的请求源称为中断源。 微型机的中断系统一般允许多个中断源,当几个中断源同时向CPU请求中断,要求为它服务的时候,这就存在CPU优先响应哪一个中断源请求的问题。通常根据中断源的轻重缓急排队,优先处理最紧急事件的中断请求源,即规定每一个中断源有一个优先级别,CPU总是先响应优先级别最高的中断请求。 当CP
[单片机]
51单片机开发之中断
碎片化的IoT时代,中天微填补国产嵌入式CPU空白
2018年,集成电路再次被写入政府工作报告,位列实体经济发展第一位。尽管我国芯片产业日益强大,但由于起步较晚,无论是产业基础、产业结构、产业规模还是创新能力和水平与发达国家相比差距仍旧很大,尤其在IC产业基础设施布局与建设领域中,仍然严重滞后于发达国家水平。尽管如此,在中国IC产业内也不乏始终坚持的开拓者,拥有自主知识产权的嵌入式CPU的空白便被杭州中天微系统有限公司所填补。 嵌入式CPU IP是芯片研发和嵌入式系统的基础,该领域过去一直被国外企业所垄断,就在大家普遍认为这个市场将会一家独大时,中天微却凭着过硬的研发技术功底,加之正确的商业化运作以及有效的市场策略,逐渐获得了国内同行的广泛认可,走出一条有自己特色的道路,短短2年时
[手机便携]
基于14纳米工艺的原型GPU,包含现场可编程门阵列
在回归到独立GPU(dGPU)众多传言之后,英特尔通过聘请业内最知名的AMD前GPU架构师Raja Koduri负责研发其独立GPU产品。过去一周在旧金山举办的IEE国际固态电路会议上,该公司发布了基于14纳米工艺的原型GPU,展示它在该领域的早期成果。据称,该原型内建15.42亿个晶体管和两个主芯片,第一个包含实际的GPU,第二个包含现场可编程门阵列(FPGA)。 据说这个芯片目前仅仅是一个概念证明,并没有提供其性能的真实指标。然而,英特尔正在开发该技术以提高效率,以此来 重现其CPU阵容的成功。 鉴于该芯片还是一个简单的原型,我们不太可能会看到这款产品上市,但它的揭示确实表明英特尔正在认真对待与Nvidia和AMD
[网络通信]
TI 新一代明星CPU,米尔AM62x核心板
说到 TI(德州仪器),想必大家都不陌生,它在模拟器件领域处于世界领先水平,特别是我们熟知的DSP,更是超越了各大同行。 同样,在CPU领域,TI 也拥有不错的技术功底,当年凭借 MSP430 超低功耗,走红了全球。 今天给大家分享的是 TI 新一代明星CPU——AM62x,它相比上一代AM335x在工艺、外设、性能等多方面都有很大提升。 这里结合米尔电子的“MYC-YM62X核心板及开发板”给大家描述一下这款明星CPU。 TI AM62x核心板是米尔电子的一款工业级核心板,采用邮票孔+LGA设计,基于AM62x系列处理器是 TI 新一代明星CPU,可接替上一代AM335x,拥有更强劲的性能。
[嵌入式]
TI 新一代明星<font color='red'>CPU</font>,米尔AM62x核心板
PK英伟达,AMD下月将发布Zen 3 CPU与 Radeon RX 6000 系列显卡
据theverge 9月9日报道,上周英伟达高调推出了售价699美元的RTX 3080,预计下周四开始发售。根据英伟达官方发布的信息,和RTX2080相比,RTX3080的性能将会提高一倍。对于准备正要下单购买的用户来说,他们现在多了一个选择:AMD昨天宣布,将于下个月的28号推出Radeon RX 6000 系列显卡。 AMD宣传片显示Radeon RX 6000 系列显卡将于10月28日上线 在10月28日之前,英伟达将推出两款新的3000系列显卡:699美元的RTX 3080(9月17日发售)和1499美元的RTX 3090(9月24日发售)。下个月英伟达还将推出售价499美元的RTX 3070。据行业的资深观察者kop
[手机便携]
英特尔承认CPU漏洞对性能产生影响:幅度为2%至14%
新浪科技讯 北京时间1月10日下午消息,虽然上周坚称Meltdown和Spectre两个CPU漏洞不会对电脑性能产生太大影响的,但英特尔周二承认,该公司的SYSmark测试显示,打补丁之后的CPU性能降幅大约为2%至14%。 不过,英特尔依然坚持之前的立场。他们表示,常规的消费级和企业级应用(包括阅读邮件、打开文档、查看照片)都不会因为打补丁而影响任何性能:“第8代酷睿平台配合固态存储受到的性能影响只有6%,甚至更低。” 这一结论显然很可疑,因为很多消费级和企业级云计算服务器都在修补漏洞之后,发生了响应速度变慢和CPU使用率上升的情况。 而且,现在再来辩解似乎为时已晚,因为这一问题至少引发了8起针对英特尔的诉讼。(思远
[半导体设计/制造]
如何判断CPU是否正在执行中断函数?
1.这是一个有许多经验的攻城狮都遇到过的坑,本文教你正确绕过这个坑; 2.教大家了解__get_CONTROL的用法,及xQueueSend和xQueueSendFromISR的区别; Ⅰ 问题来源 今天在FreeRTOS系统上移植了部分别人写的代码,移植前仔细看了下源码,确认没问题后,编译,下载,运行,突然“死机了”······ 于是,我又再次确认了移植的代码,没有发现Bug所在。此时,我开启了在线调试功能,发现程序死在了“vPortEnterCritical”函数中的断言语句里。如下: Ⅱ 解决问题的过程 我解决问题还是按照常规思维,一步一步跟踪,很多问题其实都是类似道理,有规律可循
[单片机]
如何判断<font color='red'>CPU</font>是否正在执行中断函数?
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved