GPU、CPU：不止一字之差那么简单-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

1. 引言

　　自1999年NVIDIA提出GPU的概念以来，GPU的高浮点运算能力引发了不少的话题，比如GPU将取代CPU。基于GPU的特殊性，研究人员正在从事相关方面的研究，以期充分地利用GPU高运算速度。

　　随着计算机图形处理硬件的又一次升级，即计算机图形处理器的升级。图形处理器的应用已成为热门的课题。

　　2. GPU的功能

　　GPU（Graphic ProcessingUnit）即图形处理器。1999年NVIDIA公司发布GeForce 256图形处理芯片时，首先提出GPU的概念。一块标准的GPU主要包括2D单元、3D单元、视频处理单元、FSAA（Full Scene Anti—aliasing，全景抗锯齿）单元和显存管理单元等。

　　它设计的宗旨是实现图形加速，现在最主要的是实现3D图形加速，因此它的设计基本上是为3D图形加速的相关运算来优化的，如消隐、纹理映射、图形的坐标位置变换与光照计算等等。这几年GPU发展迅猛，2007年NVIDIA甚至提出“重GPU核心，轻CPU频率”的论调。这是否意味着GPU时代的到来？

　　3. GPU与CPU的比较

　　GPU以其高速的浮点运算能力迅速地吸引了人们的眼球。

　　其计算能力到底有多大？CPU的浮点运算能力一般在10 Gflops以下（每秒可进行10亿次浮点运算），而GeForce6系列的浮点运算能力已经在40 Gflops左右，GeForce7950GX2更是达到了384Gflops；在向量计算方面能够获得比CPU高出十倍的计算效率。

　　这得益于它是对图形处理量身定制。GPU并行计算的能力更是强大，它内部具有快速存储系统，NVIDIA的8800有128个处理器，此外，GPU的硬件设计能够管理数千个并行线程，这数千个线程全部由GPU创建和管理而不需要开发人员进行任何编程与管理。然而，现在GPU还是协助CPU进行图形处理，着实浪费不少其运算能力。

　　值得注意的是，如此强大的计算能力具有针对性———图形计算，如Z- buffering、纹理映射与光照计算等。这类计算都是针对大量的平行数据，运算的数据量大，但是运算的类型却并不复杂，还具有类似性，计算性强但是逻辑性不强，如矩阵运算就是图形运算的典型特征。而CPU是设计用来处理通用任务的处理、加工、运算以及系统核心控制等工作，CPU的微架构是为高效率处理数据相关性不大的计算类、复杂繁琐的非计算类等工作而优化的。所以现在CPU和GPU还在自己的轨道上各司其职。

　　GPU特殊的硬件架构突出了对CPU的优势：拥有高带宽的独立显存；浮点运算性能高；几何处理能力强；适合处理并行计算任务；适合进行重复计算；适合图像或视频处理任务；能够大幅度降低系统成本。

　4. GPU的现状

　　GPU引发了计算机可视化的革命。处理器巨头Intel感受到GPU带来的强大的冲击力，Intel专门开发了一套面向可编程的显示计算通用架构芯片的全新架构———Larrabee架构。它能带来的效果可从英特尔公司高级副总裁兼数字企业事业部总经理———帕特·基辛格在IDF峰会上的讲话得出答案。

　　“可编程的显示计算通用架构芯片是一场革命，它将颠覆持续了几十年的显卡产业，可编程的显示计算通用架构芯片虽然不会马上替代显卡，但是在三四年之后，随着我们相关技术、产品的成熟上市，显卡产业将消亡。”

　　按照英特尔的观点，随着可编程的显示计算通用架构芯片的成熟，它将逐步取代GPU的地位，显卡则会慢慢被集成取代，作为独立硬件生存的空间会越来越小。

　　GPU如果只是作为显卡就太浪费了，因此NVIDIA推出CUDA（Compute Unified Device Architecture统一计算设备架构），让显卡可以用于图像计算以外的目的。并对GPU的功能进行了重新的定义，CUDA是一个革命性的计算架构和计算思路，能够让GPU在消费、商务、技术等应用方面大展拳脚，解决复杂的计算问题。CUDA能够更有效地使用性能日益提升的GPU性能，有效地利用GPU的高速运算能力，配合CPU进行高性能通用计算。

　　GPU和高并行处理器都在同时间赛跑，快速的向前发展以抢占未来的市场，未来处理器的速度会在这次竞争中发展到什么地步值得我们期待。

　　5. GPU的应用

　　GPU应用的研究围绕着高浮点运算能力，可编程性和平行运算进行。到目前为止，GPU和CUDA的配合，主要应用于商业高端运算或者超级运算。如tesla高性能计算，GPU加速Matlab高性能计算，医疗图像的生成等。

　　由于GPU的汇编指令比较复杂，而且对于各种版本的硬件的支持存在不统一的问题，一些高级语言（例如GLSL、HLSL）已经被一些大厂商开发出来，加快了对GPU编程的应用研究。从系统架构上看，GPU是针对向量计算进行了优化的高度并行的数据流处理器，其中包括两种流处理单元：多指令多数据流（MIMD）的处理单元———顶点处理流水线（Vertex Shader），单指令多数据流（SIMD）的处理单元———像素处理流水线。这种以数据流作为处理单元的处理器，在对数据流的处理上可以获取较高的效率，因此很多研究人员从事一个新的研究领域：基于GPU 的通用计算（GPGPU：General- Purpose Computation onGraphics Processors），其主要研究内容除了图形处理以外，考虑更为广泛的应用计算。GPU最初的设计思想给这个新的领域带来了问题。GPU是专门为图形处理设计的处理器，它具有自己的存储单元，在数据存取方式上存在一定的特殊性，而且通常对GPU进行开发的是一些游戏厂商，使用非标准的编程模式，编程环境和体系结构方面绝大部分被当做商业机密，没有对研究人员公开，可参考的资料就有限，研究人员在研究并行算法的同时还必须研究如何使GPU在进行通用计算时取得最高的性能。针对上面的问题，研究人员已经提出了GPU通用编程模型和方法，无疑推动了GPU在非图形学领域的应用。

　　最近几年，在GPGPU方面取得了不少的成果，比如代数计算及流体模拟、数据库操作、频谱变换和滤波等。软件编程方面也有成果，高级绘制语言及实时绘制语言（绘制程序设计的思想源自于早年Pixar设计的RenderMan绘制软件，此软件多年来广泛应用于好莱坞电影制作的绘制），OpenGL shading language、斯坦福大学的RTSL（real- time shading language）、Microsoft的HLSL（high- level shading language）以及NVIDIA的Cg在此方面具有较大的影响；流处理机编程环境及工具已开发出来扩大GPU的编程。

　　6. 结语

　　目前，CUDA和GPU的配合还不是很默契，真正面向民用市场还需一些时日，图形处理的市场越来越大，给GPU的发展提供了强大的驱动力。GPU应用于通用计算领域已经取得了一定的进展，GPU的身影会逐渐地出现在民用市场。

　　GPU和CPU的最终结果会怎样？众多因素的影响现在还不得而知。GPU会不会像386时代一样，最初作为独立芯片的数学协处理器387，最终融合到CPU中而消亡或者NVIDIA真的开发出像CPU那样能处理各种通用运算的GPU，GPU时代到来。无数的遐想出现在我们的头脑，还是让市场来决定这个容易引起争议的问题。

关键字：GPC CPU 引用地址：GPU、CPU：不止一字之差那么简单

上一篇：相变存储器(PCM)单元中储存多个位元的方法
下一篇：基于ADF4106的锁相环频率合成器

推荐阅读最新更新时间：2024-03-30 21:46

CPU一样华为服务器自研芯片有何特点

众所周知，今天市场上的主流服务器均是采用英特尔的CPU，于是有一种声音：“CPU都一样了，服务器们又有什么不一样”如果说过去的服务器跟随CPU做设计就可以了，今天不再是。今天的服务器需要匹配云、大数据等新技术，它是一个计算平台。服务器行业已经打破过去多年的稳定，加剧创新和变革。而对于华为服务器来说，十几年来秉承着“持续创新，让计算变简单”的理念，针对客户应用场景，不断优化。CPU都一样了，华为服务器还真的与别人不一样。为什么？华为从2002年面向运营商行业到2008年进入互联网行业，再到2012年进入企业行业，在服务器领域耕耘近15年，实现多维度基础技术与产品的创新，包括工程创新、架构创新、应用方案创新，还包括芯片创新，本文带

[半导体设计/制造]

ARM发布Coretx-X3 /A715/A510 CPU：最大12核、全面迈向64位

去年3月份推出面向未来十年的ARMv9指令集之后，ARM又在5月份推出了基于ARMv9的第一代产品，包括Cortex-X2、A710等CPU，今天ARM又推出Cortex-X3、A715 和 A510 Refresh等新一代ARMv9产品。这一代的Cortex处理器面向智能手机、平板及笔记本等平台，所以发布的东西比较多，还有新的DSU-110大小核调度架构，最多可以做到8+4+0总计12核。值得一提的是，Cortex-X3、A715都已经放弃了aarch32指令集，也就是放弃32为，转向64位架构。原有的32位怎么办？ARM这次推出的还有A510 refresh，也可以叫做A510 v2版，不仅提升了性能及能效，还

[嵌入式]

ARM发布Coretx-X3 /A715/A510 <font color='red'>CPU</font>：最大12核、全面迈向64位

系统时钟发生器基本功能_CPU寄存器低功耗控制位

　　当系统时钟发生器基本功能建立之后，CPU内状态寄存器SR的SCG1，SCG0，CPUOFF，OSCOFF位是重要的低功耗控制位。只要任意中断被响应，上述控制位就被压入堆栈保存，中断处理之后，又可恢复先前的工作方式。在中断处理子程序执行期间，通过间接访问堆栈数据，可以操作这些控制位;这样允许程序在中断返回（RE TI ）后，以另一种功耗方式继续运行。　　各控制位的作用如下：　　SCG1：复位，使能SMCLK;置位，禁止SMCLK。　　SCG0：复位，激活直流发生器，只有SCG0置位，并且DCOCLK没有被用作MCLK或SMCLK时，直流发生器才能被禁止。　　OSCOFF：复位，激活LFXT1，只有当OSCO

[单片机]

系统时钟发生器基本功能_<font color='red'>CPU</font>寄存器低功耗控制位

研究者又发现8个CPU新漏洞，英特尔、ARM等芯片受影响

　　5月4日上午消息，德国计算机杂志本周四报道称，研究人员在计算机CPU内找到8个新漏洞，这些漏洞与Metldown、Spectre有点相似。下面就随嵌入式小编一起来了解一下相关内容吧。　　杂志还说，英特尔准备发布补丁，修复漏洞， ARM 的一些芯片也受到影响，至于AMD芯片是否也存在同样的问题，研究人员正在调查。目前没有披露信息的来源，因为研究人员会优先通知相应公司，在公司找到修复补丁之后再公开自己的发现。　　1月份，研究人员发现了Meltdown和Spectre漏洞，谷歌Project Zero就是最早发现的团队之一。这一次，其中一个漏洞也是Project Zero发现的，因为90天内禁止公开，所以在5月7日之前不能

[嵌入式]

AMD购得ATI：英特尔会受到断臂之痛吗

7月24日，在全球媒体与竞争对手的注视下，海克特·鲁毅智(Hector Ruiz)博士向他的理想——让AMD成为半导体行业最伟大的公司——迈进了一大步。如果你相信这位CEO的理想将会实现，你大概也会认同，并购ATI所花费的54亿美元与理想相比并不昂贵。并购当天双方公布的信息显示，ATI已经同意整体并入AMD公司，AMD公司将为此支付42亿美元加5700万股AMD普通股的代价。合并后的新公司名字是AMD，ATI则将在年内退出股市。新公司年销售额将达到73亿美元，在总规模约400亿美元的全球半导体市场占有约20%的份额。与所有大型并购案一样，在最终宣布消息之前，AMD与ATI的绯闻已经传播了很久。不过，最终的结果依然引起高度的关注

[焦点新闻]

Intel/AMD首款合作CPU新品细节曝光：核显Vega

关于Intel和AMD合作打造一款处理器的传言已久，尽管前者否认新品计划，但就像新闻圈那句“否认即承认”一样，总是有新的佐证出来。据NLT报道，他们的记者拿到了一张Intel移动CPU的宣传图，其中明确写道“Vega Inside”，也就是这款产品的GPU采用了AMD织女星方案。这和此前的留言一样，称Intel之所以和AMD合作，主要是与NV的图形专利授权到期，转投AMD阵营。不过，这也很奇怪，Intel此前即便用NV的GPU专利授权，也没有“NV Inside”这样魔改自己的宣传语为它人做嫁衣，所以笔者持怀疑态度。 WCCF分析，Intel准备中的Coffee Lake-H(即笔记本表压系列，后缀HQ)和Canno

[嵌入式]

基于单片机双CPU构成的复杂系统应用研究

　　单片机以其功能强、体积小、可靠性高及价格低廉等优势，被广泛应用在各种智能化仪器、仪表以及各种小型控制系统中。但其本身结构较为简单，自身资源少，在一些较为复杂的应用系统中就显出其硬件资源不足，速度太慢等缺点。在这种情况下，往往采取双CPU或多CPU的设计方案，以弥补其不足。但是由于单片微机不像通用的微机系统具有其它总线主控设备向CPU请求总线使用申请信号输入端，以及CPU对系统中其他总线主控设备请求使用权的应答信号输出端，这就给双CPU系统的设计带来一定的困难。本文提出一种双CPU共享外部数据存储器的设计方案，并介绍了该系统的几种应用实例。 1　系统的硬件设计　　ATMEL公司的89系列是目前广泛应用的单片微机，图1所示

[单片机]

AMD巴塞罗纳四核CPU延期至9月样品有Bug

5月18日消息，据中国台湾媒体报道，被给予厚望的AMD巴塞罗纳（Barcelona）四核处理器将延迟到今年9月上市。该消息称，AMD原计划于今年6月推出基于K10架构的巴塞罗纳处理器，但AMD日前通知服务器厂商，该款处理器将被延迟到8月或9月推出。 AMD同时还表示，如果发生某些变化，该日期可能再次推迟。尽管AMD并未说明延迟上市的具体原因，但有消息称，在产品样品中仍有“Bug”存在。 AMD巴塞罗纳处理器是对英特尔Clovertown四核至强处理器的反击。与两个双核的Clovertown四核处理器相比，AMD的巴塞罗纳是一款真正的四核处理器。 AMD此前曾表示，英特尔今年将没有一款产品可以超越巴塞罗纳。此外，业内专家D

[焦点新闻]

热门资源推荐
热门放大器推荐

小广播

添点儿料...

无论热点新闻、行业分析、技术干货……

发布文章

热门活动

换一批

■验证并选择心仪MOSFET，探寻选型奥秘！注册、体验双重好礼等你拿~

■评论有奖：元器件采购的秘密法宝，助你做个自带“松弛感”的职场人！

■新栏目器件口碑专辑上线~快来点评吧！

■中星联华直播 | 高速信号完整性分析与测试 — “码”上行动系列线上讲堂