争移动大饼,芯片商竞逐CPU/GPU协同运算-电子工程世界

晶片商在CPU与GPU协同运算技术的研发日益积极。其中，安谋国际(ARM)、超微(AMD)和高通(Qualcomm)已携手合作，计划在2013～2014年陆续公布异质系统架构(HSA)标准；至于英特尔(Intel)和辉达(NVIDIA)则采自力研发策略，分别布局CPU/GPU同步转码(Transcoding)技术，以及64位元CPU/GPU协同运算处理器，相互较劲的意味浓厚。
拓墣产业研究所半导体中心研究员许汉州表示，GPU占行动处理器整体面积的比重愈来愈大，不仅功耗管理难度增加，如何善用GPU效能更是新的课题；因此，一线晶片大厂近来相继投入开发CPU、GPU协同运算技术，无论是基于x86或ARM架构的设计均殊途同归，希望让GPU处理更多平行运算、影像分析等相关任务，以发挥其应有价值，并进一步提高整体系统性能。

现阶段，HSA基金会系推动CPU/GPU协同运算最具代表性的组织，成员包括在行动晶片市场叱吒风云的ARM、高通、联发科、Imagination和三星(Samsung)，以及积极从PC跨足行动装置领域的超微。

据悉，该会力拱开放性异质运算标准，近期已揭橥2013～2014年的标准蓝图，今年首重CPU、GPU架构整合，将发布两者记忆体位址共用方案；明年则将扩大至系统整合阶段，进一步提出核心切换、GPU驱动软体，甚至是GPU独立运作的延伸应用技术，可望显著缩减CPU负担，以提升处理器每瓦效能表现，让系统工作效率事半功倍。

许汉州更强调，由于HSA诉求在最短时间内，同时启动多个运算单元快速处理复杂的逻辑、影像处理工作，须因应瞬间较大峰值电压及电流的问题，所以相关业者亦正加紧研拟系统电源管理晶片(PMIC)的配套措施，以推进HSA处理器的商用时程。

另一方面，英特尔、NVIDIA也相继揭露异质晶片运算技术，前者在2013年英特尔开发者论坛(IDF)中已推出新一代CPU/GPU同步转码技术，相较于传统纯CPU运算方案，可在提高效能的前提下，大幅降低六倍功耗。英特尔副总裁暨技术长Justin Rattner认为，英特尔同时拥有坚强的CPU和GPU设计实力，因而能独自推动异质运算方案，尤其在制程技术上维持一定程度的领先，更有助提高相关产品的性能表现。

至于NVIDIA更将CPU/GPU协同运算架构列为未来行动处理器发展重点。许汉州透露，该公司已拟定2014～2015年下两代Tegra系列行动处理器规格，明年将推出代号为Logan，支援统一运算架构(CUDA)、Open GL 4.3跨平台语言的32位元CPU/CPU协同运算处理器；2015年则将打造代号Parker的处理器，除升级64位元规格外，并将导入鳍式电晶体(FinFET)先进制程。

此外，以往CPU一次只能丢一个工作任务给GPU，无法善用GPU效能，为此，NVIDIA亦已开发出Hyper-Q技术，让GPU一次可接收三十二个任务，更有效发挥其平行运算能力；同时也考量CPU/GPU频繁沟通所浪费的时间和功耗，提出动态平行运算(Dynamic Parallelism)架构，让GPU在本身内部动态中产生新的工作绪，毋须再回到CPU，进而简化程式设计。

许汉州强调，随着GPU对系统效能与功耗的影响力激增，行动晶片业者势将朝CPU/GPU协同运算方向发展，开启新的技术竞争局面。

关键字：移动大饼 CPU 引用地址：争移动大饼,芯片商竞逐CPU/GPU协同运算

上一篇：ARM推出Cortex-A12 意欲为何？
下一篇：联发科4核通吃双A笑纳白牌

推荐阅读最新更新时间：2024-05-03 13:01

AMD台式机CPU份额终于又超越英特尔

基准测试PassMark软件公司2021年第一季度最新统计结果显示，AMD在全球台式机CPU市场上占据了50.8%的份额，超过了Intel的49.2%的份额。上一次AMD领先还是在2006年第一季度，不过当时53.9%的领先优势只持续了一个季度。这样的结果也显示，十五年来，AMD首次在全球台式机CPU市场份额上超过了Intel。在笔记本处理器领域，Intel仍然占据主导地位，占有率为83.8%，而AMD市场份额为16.3%。在服务器领域，而AMD市场份额为16.3%，近期还是呈下跌趋势，毕竟2020年AMD才在移动端才正式翻身，只不过整体势头强劲，具体后续如何就要看今年的Zen 3移动端处理器了。对于Intel来说，AMD

[手机便携]

CPU对外设IO端口物理地址的编程方式

几乎每一种外设都是通过读写设备上的寄存器来进行的。外设寄存器也称为“I/O端口”，通常包括：控制寄存器、状态寄存器和数据寄存器三大类，而且一个外设的寄存器通常被连续地编址。CPU对外设IO端口物理地址的编址方式有两种：一种是I/O映射方式（I/O－mapped），另一种是内存映射方式（Memory－mapped）。而具体采用哪一种则取决于CPU的体系结构。有些体系结构的CPU（如PowerPC、m68k、arm等）通常只实现一个物理地址空间（RAM）。在这种情况下，外设I/O端口的物理地址就被映射到CPU的单一物理地址空间中，而成为内存的一部分。此时，CPU可以象访问一个内存单元那样访问外设I/O端口，而不需要设立专门的外设

[单片机]

俄罗斯CPU，价格大幅上涨

据俄国媒体Kommersant报道，由于需求旺盛和物流复杂，俄罗斯公司设计的本土 CPU 的价格翻了一番。值得注意的是，Baikal Electronics 声称其合作伙伴正在出售其库存中的剩余物，而一些当地硬件制造商暗示芯片仍在生产中，只是制造成本变得更高了。据《生意人报》援引俄罗斯 PC 供应链的消息来源称，自今年年初以来，Baikal Electronics 和 MCST 设计的 CPU 价格大幅上涨。报告称，价格上涨的原因是俄罗斯 PC、服务器和存储系统制造商对此类芯片的需求不断增长，以及生产转移到新工厂。服务器和存储设备生产商 Norsi-Trans 的首席执行官谢尔盖·奥夫钦尼科夫 (Sergey Ovch

[嵌入式]

谷歌或对Honeycomb系统平板电脑无CPU限制

据国外媒体报道，自Android 3.0发布以来，一直有传言指出谷歌对使用Honeycomb操作系统的设备硬件有所限制。在西班牙阿利坎特举行的IFA全球媒体发布会上，Hannspree的产品经理Jordon Popov解释了为什么公司年内发布的3款平板电脑只有1款使用谷歌平板电脑软件的原因。他表示，“谷歌在没有正式公开发布Honeycomb之前，确实对其载体有所要求，其中2项要求是屏幕分辨率1280 x800，同时具备前后端摄像头。” 最初，有传闻认为谷歌可能要求具有双核CPU或者Tegra 2 SoC，但是近日Android开源及兼容性技术巨头Dan Morrill指出，“事实上，谷歌对Hone

[手机便携]

Intel大手笔进军代工业：扶植第三大CPU架构

2月8日最新消息，Intel宣布，它已经准备了一笔规模可观的基金，以帮助大公司、小公司、新公司和老公司利用Intel代工服务公司（IFS）打造颠覆性技术。　　这笔10亿美元（约合63.58亿元人民币）投资基金旨在利用Intel最新的创新芯片架构和先进的封装技术，加快客户产品进入市场的时间。此外，它不会对体系架构支持过于挑剔，支持范围涵盖x86、ARM和RISC-V等。　　作为新CEO基辛格IDM 2.0战略的一部分，这是Intel再度对向外开放其晶圆代工服务明确示好。Intel还预计其3D封装技术等允许在一块芯片产品上集成不同架构，比如x86+ARM这样的混合模块化芯片等。　　与此同时，Intel宣布成为RISC-V国

[半导体设计/制造]

Intel大手笔进军代工业：扶植第三大<font color='red'>CPU</font>架构

CPU对存储器的读写（二、数据总线、控制总线）

二、数据总线 CPU与内存或其他器件的数据传输是通过数据总线来进行的，CPU数据总线的针脚数决定了一次可传输的位数，因为数据总线连接方式为并口所以8根针脚那么一次可传输8位既1个字节，16根针脚那么CPU是通过16跟导线跟内存相连，可一次性传输16位数既2个字节，如果8位数据总线传输16位数据只能通过发送2次来完成，而16位总线发送一次即可，速度上16位总线传输是8位总线的1倍，比如CPU发送89D8到内存8位和16位总线的发送方式如图所示：三、控制总线控制总线也是通过CPU针脚的数量来决定控制命令的多少，越多意味着可以使用的命令越多，其中控制总线有根导线负责对外发送信号称为“读信号输出”，由读信号输出负责CPU

[单片机]

<font color='red'>CPU</font>对存储器的读写（二、数据总线、控制总线）

最小化ARM Cortex-M CPU功耗的方法

1理解Thumb-2 首先，让我们从一个看起来并不明显的起点开始讨论节能技术—指令集。所有Cortex-MCPU都使用Thumb-2指令集，它融合了32位ARM指令集和16位Thumb指令集，并且为原始性能和整体代码大小提供了灵活的解决方案。在Cortex-M内核上一个典型的Thumb-2应用程序与完全采用ARM指令完成的相同功能应用程序相比，代码大小减小到25%之内，而执行效率达到90%(当针对运行时间进行优化后)。 Thumb-2中包含了许多功能强大的指令，能够有效减少基础运算所需的时钟周期数。减少时钟周期数意味着现在你能够以更少的CPU功耗完成手头的工作。例如，假设要完成一个16位乘法运算(如图1所示)。在一个8位805

[单片机]

最小化ARM Cortex-M <font color='red'>CPU</font>功耗的方法

智能缩水率机方案设计

缩水率机，顾名思义就是测量织物缩水率的机器，我们的第一代产品用目前的眼光来看，体积庞大，外观粗糙，电路陈旧不简洁，可靠性差，主要部件均为自产，如电机等还经常损坏。这次，经过市场调查和分析，我们发现西门子和滚筒式洗衣机的外观，机械结构、电机、电磁阀等在同行中都较领先，而且和我们的要求相近。因此，我们提出了利用西门子壳体改制缩水率机的构想，通过解剖，摒弃了其所有机械程控部分，改用我们自己设计的新的控制系统。程序按照有关国际和国内标准运行，经过实践证明，我们的方案是成功的! 　　本文主要介绍传感器的数据采集过程，并对其器件的用法和电路的整个工作流程都作了详细的说明。　　一. 系统结构(图一) 　　 (图一) 　　1

[单片机]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

■STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

■免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！