晶片商在CPU与GPU协同运算技术的研发日益积极。其中,安谋国际(ARM)、超微(AMD)和高通(Qualcomm)已携手合作,计划在2013~2014年陆续公布异质系统架构(HSA)标准;至于英特尔(Intel)和辉达(NVIDIA)则采自力研发策略,分别布局CPU/GPU同步转码(Transcoding)技术,以及64位元CPU/GPU协同运算处理器,相互较劲的意味浓厚。
拓墣产业研究所半导体中心研究员许汉州表示,GPU占行动处理器整体面积的比重愈来愈大,不仅功耗管理难度增加,如何善用GPU效能更是新的课题;因此,一线晶片大厂近来相继投入开发CPU、GPU协同运算技术,无论是基于x86或ARM架构的设计均殊途同归,希望让GPU处理更多平行运算、影像分析等相关任务,以发挥其应有价值,并进一步提高整体系统性能。
现阶段,HSA基金会系推动CPU/GPU协同运算最具代表性的组织,成员包括在行动晶片市场叱吒风云的ARM、高通、联发科、Imagination和三星(Samsung),以及积极从PC跨足行动装置领域的超微。
据悉,该会力拱开放性异质运算标准,近期已揭橥2013~2014年的标准蓝图,今年首重CPU、GPU架构整合,将发布两者记忆体位址共用方案;明年则将扩大至系统整合阶段,进一步提出核心切换、GPU驱动软体,甚至是GPU独立运作的延伸应用技术,可望显著缩减CPU负担,以提升处理器每瓦效能表现,让系统工作效率事半功倍。
许汉州更强调,由于HSA诉求在最短时间内,同时启动多个运算单元快速处理复杂的逻辑、影像处理工作,须因应瞬间较大峰值电压及电流的问题,所以相关业者亦正加紧研拟系统电源管理晶片(PMIC)的配套措施,以推进HSA处理器的商用时程。
另一方面,英特尔、NVIDIA也相继揭露异质晶片运算技术,前者在2013年英特尔开发者论坛(IDF)中已推出新一代CPU/GPU同步转码技术,相较于传统纯CPU运算方案,可在提高效能的前提下,大幅降低六倍功耗。英特尔副总裁暨技术长Justin Rattner认为,英特尔同时拥有坚强的CPU和GPU设计实力,因而能独自推动异质运算方案,尤其在制程技术上维持一定程度的领先,更有助提高相关产品的性能表现。
至于NVIDIA更将CPU/GPU协同运算架构列为未来行动处理器发展重点。许汉州透露,该公司已拟定2014~2015年下两代Tegra系列行动处理器规格,明年将推出代号为Logan,支援统一运算架构(CUDA)、Open GL 4.3跨平台语言的32位元CPU/CPU协同运算处理器;2015年则将打造代号Parker的处理器,除升级64位元规格外,并将导入鳍式电晶体(FinFET)先进制程。
此外,以往CPU一次只能丢一个工作任务给GPU,无法善用GPU效能,为此,NVIDIA亦已开发出Hyper-Q技术,让GPU一次可接收三十二个任务,更有效发挥其平行运算能力;同时也考量CPU/GPU频繁沟通所浪费的时间和功耗,提出动态平行运算(Dynamic Parallelism)架构,让GPU在本身内部动态中产生新的工作绪,毋须再回到CPU,进而简化程式设计。
许汉州强调,随着GPU对系统效能与功耗的影响力激增,行动晶片业者势将朝CPU/GPU协同运算方向发展,开启新的技术竞争局面。
关键字:移动大饼 CPU
引用地址:争移动大饼,芯片商竞逐CPU/GPU协同运算
拓墣产业研究所半导体中心研究员许汉州表示,GPU占行动处理器整体面积的比重愈来愈大,不仅功耗管理难度增加,如何善用GPU效能更是新的课题;因此,一线晶片大厂近来相继投入开发CPU、GPU协同运算技术,无论是基于x86或ARM架构的设计均殊途同归,希望让GPU处理更多平行运算、影像分析等相关任务,以发挥其应有价值,并进一步提高整体系统性能。
现阶段,HSA基金会系推动CPU/GPU协同运算最具代表性的组织,成员包括在行动晶片市场叱吒风云的ARM、高通、联发科、Imagination和三星(Samsung),以及积极从PC跨足行动装置领域的超微。
据悉,该会力拱开放性异质运算标准,近期已揭橥2013~2014年的标准蓝图,今年首重CPU、GPU架构整合,将发布两者记忆体位址共用方案;明年则将扩大至系统整合阶段,进一步提出核心切换、GPU驱动软体,甚至是GPU独立运作的延伸应用技术,可望显著缩减CPU负担,以提升处理器每瓦效能表现,让系统工作效率事半功倍。
许汉州更强调,由于HSA诉求在最短时间内,同时启动多个运算单元快速处理复杂的逻辑、影像处理工作,须因应瞬间较大峰值电压及电流的问题,所以相关业者亦正加紧研拟系统电源管理晶片(PMIC)的配套措施,以推进HSA处理器的商用时程。
另一方面,英特尔、NVIDIA也相继揭露异质晶片运算技术,前者在2013年英特尔开发者论坛(IDF)中已推出新一代CPU/GPU同步转码技术,相较于传统纯CPU运算方案,可在提高效能的前提下,大幅降低六倍功耗。英特尔副总裁暨技术长Justin Rattner认为,英特尔同时拥有坚强的CPU和GPU设计实力,因而能独自推动异质运算方案,尤其在制程技术上维持一定程度的领先,更有助提高相关产品的性能表现。
至于NVIDIA更将CPU/GPU协同运算架构列为未来行动处理器发展重点。许汉州透露,该公司已拟定2014~2015年下两代Tegra系列行动处理器规格,明年将推出代号为Logan,支援统一运算架构(CUDA)、Open GL 4.3跨平台语言的32位元CPU/CPU协同运算处理器;2015年则将打造代号Parker的处理器,除升级64位元规格外,并将导入鳍式电晶体(FinFET)先进制程。
此外,以往CPU一次只能丢一个工作任务给GPU,无法善用GPU效能,为此,NVIDIA亦已开发出Hyper-Q技术,让GPU一次可接收三十二个任务,更有效发挥其平行运算能力;同时也考量CPU/GPU频繁沟通所浪费的时间和功耗,提出动态平行运算(Dynamic Parallelism)架构,让GPU在本身内部动态中产生新的工作绪,毋须再回到CPU,进而简化程式设计。
许汉州强调,随着GPU对系统效能与功耗的影响力激增,行动晶片业者势将朝CPU/GPU协同运算方向发展,开启新的技术竞争局面。
上一篇:ARM推出Cortex-A12 意欲为何?
下一篇:联发科4核 通吃双A笑纳白牌
推荐阅读最新更新时间:2024-05-03 13:01
AMD台式机CPU份额终于又超越英特尔
基准测试PassMark软件公司2021年第一季度最新统计结果显示,AMD在全球台式机CPU市场上占据了50.8%的份额,超过了Intel的49.2%的份额。上一次AMD领先还是在2006年第一季度,不过当时53.9%的领先优势只持续了一个季度。 这样的结果也显示,十五年来,AMD首次在全球台式机CPU市场份额上超过了Intel。 在笔记本处理器领域,Intel仍然占据主导地位,占有率为83.8%,而AMD市场份额为16.3%。在服务器领域,而AMD市场份额为16.3%,近期还是呈下跌趋势,毕竟2020年AMD才在移动端才正式翻身,只不过整体势头强劲,具体后续如何就要看今年的Zen 3移动端处理器了。 对于Intel来说,AMD
[手机便携]
CPU对外设IO端口物理地址的编程方式
几乎每一种外设都是通过读写设备上的寄存器来进行的。外设寄存器也称为“I/O端口”,通常包括:控制寄存器、状态寄存器和数据寄存器三大类,而且一个外设的寄存器通常被连续地编址。CPU对外设IO端口物理地址的编址方式有两种:一种是I/O映射方式(I/O-mapped),另一种是内存映射方式(Memory-mapped)。而具体采用哪一种则取决于CPU的体系结构。 有些体系结构的CPU(如PowerPC、m68k、arm等)通常只实现一个物理地址空间(RAM)。在这种情况下,外设I/O端口的物理地址就被映射到CPU的单一物理地址空间中,而成为内存的一部分。此时,CPU可以象访问一个内存单元那样访问外设I/O端口,而不需要设立专门的外设
[单片机]
俄罗斯CPU,价格大幅上涨
据俄国媒体Kommersant报道,由于需求旺盛和物流复杂,俄罗斯公司设计的本土 CPU 的价格翻了一番。值得注意的是,Baikal Electronics 声称其合作伙伴正在出售其库存中的剩余物,而一些当地硬件制造商暗示芯片仍在生产中,只是制造成本变得更高了。 据《生意人报》援引俄罗斯 PC 供应链的消息来源称,自今年年初以来,Baikal Electronics 和 MCST 设计的 CPU 价格大幅上涨。报告称,价格上涨的原因是俄罗斯 PC、服务器和存储系统制造商对此类芯片的需求不断增长,以及生产转移到新工厂。 服务器和存储设备生产商 Norsi-Trans 的首席执行官谢尔盖·奥夫钦尼科夫 (Sergey Ovch
[嵌入式]
谷歌或对Honeycomb系统平板电脑无CPU限制
据国外媒体报道,自Android 3.0发布以来,一直有传言指出谷歌对使用Honeycomb操作系统的设备硬件有所限制。
在西班牙阿利坎特举行的IFA全球媒体发布会上,Hannspree的产品经理Jordon Popov解释了为什么公司年内发布的3款平板电脑只有1款使用谷歌平板电脑软件的原因。他表示,“谷歌在没有正式公开发布Honeycomb之前,确实对其载体有所要求,其中2项要求是屏幕分辨率1280 x800,同时具备前后端摄像头。”
最初,有传闻认为谷歌可能要求具有双核CPU或者Tegra 2 SoC,但是近日Android开源及兼容性技术巨头Dan Morrill指出,“事实上,谷歌对Hone
[手机便携]
Intel大手笔进军代工业:扶植第三大CPU架构
2月8日最新消息,Intel宣布,它已经准备了一笔规模可观的基金,以帮助大公司、小公司、新公司和老公司利用Intel代工服务公司(IFS)打造颠覆性技术。 这笔10亿美元(约合63.58亿元人民币)投资基金旨在利用Intel最新的创新芯片架构和先进的封装技术,加快客户产品进入市场的时间。此外,它不会对体系架构支持过于挑剔,支持范围涵盖x86、ARM和RISC-V等。 作为新CEO基辛格IDM 2.0战略的一部分,这是Intel再度对向外开放其晶圆代工服务明确示好。Intel还预计其3D封装技术等允许在一块芯片产品上集成不同架构,比如x86+ARM这样的混合模块化芯片等。 与此同时,Intel宣布成为RISC-V国
[半导体设计/制造]
CPU对存储器的读写(二、数据总线、控制总线)
二、数据总线 CPU与内存或其他器件的数据传输是通过数据总线来进行的,CPU数据总线的针脚数决定了一次可传输的位数,因为数据总线连接方式为并口所以8根针脚那么一次可传输8位既1个字节,16根针脚那么CPU是通过16跟导线跟内存相连,可一次性传输16位数既2个字节,如果8位数据总线传输16位数据只能通过发送2次来完成,而16位总线发送一次即可,速度上16位总线传输是8位总线的1倍,比如CPU发送89D8到内存8位和16位总线的发送方式如图所示: 三、控制总线 控制总线也是通过CPU针脚的数量来决定控制命令的多少,越多意味着可以使用的命令越多,其中控制总线有根导线负责对外发送信号称为“读信号输出”,由读信号输出负责CPU
[单片机]
最小化ARM Cortex-M CPU功耗的方法
1理解Thumb-2 首先,让我们从一个看起来并不明显的起点开始讨论节能技术—指令集。所有Cortex-MCPU都使用Thumb-2指令集,它融合了32位ARM指令集和16位Thumb指令集,并且为原始性能和整体代码大小提供了灵活的解决方案。在Cortex-M内核上一个典型的Thumb-2应用程序与完全采用ARM指令完成的相同功能应用程序相比,代码大小减小到25%之内,而执行效率达到90%(当针对运行时间进行优化后)。 Thumb-2中包含了许多功能强大的指令,能够有效减少基础运算所需的时钟周期数。减少时钟周期数意味着现在你能够以更少的CPU功耗完成手头的工作。例如,假设要完成一个16位乘法运算(如图1所示)。在一个8位805
[单片机]
智能缩水率机方案设计
缩水率机,顾名思义就是测量织物缩水率的机器,我们的第一代产品用目前的眼光来看,体积庞大,外观粗糙,电路陈旧不简洁,可靠性差,主要部件均为自产,如电机等还经常损坏。这次,经过市场调查和分析,我们发现西门子和滚筒式洗衣机的外观,机械结构、电机、电磁阀等在同行中都较领先,而且和我们的要求相近。因此,我们提出了利用西门子壳体改制缩水率机的构想,通过解剖,摒弃了其所有机械程控部分,改用我们自己设计的新的控制系统。程序按照有关国际和国内标准运行,经过实践证明,我们的方案是成功的! 本文主要介绍传感器的数据采集过程,并对其器件的用法和电路的整个工作流程都作了详细的说明。 一. 系统结构(图一) (图一) 1
[单片机]
小广播
热门活动
换一批
更多
最新手机便携文章
- 曝iPhone SE 4首发苹果自研5G基带:明年3月登场
- 曝iPhone 17全系首发3nm A19系列芯片:无缘台积电2nm工艺制程
- 供应链称上游元器件要大降价:国产手机现涨价潮后会主动下调售价吗
- 消息称苹果将拿出近 1 亿美元用于解除印尼 iPhone 16 系列销售禁令
- 消息称塔塔公司收购和硕在印度的唯一一家iPhone工厂,深化与苹果合作
- 苹果遭4000万英国iCloud用户集体诉讼,面临276亿元索赔
- 消息称苹果、三星超薄高密度电池均开发失败,iPhone 17 Air、Galaxy S25 Slim手机“变厚”
- 美光亮相2024年进博会,持续深耕中国市场,引领可持续发展
- Qorvo:创新技术引领下一代移动产业
更多精选电路图
更多热门文章
更多每日新闻
更多往期活动
厂商技术中心