近日,清华大学微电子所、未来芯片技术高精尖创新中心钱鹤、吴华强教授团队与合作者在《自然》在线发表了研究论文,报道了基于忆阻器阵列芯片卷积网络的完整硬件实现。
该成果所研发的首款基于多个忆阻器阵列的存算一体系统,在处理卷积神经网络(CNN)时的能效比图形处理器芯片(GPU)高两个数量级,大幅提升了计算设备的算力,成功实现以更小的功耗和更低的硬件成本完成复杂的计算。
基于忆阻器阵列可以实现基于物理定律(欧姆定律和基尔霍夫定律)的并行计算,同时实现存储与计算一体化,突破传统架构对算力的限制。
阿里达摩院在2020年1月发布了《2020十大科技趋势》报告,其中第二大趋势即为“计算存储一体化突破AI算力瓶颈”。 报告指出:“数据存储单元和计算单元融合为一体,能显著减少数据搬运,极大提高计算并行度和能效。计算存储一体化在硬件架构方面的革新,将突破AI算力瓶颈”。
清华大学报道指出,当前国际上的相关研究还停留在简单网络结构的验证,或者基于少量器件数据进行的仿真,基于忆阻器阵列的完整硬件实现仍然有很多挑战。
钱鹤、吴华强教授团队通过优化材料和器件结构,成功制备出了高性能的忆阻器阵列。为解决器件非理想特性造成的系统识别准确率下降问题,提出一种新型的混合训练算法,仅需用较少的图像样本训练神经网络,并通过微调最后一层网络的部分权重,使存算一体架构在手写数字集上的识别准确率达到96.19%,与软件的识别准确率相当。
关键字:GPU
引用地址:
清华大学研制首款多阵列忆阻器存算一体系统能效高于GPU
推荐阅读最新更新时间:2024-10-29 12:05
适用于 FPGA、GPU 和 ASIC 系统的电源管理
在 FPGA、GPU 或 ASIC 控制的系统板上,仅有为数不多的几种电源管理相关的设计挑战,但是由于需要反复调试,所以这类挑战可能使系统的推出时间严重滞后。不过,如果特定设计或类似设计已经得到电源产品供应商以及 FPGA、GPU 和 ASIC 制造商的验证,就可以防止很多电源和 DC/DC 调节问题。分析和解决问题的负担常常落在系统设计师的肩上。配置设计方案复杂的数字部分已经占据了这些设计师的大部分精力。因此处理设计方案的模拟和电源部分就成了主要挑战,因为电源并非如很多设计师所预期的那样是个简单的任务。 周全的电源管理从一开始就很有挑战性 所有设计任务一开始都很有挑战性,例如为一个包含收发器、内存模块、传感器、线路连接器以及网状
[电源管理]
台积电获得Intel 6nm芯片订单?GPU要外包?
据最新消息显示,Intel已经与台积电达成协议,预订了台积电明年18万片6nm芯片。 消息中还提到,AMD将7、7+nm芯片的订单增加到20万片,而得益于Intel和AMD的订单,台积电2021年上半年先进制程产能将维持满载。 事实上,之前就曾有消息称,Intel会在2021年大规模使用台积电的6nmn工艺,其在2022年Intel还会进一步使用台积电的3nm工艺代工。 假如Intel真的打算扩大外包,除了已经部分外包的芯片组之外,首当其冲的就是GPU,因为GPU相对CPU制造来说更简单一些,而且台积电在GPU制造上很有经验。 结合之前的消息来看,Intel的Xe架构独显DG1使用的是自家10nm工艺制造,今
[嵌入式]
三星Exynos 2200芯片跑分曝光:AMD GPU性能远超苹果A14
AMD 今年早些时候宣布,三星下一代 Exynos 移动 SoC 芯片将集成 RDNA 2(mRDNA)架构核心显卡。首批应用新 GPU 的芯片型号预计为 Exynos 2200,有望在今年晚些时候正式发布。 根据韩国网站 Clien 爆料,这款 SoC 的 GPU 代号“Voyager”,将集成 6 CU 共 384 个流处理器,频率可达 1.31GHz。显卡跑分远高于苹果 A14 Bionic 芯片,但是不能与 M1 芯片相当。 具体来看,Exynos 2200的AMD GPU在使用GFXBench跑分时,1080P曼哈顿3.1平均帧率 170.7 fps,而目前不论是高通骁龙 888 系列还是苹果 A14 Bi
[手机便携]
Imagination 推出Wizard 系列 PowerVR 光线追踪GPU
该颠覆性创新技术能将互动电影的真实感带到主流设备当中。 2014 年 3 月 27 日 —— Imagination Technologies宣布,推出可将光线追踪图形技术大幅推升到全新境界的革命性新系列图形IP内核Wizard,它能满足移动设备的低功耗需求,同时还可以提供令人惊艳的图形图像真实感与性能。 新的 Wizard GPU 内核能以真实世界的动态光线模式打造更具现场感的游戏与应用程序,实现动态柔性阴影、真实反射与透明度等先进光线效果,这是以前在移动设备上所无法达到的。PowerVR Wizard 光线追踪 IP 具备高度可扩展性,使其能为移动应用之外的其他市场带来颠覆性创新。 PowerVR
[手机便携]
百度AMD合建GPU技术实验室
8月23日, AMD 公司与 百度 宣布双方将携手合作,评估、优化 AMD 新型处理器技术在 百度 AI技术领域的应用,推动人工智能开发与发展。下面就随嵌入式小编一起来了解一下相关内容吧。 双方宣布将建立GPU技术联合实验室,测试、评估和优化 AMD 的Radeon Instinct加速器,在需求分析、性能优化、定制化开发等多方面密切合作,探索将创新的AMD GPU技术应用于 百度 数据中心。 AMD全球副总裁兼大中华区总裁潘晓明表示:“AMD是同时拥有GPU和x86 CPU精深技术的公司,可以满足数据中心广泛需求,并帮助推动机器智能持续发展。AMD与百度的合作将利用两家公司的软件技术和工程上的能力,携手打造更全面的
[嵌入式]
AMD称随时都能开发手机GPU:非常有信心
早在2009年,AMD就把自己的手机GPU业务给卖给了高通,不过AMD始终没有放弃这块市场。据外媒报道,AMD RTG部门主管在接受PCWorld采访的时候透露,若时机合适,AMD立马就会投身手机GPU行业。AMD RTG部门主管表示,AMD对制造手机GPU非常有信心,但是需要在特定的情况下才可以实现。比如一旦跟合作伙伴达成了合作协议,或是签署了技术授 权,AMD立马就会投身手机GPU行业。 据了解,2009年,AMD就把自己的手机GPU业务给卖给了高通,使得高通Adreno GPU的性能暴增,同时也刺激了高通处理器的出货。 其实,AMD眼前就一个合作伙伴,那就是苹果。据知情人士透露,苹果正秘密研发GPU,并考虑将i
[手机便携]
被AMD抢夺GPU游戏市场 NVIDIA的Drive PX Pegasus开辟新道路
这款新产品加速了 NVIDIA 汽车领域的发展,Goldman 预计到2030年出租车/租车行业市场将达到2850亿美元。下面就随嵌入式小编一起来了解一下相关内容吧。 被AMD抢夺GPU游戏市场 NVIDIA的Drive PX Pegasus开辟新道路 据了解, NVIDIA 汽车业务是2018财年第二季度收入最小的贡献者,只有1.42亿美元。当 NVIDIA 明年开始供货Drive PX Pegasus,那么该部门的收入将会有大幅度增长。Drive PX Pegasus是展现NVIDIA野心的车载数据中心级处理器,适用于5级(全自动)无人驾驶出租车。在NVIDIA DRIVE PX平台现有的225家合作伙伴中,
[嵌入式]
ARM发布CORELINK 400系统IP,释放高性能CPU和GPU系统潜力
ARM公司今日在加州圣克拉拉举行的ARM技术大会上推出了CoreLink™ 400系列顺从ARMB® 4协议的系统IP,使得系统设计者能够完全发挥最新的CPU和GPU技术的全部潜力。CoreLink 400系列能够对SoC计算系统的性能和效率最大化,这也是先进的移动、消费和企业应用的需求。 CoreLink 400系列完美地补充了最新的ARM Mali™-T604和Cortex™-A15高性能处理器,后者是针对具有多核处理器簇的复杂SoC而设计的。CoreLink 400系统IP使得设计者能够解决多核一致性、虚拟机、延迟性以及功耗管理等关键问题,确保每一个处理器都能够分享内存资源,并将总体系统性能最大化。 A
[嵌入式]