光子张量CPU:迸发5G机器学习新活力

发布者:EEWorld资讯最新更新时间:2020-07-29 来源: EEWORLD关键字:光子张量CPU  5G  AI  ML 手机看文章 扫描二维码
随时随地手机看文章

翻译自——EEtimes

 

近期,一种用光子张量处理器代替GPU来进行机器学习的神经网络计算的新方法表明,在处理光学数据传输的性能上可以提高2-3阶。这也表明光子处理器具有增强电子系统的潜力,并可能在5G网络边缘设备中表现强劲。

 

 

美国乔治华盛顿大学电子和计算机工程系的Mario Miscuglio和Volker Sorger在《应用物理评论杂志》上发表了一篇论文,题为《基于光子的处理单元使更复杂的机器学习成为可能》。

 

在他们的方法中,光子张量核并行执行矩阵乘法,这提高了深度学习的速度和效率。在机器学习中,神经网络被训练来学习如何在不可见的数据上执行无监督的决策和分类任务。一旦神经网络对数据进行了训练,它就可以产生一种推断,从而对对象和模式进行识别和分类,并在数据中找到一个特征。

 

光子TPU并行存储和处理数据,具有电光互连的特点,可以有效地读写光存储器,并与其他架构进行接口。

 

作者之一Mario Miscuglio表示:“我们发现集成了高效光存储的集成光子平台可以获得与张量处理单元相同的操作,但它们只消耗一小部分的功率,并具有更高的吞吐量,如果经过适当的训练,可以用于以光速进行推理。”

 

大多数神经网络旨在模仿人类大脑的多层相互连接的神经元。表示这些网络的一种有效方法是将矩阵和向量相乘的复合函数。这种表示方式允许通过专门用于向量化操作(如矩阵乘法)的架构来执行并行操作。

 

Photonic tensor core and dot product engine

 

(a)光子张量核(PTC)由一个16点积引擎组成,内在独立地逐列逐行逐点乘法和累加。点积引擎执行两个向量之间的乘法。输入矩阵的第i行由由高速(如马赫-曾德尔)调制器调制的波分复用信号给出。通过适当设置核矩阵的权值状态,将核矩阵的第j列加载到光子存储器中。利用光-物质与相变存储器的相互作用,利用微环谐振器(MRR)对输入信号进行频谱滤波,并采用看似量子化的电吸收方案进行加权。(例如调幅),从而执行按元素进行的乘法。使用光检测器将元素式乘法非相干求和,这相当于MAC操作(Dij)。

 

任务越智能化,预测精度就越高,网络就越复杂。这样的网络需要更大的计算量和更大的处理能力。当前适合于深度学习的数字处理器,如图形处理单元(GPU)或张量处理单元(TPU),由于所需的功率以及处理器和存储器之间电子数据的缓慢传输,在执行更复杂、更精确的操作方面受到了限制。

 

研究人员表明,他们的TPU性能可以比电子TPU高出2-3个数量级。对于计算节点分布式网络和在网络边缘(如5G)执行高吞吐量智能任务的引擎来说,光子可能是一个理想的匹配。在网络边缘,数据信号可能已经以来自监控摄像机、光学传感器和其他来源的光子的形式存在。

 

Miscuglio:“光子专用处理器可以节省大量的能源,提高响应时间并减少数据中心的流量。”对于终端用户来说,这意味着处理数据的速度要快得多,因为数据的很大一部分是预处理的,这意味着只需要将其余部分数据发送到云或数据中心。

 

光与电的较量

 

本文给出了利用光路完成机器学习任务的实例。在大多数神经网络(NNs)中,每一个神经元和每一层,以及网络的互连,都是训练网络的关键。根据训练,在其连通层中,神经网络强烈依赖于向量矩阵的数学运算,其中输入数据和权重的大矩阵根据训练相乘。复杂的、多层的深层神经网络需要大量的带宽和低延迟,以满足执行大矩阵乘法所需的大量操作,而不牺牲效率和速度。

 

那么如何有效地将这些矩阵相乘呢?对于通用处理器,矩阵操作在需要连续访问缓存内存的情况下串行进行,从而产生冯·诺依曼瓶颈[1]。而GPU和TPU等特殊的架构,有助于减少这些冯·诺依曼瓶颈的影响,使一些有效的机器学习模型成为可能。

 

与CPU相比,GPU和TPU意义重大,但是当用它们来实现深度神经网络对大型2维数据集(如图像)执行推断时,可能会耗电,并且需要更长的计算运行时间(大于几十毫秒)。对于不那么复杂的推理任务来说,更小的矩阵乘法仍然受到不可忽略的延迟挑战,主要是由于各种内存层次的访问开销和GPU中执行每条指令的延迟。

 

作者建议,在这种情况下,有必要探索和重新研发当前逻辑计算平台的操作范式,在这种逻辑计算平台中,矩阵代数依赖于对内存的连续访问。在这方面,光的波动性质和相关的固有操作,如干涉和衍射,可以在提高计算吞吐量和同时降低神经形态平台的功耗方面发挥重要作用。

 

他们建议未来的技术应该在其随时间变化的输入信号所在的领域执行计算任务,并利用其内在的物理操作。在这个观点中,光子是计算节点分布式网络和在网络边缘(如5G)对大数据执行智能任务的引擎的理想匹配,其中数据信号可能已经以光子的形式存在(如监控摄像头、光学传感器等),从而预先过滤和智能调节允许向下游流向数据中心和云系统的数据流量。

 

在这里,他们探索了利用光子张量核(PTC)的方法,该方法能够与训练好的核进行一次性的4乘4矩阵的(非迭代的)和完全被动的乘法和积累。换句话说,一旦NN被训练,权重被存储在一个4位的多层光子存储器中,直接在芯片上实现,而不需要额外的电光电路或芯片外DRAM。该光子存储器具有低损耗、相变、纳米光子电路的特点,其基础是将G2Sb2Se5的导线沉积在一个平面波导上,可以使用电热开关进行更新,并且可以完全通过光学读取。电热开关是由夹住相变存储器(PCM)导线的钨加热电极实现。

 

 

作者表示,这项工作代表了实现并行存储数据和处理的光子张量处理器的第一种方法,与提供实时分析的最先进的硬件加速器相比,它可以将相乘累积(MAC)操作的数量提高几个数量级,同时显著降低功耗和延迟。

 

与依赖逻辑门的数字电子学不同,在集成光子学中,乘法、积累和更一般的线性代数运算可以固有地、非迭代地执行,得益于信号的电磁特性和有效的光物质相互作用所提供的内在并行性。在这方面,集成光子学是一个理想的平台,映射特定的复杂操作一对一到硬件,在某些情况下算法,实现时间复杂度。

  

 


[1] 冯·诺依曼架构为计算机大提速铺平了道路,却也埋下了一个隐患:在内存容量指数级提升以后,CPU 和内存之间的数据传输带宽成为了瓶颈。


关键字:光子张量CPU  5G  AI  ML 引用地址:光子张量CPU:迸发5G机器学习新活力

上一篇:为物联网产品上市提速,安富利MaaXBoard Mini单板计算机问市
下一篇:矽典微百毫瓦级超低功耗毫米波传感器SoC问市

推荐阅读最新更新时间:2024-11-04 20:19

对话爱立信CTO Erik Ekudden:回答关于5G的一切疑问
  随着信息、媒体与通信技术的不断融合,传统大型电信服务供应商需要采取哪些措施才能及时跟进时代的变化脚步?在寻求参与、保留并扩大市场份额的过程当中,电信服务供应商要如何通过技术开发提升自身优势,从而迎合企业在数字化潮流中的需求与渴望?下面就随网络通信小编一起来了解一下相关内容吧。   带着这些问题我们采访了爱立信集团CTO Erik Ekudden,希望了解他对相关问题的看法以及 5G 技术将在数字化时代下如何扮演企业业务中的核心枢纽角色…… 爱立信集团CTO Erik Ekudden   问:过去几年当中,我们迎来了一系列革命性潮流——这一点在技术层面体现得尤为突出。事实上,在数字化转型时代之下,多数企业都将受到重大影响
[网络通信]
华为徐直军:AI已成为通用技术,将改变每个行业
C114讯 10月20日消息(岳明)曾几何时,人工智能只是科幻小说中描绘的图景。如今,随着新一轮科技革命和产业变革的推动,人工智能的一些应用正在日益改变我们的生活,人类已经进入“智能时代”。 在日前举某公开场合上,华为轮值CEO徐直军表示,尽管人工智能还处于初级阶段,但是它作为一个通用技术对于各个企业、各个行业所带来的冲击将是巨大的。为了解决企业、行业及消费者的种种困惑,加速人工智能落地,华为推出了企业智能平台和移动人工智能战略。 新一轮复兴,人工智能颠覆各行各业 虽然,现在对人工智能没有一个准确的定义,但并不妨碍人工智能这种新的通用技术在各行各业中的渗透。 据了解,在70年代,以及80年代末至90年代初,人工智能
[手机便携]
由于Covid-19停工和转向家庭工作,FWA设备出货量的全球增长
由于Covid-19停工和转向家庭工作,FWA设备出货量的全球增长 由于LTE和基于5G的服务的可用性越来越广泛,预计2021年4G/5G FWA CPE出货量的增长将加速 英国伦敦-2021年9月9日- 全球移动供应商协会(GSA)今天发布了其首次GSA4G/5G FWA论坛设备生态系统调查的结果。 根据来自基于3GPP的FWA CPE生态系统的25家设备供应商的数据,该数据显示出强劲的市场势头,与2020年相比,2021年的出货量增长预计将继续并加速,4G/5G FWA CPE增长31%,电池供电热点增长23%。 在2020中,亚太地区(不包括中国和印度)占出货量的最大部分,紧随其后的是中东和非洲,然后是欧洲。 该协会
[网络通信]
苹果正式迈入5G,iPhone12 终亮相
“当我们竞争对手还在正向追赶我们去年的芯片水平时,我们仍然领先几代。” 苹果在今天北京时间凌晨1点开始的发布会上说的这句话,狂音绕梁,比夜间盘旋在头顶的蚊子还要持久和嚣张。 “去年发布的A13仿生依然是智能手机中最快的芯片,不过这即将改变,我们世界级芯片团队研发了一款全新的芯片——A14仿生,史上最快的智能手机芯片。” 这句话的意思很明显,打败我的只有我自己。 毕竟苹果是台积电最大客户,且不存在被禁止供货一说,稳坐智能手机芯片第一的宝座,大腿抖到宇宙尽头都没有人打扰。本次发布会,苹果也带来了不少硬件上的升级,我们首先从A14仿生芯片说起。 A14仿生——苹果的大腿 显然,苹果所有骄傲的源头都来自这款A
[手机便携]
苹果正式迈入<font color='red'>5G</font>,iPhone12 终亮相
5G不等于Wi-Fi,万物互联的安全性如何保障
物联网是整个人类最庞大的系统工程,这个庞大的系统工程建立在诸多先进科技之上,诸如数据计算、无线连接、智能传感等。作为物联网的关键一环,无线连接是物物互联的桥梁,因此诸多无线连接技术的突破保障了物联网的大规模应用。 物联网倡导万物互联,相比于有线技术的束缚,无线技术在诸多应用场景中具有非常明显的优势。在智能工业、智能农业、智能交通、智能电网、智能家居、智能城市、车联网等多个信息化应用,机器类通信对无线网络的基本需求集中在巨量终端接入、超低时延,高效连接,低成本、低功耗,超可靠,全地域覆盖几个方面。物联网应用涉及的连接技术要求最重要的几点就是:低功耗以确保续航能力高、高速率以实现更高性能的智能化应用,低时延以确保接近实时性的数据传
[网络通信]
<font color='red'>5G</font>不等于Wi-Fi,万物互联的安全性如何保障
莱迪思扩展其ORAN解决方案集合,通过集成5G小基站助力下一代无线基础设施
莱迪思扩展其ORAN解决方案集合,通过集成5G小基站桥接功能助力下一代无线基础设施 将高效的PCIe®添加到JESD接口桥接,为5G数据链路应用提供低功耗加速 中国上海——2024年3月20日——莱迪思半导体,低功耗可编程器件的领先供应商今日宣布更新莱迪思ORAN™解决方案集合, 最新版本具有低功耗和灵活的桥接能力,支持集成式5G小基站 。通过此次更新,莱迪思推出了面向室外集成无线应用的全新5G数据链路参考设计,帮助客户推进其面向智能工厂、智慧城市、智能汽车等领域的下一代无线基础设施。 莱迪思半导体市场营销和业务发展副总裁Matt Dobrodziej 表示:“5G小型蜂窝市场需求不断增长,推动了对可编程、低功耗和低延迟
[网络通信]
2018北美CES展高端技术产品前瞻 人工智能唱响主旋律
据外媒报道,丰田、本田、日产及本次等将在本月的拉斯维加斯CES展上展出多项高端技术。 车展一般是车企展示最新车型和短期产品计划细节的基础平台,而CES则逐渐成为未来技术发布的论坛。借此,佛吉亚将展示一款自动驾驶汽车内饰概念设计,而中国初创公司拜腾汽车将展出旗下首款车型。 2017年,FCA旗下Portal minivan概念车和丰田人工智能辅助系统Yui等都相继与技术和汽车公司展开合作。而今年,福特、英伟达、英特尔和百度等都将在此次展览上展示最新科技。 以下则是本届CES展上值得期待的产品: 本田 3E概念机器人 本田并不是人形机器人领域的陌生人,并且将在本届的展览上展出多款像是从皮克斯电影里走出来的机器人。3E概念机器人
[汽车电子]
芯科科技2024年Works With开发者大会登陆上海,物联网和人工智能的变革性融合带来无限精彩
谷 歌、三星等生态大厂将带来重磅演讲和圆桌讨论,亦可切身体验多样化无线技术实作 中国,北京 – 2024年9月25日 – 安全、智能无线连接技术领域的全球领导厂商Silicon Labs(亦称“芯科科技”),正在以更大规模举办其年度行业盛会——2024年Works With开发者大会。 今年的大会包括在全球各地的多场地区性实体活动,芯科科技针对中国特别在10月24日选择了上海作为举办地,将邀请来自全球的商业领袖、设备制造商、无线技术专家、开发人员和工程师齐聚一堂,聚焦物联网(IoT)和人工智能(AI)的变革性融合,探讨和分析物联网在数智化转型中为全球和中国的创新者带来的重要机会,并分享和探索物联网生态、无线通信先进技术的最
[网络通信]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved