为AI注入了一个大心脏,Mythic公司模拟矩阵处理器问市

发布者:时光如梦最新更新时间:2020-11-25 来源: 半导体行业观察关键字:Mythic  AI芯片 手机看文章 扫描二维码
随时随地手机看文章

领先的模拟AI处理器公司Mythic日前宣布,公司正式推出业界首款模拟矩阵处理器(Mythic AMP™)M1108 AMP。按照他们的说法,这个新产品的发布预示了AI激动人心的新纪元,因为它首次提供了一种模拟计算解决方案,该解决方案可实现一流的性能和性能,并且其精度可与数字设备媲美。 


See the source image

报道指出,M1108 AMP能为边缘部署提供了无与伦比的可能性,应用市场包括智能家居,AR / VR,无人机,视频监控,智能城市以及工厂车间的自动化。凭借其革命性的技术,M1108 AMP处于AI处理重大新趋势的最前沿。

 

报道指出,M1108集成了108个AMP tiles ,每个tiles都配有一个Mythic模拟计算引擎(MythicACE™),该引擎具有闪存单元、ADC阵列、32位的RISC-V处理器、SIMD矢量引擎,SRAM和一个高吞吐量的片上网络(NOC)路由。


此外,四个控制tiles为系统主机处理器提供了高带宽PCIe2.0接口。M1108具有108个AMP tiles,可提供高达35万亿次/秒的运算(TOPS),可在单个芯片上以高效率、低延迟地高效执行复杂的AI模型(例如ResNet-50,YOLOv3和OpenPoseBody25)。在峰值吞吐量下运行复杂的AI模型时,M1108的典型功耗约为4W。而且,凭借利用成熟的40nm技术的固有成本优势,并且不需要任何外部DRAM或SRAM,M1108 AMP将以PCIe M.2和PCIe卡形式提供,并且M1108PCIe评估套件可应要求提供。


模拟AI芯片怎么玩?Mythic详细讲述



说到人工智能硬件,我们向来事无巨细。WikiChip密切关注的一家公司是Mythic。这家公司还没有完全公开他们的架构和产品,但一些细节已经开始慢慢浮出水面。在最近的人工智能硬件峰会上,该公司的创始人兼首席执行官Mike Henry)绍了该芯片的最新情况。


这家位于奥斯汀的初创公司由Mike Henry和Dave Fick于2012年创立,最近完成了7000万美元的B轮融资,总融资额刚刚超过8500万美元。如今,公司员工已增至110人。


Mythic是一家模拟公司。但是,在我们探讨细节之前,必须指出,它们目前仅专注于推理,无论是在数据中心还是在边缘。到2024年,这两个市场的TAM(Total Available Market总体有效市场)


预计将达到250亿美元,这就是为什么这里有如此多的关注点的原因。从长远来看,Mythic计划针对大众市场的消费品和汽车产品。


把所有东西都放在芯片上,放在闪存里



随着模型准确性的提高,其大小也会随之增加。如今,模型达到了数亿个参数,甚至达到数十亿。最重要的是,通常实时地需要确定性行为,例如一致的帧速率和延迟。这就是Mythic的作用。Mythic的论点很简单:将足够的存储与大量并行计算单元打包在芯片上,以最大化内存带宽并减少数据移动的能力。但是有一个转变——这就是Mythic的原始方法的闪光点——该公司抛弃了传统的SRAM,转而使用更密集的闪存,此外,Mythic还计划在模拟环境下直接在内存中进行本地计算。


但是为什么是闪存?答案很简单:因为它密度大,功耗低,而且便宜,几乎比SRAM的密度大两个数量级。



理论上,Mythic的芯片更像内存,而不是传统的CMOS。从更长的路线图来看,随着SRAM bit cell的扩展变得越来越困难,它带来的好处也越来越深远。总的来说,从每美元的性能、每单位成本的密度和每瓦特的性能来看,这是一个潜在的巨大胜利。


多年来,我们看到了一大堆路线图,当他们开始谈论未来10年的时候,很容易忽视它。但对Mythic来说,有一些不同之处。值得特别指出的是,目前Mythic正在研究40纳米的嵌入式闪存。他们有一个相当清晰的28nm和22nm的路径,因此,粗略地说,这个图的一半是基于今天已经发布的现有节点。


Mythic公司的首席执行官Mike Henry似乎相信他们可以继续这样做,但是尽管正在进行一些工作以继续扩展到16/14纳米节点,还不清楚它是否会上市。



许多业内人士认为,嵌入式闪存在22纳米的时候遭遇了瓶颈。在与Mythic的一次简短交谈中,他们告诉我们,他们并没有与嵌入式闪存结合,如果其中一项新兴技术(如多位ReRAM、PCM或NRAM)作为一种强大的替代技术出现,他们肯定会考虑迁移到这种技术。



IPU


Mythic的芯片被称为IPUs或智能处理单元。在外设方面,该芯片非常简单,由PCIe的x4通道和DNN平铺网格组成,PCIe是负责整个芯片管理的基本控制处理器。由于芯片的设计是为了存储整个模型,没有DRAM。


Mythic表示,由于这是一个基于tiles的设计,如果有需求,他们可以通过添加直接的音频/视频和各种其他接口来进一步定制。在去年的Hot Chip上,Mythic谈论的是一款5000万权值(weights)的初始产品。在最近的人工智能硬件峰会上,Mike Henry表示,初始产品权值将达到1.2亿,这比最初的计划要多很多。在富士通的40nm制程中,近标线全尺寸芯片应具有约300M权值的容量,因此120M仍然是一个相当大的芯片。


IPU的作用是作为一个连接到主机的PCIe加速器。对于大型模型或多个模型,可以使用多个IPU。模型最初被加载到IPU中,并保持静止。没有DRAM和编程闪存相对较慢,因此模型应该能够适应芯片与多个应用映射到同一芯片。这对于许多边缘应用程序来说非常典型。在正常操作下,主机CPU将数据发送到IPU,并通过PCIe端口接收结果。


IPU总体设计(WikiChip)


该芯片由DNN tiles构成网格。在一个tiles里面是一个模拟矩阵乘法器,它建立在一个巨大的嵌入式闪存池的顶部,用来计算权值。嵌入式闪存单元使用浮动栅极通过存储电荷、控制阈值电压来存储位。晶体管支持256级电导(G=1/R)之间的完全关闭和打开状态,Mythic用它来表示8位值。


通过将所有神经元的权值映射到闪光晶体管上,他们可以利用欧姆定律自然地进行矩阵乘法运算。实现的方法是使用闪光晶体管将权值表示为可变电阻。这在计算之前执行一次。使用8位DAC,输入矢量作为一组电压通过可变电阻。根据欧姆定律,输出电流是输入数据与权值向量(I = V x G)相乘的结果。最后,一组adc将产生的电流转换回数字值,成为输出矢量。ReLu和其他各种非线性操作也由adc在那个时间点完成。


围绕这个组件还有一些额外的逻辑。不管工作条件如何,DAC/ADC封装器都会进行补偿和校准,以获得精确的8位计算—类似于今天的图像传感器所做的工作。


模拟矩阵乘法(wikichip)


需要指出的是,这个方案没有实际的内存访问。矩阵相乘是在内存中完成的,利用欧姆定律,所以没有权值访问能量。使用固定权值时,也没有批量大小或其他特殊处理。虽然固定容量可能会带来一些问题。顺便说一下,它们支持神经元稀疏,但不支持权值稀疏性。


有趣的是,Mythic说,对于他们的第一代,为了加快开发和上市时间,他们不会使用DAC作为输入。相反,他们使用一个数字近似电路,由此分别计算每个输入位,然后累加结果。他们将在将来用DAC消除这种情况,这有望为他们提供一些很好的改善。


关键字:Mythic  AI芯片 引用地址:为AI注入了一个大心脏,Mythic公司模拟矩阵处理器问市

上一篇:解剖GPU和CPU,他们俩的区别到底在哪
下一篇:CIS:摄像头繁荣的背后推手

推荐阅读最新更新时间:2024-11-18 18:49

瑞芯微跻身AI芯片阵营,2018年有望享受人工智能市场红利
人工智能迎来了新一轮的爆发,结合人工智能的产业应用已经从技术突破阶段,向商业化阶段加速迈进,人工智能的市场红利正在到来。人工智能技术的突破,让计算从云端向边缘端、设备前端迁移,前端要具备智能感知和智能认知的能力,这种改变对于AI芯片的应用支持将尤为重要。 而在人工智能这一轮产业契机中,全球AI产业链的芯片、IP、算法以及终端等厂商都在摩拳擦掌,携手推出集成本、性能和功耗最优的人工智能芯片,加速人工智能终端应用落地与产业爆发。日前,人工智能算法厂商阅面科技在深圳举行“人工智能视觉产业创新应用论坛”,并宣布将世界领先的自研算法IP集成至瑞芯微RV1108芯片,用于官方开发套件,这意味着瑞芯微也正式跻身AI芯片阵营。 阅面AI
[手机便携]
瑞芯微跻身<font color='red'>AI</font><font color='red'>芯片</font>阵营,2018年有望享受<font color='red'>人工智能</font>市场红利
谷歌母公司首个AI芯片投资:初创公司获5600万美元融资
集微网消息,据美媒CNBC报道,由谷歌母公司Alphabet的风险投资部门--Google Venture(GV)领衔,初创公司SambaNova System获得5600万美元的A轮融资。 SambaNova是一家生产计算器处理器以及人工智能和数据分析软件的公司。 这是GV首次对人工智能芯片公司进行投资。 SambaNova Systems于去年11月成立,现有超过50名员工,这些员工来自不同的地方。该公司是一家生产计算机处理器及AI和数据分析软件的初创企业。   谷歌首席执行官桑德尔路皮查伊(Sundar Pichai)和其他高管经常坚称,谷歌是一家“AI至上”的公司。该公司向开发企业销售人工智能服务,并依靠它将特殊功能应用于
[手机便携]
AI芯片,国产发展如何了?
10月17日夜间,美国又开始收紧制裁了,引发行业众怒。 一方面,在AI芯片禁令中加入了三条新规: 把性能密度作为出口管制标准,即单芯片超过300teraflops算力/性能密度超过每平方毫米370 gigaflops芯片都会禁止,同时,英伟达A100/A800/H800/H800/L40/L40S/RTX4090、英特尔Gaudi 2、AMD计划的中国版GPU等特供版AI芯片的供应; 先进芯片出口许可范围扩大到40多个国家; 对21个国家提出芯片制造设备许可要求,全面限制中国的14nm以下先进芯片制造能力。 另一方面,将壁仞、摩尔线程等国产AI芯片公司列入实体清单。 美国的疯狂程度令人咋舌,连比H100效率低十
[半导体设计/制造]
<font color='red'>AI</font><font color='red'>芯片</font>,国产发展如何了?
黄仁勋再抛“核弹头”:人工智能怪兽芯片炸翻业界
  “我是创作者……我是保护者……我是治愈者……”   伴随着一段几句科幻感的宣传片,一个机械女声宣告了自己的身份,“I AM AI”(我是人工智能)。欢迎刚落,身穿皮衣的黄仁勋登上了舞台,台下的开发者、研究员、创业者们,掌声雷动。   在这个 T恤和套头衫为主的科技世界里,黄仁勋绝对是个另类:和大多数极客型创始人不同,工程师出身又负责过市场的他更像一个摇滚明星,皮衣是他的标志性穿着,再加上极富煽动性的演讲能力,他是一个身上有着刺青的“叛逆” CEO。也只有这样的人,才能让自己在1993年成立的“老牌”公司,以及从事的并不性感的芯片产业,一次有一次站在聚光灯前沿。而现在,他又率先把下个世代的科技命脉——人工智能,握在了手
[网络通信]
黄仁勋再抛“核弹头”:<font color='red'>人工智能</font>怪兽<font color='red'>芯片</font>炸翻业界
国产汽车半导体极限突围
今年是 新能源汽车 的幸运年。数字化转型趋势下,新能源汽车率先走出疫情阴影,产销量节节攀升,上市公司股价疯涨。特斯拉市值约 6000 亿美元,超过丰田、通用和福特的总和,国内造车新势力蔚来 6 月登陆美股以来股价涨超 1200%,市值也超过奔驰、通用这些百年车企。 新能源汽车的崛起,让汽车行业向电动化、智能化、互联化转型大大提速,这意味着车用 半导体 价值将会大幅提升,推动全球车用半导体需求加速增长。 中国是全球最大新能源汽车市场,产销量连续五年位居世界首位,累计推广的新能源汽车超过了 450 万辆,占全球的 50%以上。自然中国也是全球最大的汽车半导体需求市场,不过遗憾的是,国内汽车半导体供应严重依赖进口。 芯片短缺考验来袭
[汽车电子]
华为发布世界首款内置人工智能的手机芯片
    新浪手机讯 9月2日晚间消息,华为在2017年度IFA柏林国际消费电子产品展上公布其最新的麒麟970芯片,世界首款带了专用人工智能元素的手机芯片。   10纳米架构   这颗芯片采用台积电10纳米工艺,ARM的big.LITTLE大小多核架构,八核心芯片,有4个A73大核心(2.4Ghz)+4个A53小核心(1.8Ghz)。 麒麟970在不到100平方毫米的狭小体积内集成了55亿个晶管体,集成度非常高;对比一下对手:高通目前的旗舰芯片骁龙835是31亿颗,苹果A10则是33亿颗。   另外,麒麟970还集成了12核心的GPU图形显示芯片,即ARM Mali-G72 MP12十二核GPU,改善了过去麒麟芯片图形性能较弱问题。
[半导体设计/制造]
华为注册全面屏商标Mate 10首发,或搭载AI 芯片
电子网8月4日综合报道,此前余承东曾透露华为Mate 10有着惊艳的全面屏设计。据国外网站Androidheadlines最新报道称,本周华为向欧盟知识产权局(EUIPO)提交了“EntireView Display”的注册商标申请,而EntireView Display则可以翻译成“全面屏”。这个商标的批准预计会在今年秋季早些时候完成,再加上昨日有国外媒体爆料称,华为Mate 10定于10月16日在德国慕尼黑发布。这无疑告诉我们,Mate 10将成为华为搭载全面屏的首款机型。 据外媒报道,届时华为将带来两款产品,分别是标准版Mate 10和较便宜的Mate 10 Lite,参考价格约合人民币3738元,而Mate 10的参考
[手机便携]
麒麟970和苹果A11处理器横评:AI芯片首战
在 IFA 2017上 华为 推出了麒麟 970 芯片。在这块芯片中搭载了一颗用于神经元计算的独立处理单元,英文名 Neural Network Processing Unit,简称 NPU。   搭载NPU的麒麟 970 芯片     2017年9月12日, 苹果 发布了三款手机,iPhone8、iPhone 8P和iPhone X。从外在看这三款手机的差异还是很大,但在内在这三款手机有一个共同的“ 黑科技 ”,那就是苹果称之为“仿生处理器”A11处理器。   仿生处理器A11   在这两场发布会上,两家公司在介绍这两款芯片的时候不约而同的都采用了“吊打CPU”的思路,用以强调这块芯片所带来的性能的提升。但华为的NPU和
[嵌入式]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved