Mythic公司公布模拟AI芯片战略,把所有东西放在内存里

发布者:快乐的成长最新更新时间:2019-10-14 来源: 半导体行业观察关键字:Mythic  AI芯片 手机看文章 扫描二维码
随时随地手机看文章
说到人工智能硬件,我们向来事无巨细。WikiChip密切关注的一家公司是Mythic。这家公司还没有完全公开他们的架构和产品,但一些细节已经开始慢慢浮出水面。在最近的人工智能硬件峰会上,该公司的创始人兼首席执行官Mike Henry绍了该芯片的最新情况。


这家位于奥斯汀的初创公司由Mike Henry和Dave Fick于2012年创立,最近完成了7000万美元的B轮融资,总融资额刚刚超过8500万美元。如今,公司员工已增至110人。

Mythic是一家模拟公司。但是,在我们探讨细节之前,必须指出,它们目前仅专注于推理,无论是在数据中心还是在边缘。到2024年,这两个市场的TAM(Total Available Market总体有效市场)

预计将达到250亿美元,这就是为什么这里有如此多的关注点的原因。从长远来看,Mythic计划针对大众市场的消费品和汽车产品。

把所有东西都放在芯片上,放在闪存里


随着模型准确性的提高,其大小也会随之增加。如今,模型达到了数亿个参数,甚至达到数十亿。最重要的是,通常实时地需要确定性行为,例如一致的帧速率和延迟。这就是Mythic的作用。Mythic的论点很简单:将足够的存储与大量并行计算单元打包在芯片上,以最大化内存带宽并减少数据移动的能力。但是有一个转变——这就是Mythic的原始方法的闪光点——该公司抛弃了传统的SRAM,转而使用更密集的闪存,此外,Mythic还计划在模拟环境下直接在内存中进行本地计算。

但是为什么是闪存?答案很简单:因为它密度大,功耗低,而且便宜,几乎比SRAM的密度大两个数量级。


理论上,Mythic的芯片更像内存,而不是传统的CMOS。从更长的路线图来看,随着SRAM  bit cell的扩展变得越来越困难,它带来的好处也越来越深远。总的来说,从每美元的性能、每单位成本的密度和每瓦特的性能来看,这是一个潜在的巨大胜利。


多年来,我们看到了一大堆路线图,当他们开始谈论未来10年的时候,很容易忽视它。但对Mythic来说,有一些不同之处。值得特别指出的是,目前Mythic正在研究40纳米的嵌入式闪存。他们有一个相当清晰的28nm和22nm的路径,因此,粗略地说,这个图的一半是基于今天已经发布的现有节点。


Mythic公司的首席执行官Mike Henry似乎相信他们可以继续这样做,但是尽管正在进行一些工作以继续扩展到16/14纳米节点,还不清楚它是否会上市。


许多业内人士认为,嵌入式闪存在22纳米的时候遭遇了瓶颈。在与Mythic的一次简短交谈中,他们告诉我们,他们并没有与嵌入式闪存结合,如果其中一项新兴技术(如多位ReRAM、PCM或NRAM)作为一种强大的替代技术出现,他们肯定会考虑迁移到这种技术。



IPU


Mythic的芯片被称为IPUs或智能处理单元。在外设方面,该芯片非常简单,由PCIe的x4通道和DNN平铺网格组成,PCIe是负责整个芯片管理的基本控制处理器。由于芯片的设计是为了存储整个模型,没有DRAM。

Mythic表示,由于这是一个基于tiles的设计,如果有需求,他们可以通过添加直接的音频/视频和各种其他接口来进一步定制。在去年的Hot Chip上,Mythic谈论的是一款5000万权值(weights)的初始产品。在最近的人工智能硬件峰会上,Mike Henry表示,初始产品权值将达到1.2亿,这比最初的计划要多很多。在富士通的40nm制程中,近标线全尺寸芯片应具有约300M权值的容量,因此120M仍然是一个相当大的芯片。

IPU的作用是作为一个连接到主机的PCIe加速器。对于大型模型或多个模型,可以使用多个IPU。模型最初被加载到IPU中,并保持静止。没有DRAM和编程闪存相对较慢,因此模型应该能够适应芯片与多个应用映射到同一芯片。这对于许多边缘应用程序来说非常典型。在正常操作下,主机CPU将数据发送到IPU,并通过PCIe端口接收结果。

IPU总体设计(WikiChip)


该芯片由DNN tiles构成网格。在一个tiles里面是一个模拟矩阵乘法器,它建立在一个巨大的嵌入式闪存池的顶部,用来计算权值。嵌入式闪存单元使用浮动栅极通过存储电荷、控制阈值电压来存储位。晶体管支持256级电导(G=1/R)之间的完全关闭和打开状态,Mythic用它来表示8位值。


通过将所有神经元的权值映射到闪光晶体管上,他们可以利用欧姆定律自然地进行矩阵乘法运算。实现的方法是使用闪光晶体管将权值表示为可变电阻。这在计算之前执行一次。使用8位DAC,输入矢量作为一组电压通过可变电阻。根据欧姆定律,输出电流是输入数据与权值向量(I = V x G)相乘的结果。最后,一组adc将产生的电流转换回数字值,成为输出矢量。ReLu和其他各种非线性操作也由adc在那个时间点完成。


围绕这个组件还有一些额外的逻辑。不管工作条件如何,DAC/ADC封装器都会进行补偿和校准,以获得精确的8位计算—类似于今天的图像传感器所做的工作。

模拟矩阵乘法(wikichip)


需要指出的是,这个方案没有实际的内存访问。矩阵相乘是在内存中完成的,利用欧姆定律,所以没有权值访问能量。使用固定权值时,也没有批量大小或其他特殊处理。虽然固定容量可能会带来一些问题。顺便说一下,它们支持神经元稀疏,但不支持权值稀疏性。


有趣的是,Mythic说,对于他们的第一代,为了加快开发和上市时间,他们不会使用DAC作为输入。相反,他们使用一个数字近似电路,由此分别计算每个输入位,然后累加结果。他们将在将来用DAC消除这种情况,这有望为他们提供一些很好的改善。
关键字:Mythic  AI芯片 引用地址:Mythic公司公布模拟AI芯片战略,把所有东西放在内存里

上一篇:当电子元件性能下降:如何保护您的模拟前端
下一篇:ADI全新集成24位ADC、有效降低成本并加快产品上市时间

推荐阅读最新更新时间:2024-11-03 13:02

上汽牵手AI独角兽地平线,上汽集团已大举进军芯片产业
牛年开工伊始,上海汽车集团股份有限公司乘用车公司(以下简称“上汽乘用车”)宣布,已于2月10日与智能芯片独角兽企业地平线(Horizon Robotics)达成全面战略合作,双方将依托各自在汽车、人工智能领域的核心优势,共同探索汽车智能化平线未来的高等级自动驾驶芯片成立联合团队,共同打造对标特斯拉FSD的下一代智驾域控制器和系统方案。 在人工智能与信息通信技术最新成果的推动下,全前沿技术,研发具有上汽集团品牌特色的智能化、网联化汽车产品,引领汽车智能化发展的趋势。未来,双方拟以智能域控制器和自动驾驶系统为切入点继续深化合作,并围绕地球汽车行业正全面向电动化、智能网联化的方向变革。在上汽集团“新四化”战略的指引下,上汽乘用车已成
[汽车电子]
上汽牵手<font color='red'>AI</font>独角兽地平线,上汽集团已大举进军<font color='red'>芯片</font>产业
2018的AI芯片:巨头的焦虑 “草莽”的狂欢
经过了2017年的巨头纷争,2018年的 AI 芯片 市场进入了百花齐放的局面。针对各种细分领域的 AI 芯片 不断出现,让整个市场展示了一种异样的活力。 老巨头们的焦虑   英伟达依然是 AI 芯片 业无可争议的领头羊。在全球领先的超算中,大部分有英伟达的GPU;全球AI的创业公司,大部分都在使用英伟达的芯片和软件进行开发。英伟达还在2018年发布了世界上最大的GPU DGX-2,量产了自动驾驶芯片Xaiver。但是,英伟达的股价在第四季度重挫54%,主要原因是挖矿热潮的减退,但侧面也说明了AI带来的泡沫逐渐在消退,英伟达在数据中心的业务表现没有达到预期。   另一家老牌的芯片巨头Intel,发力较晚,但也一直在奋力追
[安防电子]
马化腾:发达国家芯片AI领先
  今天,在 2018 年中国国际大数据产业博览会上,腾讯董事会主席马化腾在“数字经济”高端对话的论坛上表示,数字经济发展不单要看前端的应用,更要重视基础研究。目前发达国家在新 芯片 、人工智能、量子计算等遥遥领先,很可能在未来秒超过中国的数字化进程。下面就随网络通信小编一起来了解一下相关内容吧。   他表示,在数字经济方面,腾讯做了很多探索。这轮互联网崛起,中国在一些方面遥遥领先其国家,移动通信基础设施建设很快,资费一直在下降。微信支付和支付宝激烈竞争,也推动了正支付应用。但是数字经济不能看前头,还要看根基。当企业大了之后,开始更关注大环境发展。目前发达国家在基础研究方面,比如 芯片 、人工智能、量子计算等领域遥遥领先,别人很可
[网络通信]
中端手机喜迎人工智能,联发科推出8核12nm P22芯片
集微网消息,2018年5月23日,联发科技今天宣布推出面向主流市场的智能手机平台- 联发科技曦力P22(MediaTek Helio P22),首次将12nm先进工艺及AI应用带到大众价位的手机上。曦力 P22将进一步壮大联发科技曦力 P系列产品组合,满足日益增长的超级中端市场需求。 在此之前,联发科技于今年年初发布的12nm人工智能手机芯片- 曦力 P60,在中国、印度及东南亚市场已获得包括OPPO和VIVO在内的广大客户采用。在曦力 P60的成功基础上,曦力 P22将AI加速体验、卓越的相机功能,以及可靠高速的网络连接,以更合理的价格带给更多消费者。   “我们最新一代的曦力 P60芯片,在市场上引起强烈反响,表现超出我们的预
[手机便携]
CES 英特尔49量子位超导测试芯片/人工智能芯片同时发布
  最近被 芯片 安全问题搅得灰头土脸的 英特尔 公司终于有了喜讯。在第51届国际消费电子展(CES2018)上, 英特尔 公司公布了其未来计算技术(量子和神经形态计算)研发的里程碑式进展。下面就随嵌入式小编一起来了解一下相关内容吧。    英特尔 首席执行官布莱恩·科兹安尼克在主题演讲中宣布,已成功设计、制造和交付人们翘首以盼的49量子位超导测试 芯片 Tangle Lake。Tangle是美国阿拉斯加的一串湖的名称,而其本意则为“纠缠”,命名Tangle具有两重意义,寓意为量子位发挥作用所要求的极冷温度和纠缠态。   Tangle Lake 芯片 代表了英特尔在开发完整量子计算系统上取得的重大进展——从架构到算法乃至电子控制
[嵌入式]
联发科芯片欲借助AI 重新杀回高端手机市场
IT之家12月31日消息 根据Digitimes的说法,联发科正在寻求将其芯片放入高端智能手机中的机会。昨天发布的一份报告称,这家台湾芯片厂商一直在与苹果,三星和小米等智能手机制造商进行对话,寻求“商业合作机会”。   多年来,联发科已与厂商们合作开发各种芯片,如光存储芯片、DVD播放器芯片、电视芯片、功能手机芯片和智能手机芯片,均具有高性价比。   联发科在移动芯片解决方案的开发方面的表现优于大多数同行,其长期保守的做法是为低端应用领域提供更高端的解决方案以赢得更多客户的支持,但这存在一个问题——这种做法始终无法让联发科站稳高端市场。   这也可以解释为什么联发科被迫暂时停止推出用于高端智能手机的Helio X系列处理器。
[手机便携]
联发科<font color='red'>芯片</font>欲借助<font color='red'>AI</font> 重新杀回高端手机市场
清微智能全球首款可重构超低功耗语音AI芯片开始量产
最近,脱胎于清华大学微电子所Thinker团队的AI芯片创企清微智能迎来新进展: 全球首款可重构超低功耗语音人工智能(AI)芯片TX210已实现规模化量产,于6月中旬正式交付市场,而此时清微智能距成立还不到1年。 这是一款语音SoC芯片,针对手机、可穿戴设备、智能家居等多种应用场景的智能终端产品开发,工作功耗不超过2mW,语音活动检测(VAD)功耗小于100uW,延时不到10ms。 清微智能,拆开来,就是清华、微电子、人工智能,也就代表了这家公司的定位——专注可重构计算芯片,提供以端侧为基础,并向云侧延伸的芯片产品及解决方案。 其核心技术团队来自清华微电子学研究所(以下简称微电子所),其芯片所采用的架构正是中国芯片
[物联网]
清微智能全球首款可重构超低功耗语音<font color='red'>AI</font><font color='red'>芯片</font>开始量产
微软首款定制 AI 芯片,Maia 100 更多规格公开
8 月 30 日消息,微软公司出席 Hot Chip 2024 大会,分享了 Maia 100 芯片的规格信息。Maia 100 是台积电 5nm 节点上制造的最大处理器之一,专门为部署在 Azure 中的大规模 AI 工作负载而设计。 附上 Maia 100 芯片规格如下 芯片尺寸:820 平方毫米 封装:采用 COWOS-S 夹层技术的 TSMC N5 工艺 HBM BW/Cap;1.8TB/s @ 64GB HBM2E 峰值密集 Tensor POPS: 6bit: 3,9bit: 1.5, BF16: 0.8 L1/L2:500MB 后端网络 BW:600GB/s(12X400gbe) 主机 BW(PCI
[嵌入式]
微软首款定制 <font color='red'>AI</font> <font color='red'>芯片</font>,Maia 100 更多规格公开
小广播
最新模拟电子文章
换一换 更多 相关热搜器件
随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved