人工智能引发能源问题,我们该怎么办?(一)
内核=30%
内部存储器(L1、L2、L3)=30%
外部存储器(DDR)=40%
设计高效加速器是多维度的设计问题
- 如何实现硬件优化来处理我们的特定算法?(Mark很好地回答了这一问题,即必须将算法从“所有算法的空间”移动到“受限空间”。)
- 如何保持携带数据的加速器,以确保计算加速器在每个时钟周期都是饱和的?
- 如何最大限度地减少通信开销?
- 如何优化正在处理的运算符的动态范围?
- 如何最大限度地减少外部存储器,甚至是本地存储器的使用?
- 如何消除指令处理管道开销?
- 如何安排操作以确保数据重用,从而使存储器流量最小化,并且使存储器访问相关的运算数量最大化?
自适应硬件的战略优势这里,我们将讨论和评估赛灵思的自适应硬件及DNNDK如何应对上述这些尖锐的问题和挑战,特别是当它涉及到机器学习推断时。在进行下一次设计之前,我建议您回顾一下Mark有关这个主题的精彩演讲,然后再考虑如何在您的下一次设计中使用自适应硬件来实现您的战略优势。
在这篇文章的第2部分中,我们将讨论和评估赛灵思的自适应硬件及DNNDK(现在已经发布Vitis AI统一软件平台)如何应对这些挑战,特别是当它涉及到机器学习推断时。
To be continued......
本文转载自:赛灵思
作者:Quenton Hall,赛灵思公司工业、视觉、医疗及科学市场的 AI 系统架构师
免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理。
贸泽电子(Mouser Electronics)是一家全球授权半导体和电子元器件授权分销商,帮助超过800家业界领先制造商销售产品。我们提供的产品种类齐全,可订购500多万种在线产品,将新产品和新技术第一时间提供给设计工程师和采购人员。欢迎关注我们,获取第一手的设计与产业资讯信息!