本文作者:赛灵思(Xilinx)CTO Ivo Bolsens
芯片架构的发展正在加速,因此采用正确的工具来完成正确的工作至关重要。
世界变得越来越智能。从口袋里的智能手机到当今管理交通和运输系统的智慧城市,人工智能几乎遍及每个行业,并正在影响我们的日常生活。人工智能产生了大量非结构化数据,这些数据通常必须实时进行管理和处理。对硬件的需求猛增,越来越依赖芯片架构的创新来提供必要的性能改进以跟上步伐。
摩尔定律的持续改进需要数千名工程师、数百家公司、数百亿的研发来实现,人工智能芯片同样如此,这不是一个适合所有应用的单一规格,也不会是一个公司或芯片架构占主导的市场。
那么,您的硬件如何适应AI处理的不断增长的需求?答案是域特定体系结构(DSA)。DSA是计算的未来,其中定制了硬件以运行特定的工作负载。DSA使计算,内存带宽,数据路径和I/O与应用程序工作负载的特定需求紧密匹配。与通用CPU和GPU架构相比,这提供了更高水平的处理效率。
ASIC的缺点
可以使用专用的芯片来构建DSA,但是这样做可能会有缺点。首先,我们希望的关键部分是对更快,更好,更便宜以及更早满足需求。为了跟上创新的步伐,制造商在比以往更短的时间内创建并提供创新服务。更具体地说,比设计和构建新的基于ASIC的DSA所需的时间更少。这在加速创新的市场需求与设计和构建ASIC所花费的时间之间造成了市场错位。
其次,ASIC很难做。设计高级节点ASIC的复杂性呈指数增长,大大增加了风险。一个小的错误可能会产生巨大的影响,其中至少包括非经常性工程(NRE)成本。例如,7nm时,仅在NRE中,ASIC的成本就高达数亿美元,随着器件几何尺寸缩小至5nm甚至更高,成本还会进一步上升。
第三,ASIC实现方式无法满足未来需求,更改行业标准或其他波动性要求会很快使该设备过时,这些只是固定芯片的一些缺点。
那么,行业如何才能继续在架构上取得进步,并以足够快的速度建立DSA以跟上创新的步伐?解决方案在于自适应计算。
自适应计算的力量
自适应计算以FPGA技术为基础,可以动态地在芯片中构建DSA。因此,自适应计算允许DSA随着需求的变化而动态更新。使我们摆脱了漫长的ASIC设计周期和高昂的NRE成本。它不仅支持软件而且还支持硬件的无线(OTA)更新,这在处理变得更加分散时尤其重要。例如,2011年火星漫游者的好奇心以及最近推出的“恒心”都包含了自适应计算技术。
毅力号为其全面的视觉处理使用了自适应计算。它使用基于FPGA的平台构建,可加速AI和非AI视觉任务,包括图像校正,过滤,检测和匹配。毅力号发送回NASA的图像将使用自适应计算进行处理。
如果在八个月内发明了一种新算法,或者发现了硬件错误,毅力号无法在途中进行升级。在这种情况下,自适应计算允许通过空中或太空远程发送硬件更新。这些更新可以像软件更新一样快速、轻松地完成。当部署是远程的时,这样的远程硬件更新不仅是方便,而是必要的。
自适应计算可以从云部署到边缘再到端点,从而将最新的架构创新带到端到端应用的每个部分。这归功于广泛的自适应计算平台——从数据中心PCIe加速卡上的大容量设备,到适合IoT设备所需端点处理的小型,低功耗设备。
自适应计算可用于构建各种形式的优化DSA,从对延迟敏感的应用(如自动驾驶和实时视频流)到5G中的信号处理以及非结构化数据库的数据处理。借助当今的硬件抽象工具,软件和AI开发人员现在可以充分利用自己的优势,而无需成为硬件专家。
自适应计算可加速整个应用
AI推理很少单独存在。它是较大的数据分析和处理链的一部分,通常具有使用传统(非AI)实现的多个前段和后段。这些系统的嵌入式AI部分当然可以受益于AI加速,非AI部分也可以受益于加速。自适应计算的灵活性适合于加速AI和非AI处理任务。我们称此为整个应用加速,随着AI渗透到越来越多的应用中,它将变得越来越重要。
我们已经讨论了自适应计算的功能,但还有更多技巧。
启用全新系统
自适应计算使全新的系统成为可能,而其他技术则无法实现。它不仅可以实现快速的架构创新,还可以在系统运行时在架构之间进行切换。这些新系统可显着提高性能,降低功耗和成本,而对于固定芯片(如CPU,GPU和ASIC)来说,这是不可能的。
例如,在现代车辆中,有许多摄像头,每个摄像头都由软件和越来越多的AI进行监控。前置摄像头和后置摄像头的处理通常是互斥的——根据行进方向,一次只能监视一个摄像头。自适应计算允许他们共享处理资源。向前移动时,只需要处理前面的视频流,而向后移动时,只需要处理后面的视频流。当汽车从“行驶”移至“倒车”时,硬件将重新配置为实现后置摄像头处理算法,该算法可能与面向前方的算法不同。这样可以提供更高的整体性能,但同时可以降低功耗和成本。对于最终用户而言,这意味着可以用更少的钱获得更多的功能。
结论
摩尔定律已死。
但是,摩尔定律的精神仍在。
DSA等自适应计算和架构方面的进步有助于维持我们已经养成的更快、更好、更便宜的追求。同时,自适应计算通过消除构建新的基于ASIC的DSA所需的漫长设计周期,满足了“更快”的市场需求。这种趋势将继续推动架构的飞速发展,从而使摩尔定律的精神得以延续。
上一篇:进一步提高软件编程能力,Xilinx 收购峰科计算
下一篇:Lattice发布Mach-NX,它为什么会看中安全市场
推荐阅读最新更新时间:2024-10-30 10:21
- 使用 ROHM Semiconductor 的 BA90BC0WT-V5 的参考设计
- EVAL-AD5327DBZ,用于 AD5327 12 位、四通道、电压输出数模转换器 (DAC) 的评估板
- #第六届立创电赛# 堆功放
- 基于QCM的湿度检测计
- LTC3638MPMSE 5V 至 140V 输入至 5V/250mA 输出和 20kHz 最小突发频率的典型应用电路
- L78L06AB可调输出稳压器的典型应用
- 分层Fe2.1hub
- 具有放电功能的 150mA 超低噪声 LDO 稳压器的典型应用
- 使用具有最大功率点跟踪功能的 LTC4162IUFD-L42M 太阳能供电 36 节 3.2A 充电器的典型应用
- 基于STM32ESP8266的WiFi天气时钟