Arm中国自主研发“周易”平台,让AI无处不在

发布者:恬淡岁月最新更新时间:2018-11-13 关键字:Arm 手机看文章 扫描二维码
随时随地手机看文章

随着新技术的成熟,新型的先进应用将来自5G、人工智能(AI)和物联网(IoT)的融合,这种融合将创造出一个智能互联的全新未来,对所有个人、行业、社会和经济产生积极影响。Arm预计到2035年将有1万亿的物联网设备,在这些设备上实现本地人工智能,是人工智能应用的必然趋势。而要做到这一点,必须进一步降低人工智能的算力成本。

 

为此,Arm中国自主研发了“周易”平台这样一个适配性强、开放通用的人工智能平台,其主要包括软件框架Tengine和全新的硬件处理器——人工智能处理单元(AIPU),其中Tengine软件框架针对边缘设备的推理做了深度优化和实现。周易平台也支持Arm CPU、Mali GPU以及第三方硬件,专注于边缘推理,能够提高人工智能应用开发的生产效率。

 

                                              image.png

图1 :人工智能平台“周易”概述

 

全新处理器单元(AIPU)提供硬件核“芯”

人工智能通常用于不同的场景,而深度学习模型会使用到各种类型的操作(layer)。目前常见的加速器解决方案具有较高性能,但仅支持有限的操作,这使得只能运行有限的人工智能应用,限制了边缘和AIoT产品的多样性,AIPU凭借良好的可编程性可以支持现在的全部深度学习操作。

 

周易人工智能处理单元(AIPU)是一个专门用于深度学习处理的全新硬件IP。这种新的架构设计了人工智能特定域张量指令集(Tensor Instructions)、针对AI特定操作的指令集扩展以及定制的硬件加速单元、以及用于NN计算所必需的通用标量指令集。凭借最先进的设计,AIPU可以实现人工智能应用的完全可编程性和很好的能效。除了AIPU,还有完整的AI软件开发工具包,支持AI算法可以在AIPU上轻松部署。

 

image.png

图2 :周易AIPU框图

 

AIPU采用了可配置的设计,张量执行单元(TEC)的数量和AI硬件加速单元能都是灵活可配置的,这使得周易平台能够涵盖从微控制器(几十GOPS)到高端边缘计算(几个TOPS)的不同算力需求。

 

对于新开发的芯片,周易平台可以让芯片合作伙伴使用周易AIPU IP设计新的SoC,并提供了验证测试向量、参考用例和后端实现参考流程等全面支持,以加速新的SoC设计;同时,周易AIPU 仿真软件用于软件应用程序前期开发。这将大大加快新人工智能产品的上市时间。

 

开放式人工智能软件框架——Tengine

周易平台采用Tengine作为开放式人工智能软件框架,它的目标是建立一个统一的推理框架,通过定义标准的Tengine API,人工智能应用程序可以使用标准API在不同的硬件上部署,大大节省了移植或者在特定的硬件上进行优化的工作量。Tengine支持主流的人工智能框架,如TensorFlow / Caffe / ONNX / MXNet等模型。

 

Tengine定义了标准硬件抽象级别(HAL),以支持物联网设备中可能存在的不同类型的计算模块。它已经支持像Cortex-A7 / A17 / A53 / A55 / A72 / A76这些的流行Arm CPU,也支持像Mali-T860、G51和G72这些广受欢迎的Arm Mali GPU。由于周易平台是一个开放平台,它也可以支持第三方CPU、DSP或加速器,通过选用设备驱动程序来支持这些设备。在库方面,可以选用Arm计算库(Arm Compute Library,ACL)、异构计算库(HCL)、开放源代码库(例如OpenBLAS)或是用户自己实现的库来驱动。

 

三大创新特性,强势赋能AIoT市场

实际上,周易平台作为人工智能应用的整体解决方案,十分简单易用,并且实现了三大创新。兼容性上,它不仅提供了一个完整的易于使用的工具链,支持从深度学习模型到周易可执行文件的一键构建,还支持常见的人工智能框架,如Google TensorFlow和其他框架。同时,周易平台支持Linux和Android操作系统,甚至裸机软件(bare-metal software),从非常小的嵌入式微控制器到高端边缘网关的各种设备都能适用。

 

周易平台还将更强的安全性引入市场,安全扩展硬件和相关的信任软件可以保护人工智能资产,例如算法、代码和数据,帮助合作伙伴保护运行在已部署产品上的资产,并保护人工智能算法安全的在线更新。周易平台的安全扩展为人工智能应用中需要保护的资产建立了一个可信执行环境(TEE),通过静态加密存储、运行时 TrustZone技术保护,以及SoC中用于安全隔离一系列小的硬件组件, 为人工智能芯片提供360度的安全保护。

 

适用性上,周易平台也支持在现存设备的上进行部署。通过统一的软件界面,许多人工智能应用可以直接部署在SoC上,合作伙伴只需重新编译基于目标设备CPU的周易软件,生成可在现有SoC架构上运行的目标代码,然后链接CPU库和GPU库。通过部署周易平台,人工智能性能可以提高2.5 - 5倍。

 

综上所述,Arm中国人工智能平台周易可以帮助产业合作伙伴大幅降低人工智能算力、芯片和应用的成本、让其设计和制造具有强大人工智能能力的芯片,并让人工智能应用程序开发人员大大提高工作效率,在更多的物联网设备上实现人工智能,极大地赋能整个AIoT市场。


关键字:Arm 引用地址:Arm中国自主研发“周易”平台,让AI无处不在

上一篇:带你了解一下什么叫Gen-Z结构
下一篇:全球超算500强,美国继续卫冕

推荐阅读最新更新时间:2024-03-30 23:56

英特尔与ARM可能将展开专利大战
    为了在移动设备市场站稳脚跟,英特尔收购了ARM的部分专利以利用其在电池设备上的设计优势。这也使得ARM有了与英特尔谈判的资本,并有助于ARM进入高科技领域。     有趣的事,今日两家公司在英特尔所用的技术是否已经超出其购买的专利范围上有了分歧。这一事件很有可能使ARM不得不开始专利维权的进程,两家公司的专利大战也可能就此展开。 当然,这样的专利之争可能也就在纷纷扰扰中结束,正如我们从苹果和三星的斗争中看到的那样。
[手机便携]
ARM的中断处理 [一]
前面的文章介绍了Linux的中断处理机制,而操作系统的中断处理是和硬件的中断控制器紧密相关的,本文将以ARM这样一个具体的处理器为例,讲解硬件层面对中断的支持。 ARM的中断控制器被称为GIC(Generic Interrupt Controller),最开始的v1版本最多支持8个PE和1020个中断源(interrupt source),用于ARM Cortex-A5,A9等。这里PE代表Processing Element,它是ARM架构对处理单元的抽象,为方便理解,就把它当做ARM cores好了。 v2版本增加了对虚拟化功能和TrustZone的支持,用于ARM Cortex-A7,A15,A53,A57等。
[单片机]
<font color='red'>ARM</font>的中断处理 [一]
飞思卡尔发布基于ARM的QorIQ LS通信处理器
2013年10月16日,加州圣克拉拉(2013 Linley Tech处理器大会)讯 -飞思卡尔半导体日前推出全新的QorIQ LS1通信处理器系列,基于软件感知、独立于内核的Layerscape系统架构,集20年网络IP经验和ARM处理专长于一身。 全新的QorIQ LS1系列产品巩固了飞思卡尔在通信处理器市场的领导地位,旨在支持广泛的功耗敏感型网络应用,以及其他快速扩大的产品类别,包括物联网网关、工业自动化和控制设备。 飞思卡尔此次推出三款全新QorIQ LS1系列处理器,都拥有两个可靠性经优化的ARM Cortex-A7内核。这些高效的内核通常用于智能手机等电池应用,其检错和纠错技术已得到增强。此前飞思卡尔的
[手机便携]
ARM 软中断指令SWI
前面我们学习ARM工作模式中,处理器模式切换可以通过软件控制进行切换,即修改CPSR模式位,但这是在特权模式下,当我们处于用户模式下,是没有权限实现模式转换的。若想实现模式切换,只能由另一种方法来实现,即通过外部中断或是异常处理过程进行切换。于是ARM指令集中提供了两条产生异常的指令,通过这两条指令可以用软件的方法实现异常,其中一个就是中断指令SWI 。 一、软件中断 软中断是利用硬件中断的概念,用软件方式进行模拟,实现从用户模式切换到特权模式并执行特权程序的机制。 硬件中断是由电平的物理特性决定,在电平变化时引发中断操作,而软中断是通过一条具体指令SWI,引发中断操作,也就是说用户程序里可以通过写入SWI指令来切换到特权
[单片机]
<font color='red'>ARM</font> 软中断指令SWI
学DSP、FPGA、ARM,哪个更有前途?
  1、这世界真是疯了,貌似有人连 FPGA 原理是什么都不知道就开始来学习 FPGA 了。   2、 DSP 就是一个指令比较独特的处理器。它虽然是通用处理器,但是实际上不怎么“通用”。技术很牛的人可以用 DSP 做一台电脑出来跑windows,而实际上真正这么干的肯定是蠢材。用 DSP 做信号处理,比其他种类的处理器要厉害;用DSP做信号处理之外的事情,却并不见长。而且信号处理的代码一般需要对算法很精通的人才能真正写好。数据结构里面的时间复杂度和空间复杂度在这里是一把很严酷的尺子。   3、 FPGA 只不过披着软件的外衣,实际上是硬件。FPGA内部有两层相对独立的电路。使用者“编码- 编译”后生成一个映像,这个映像
[嵌入式]
ARM 之LCD和LCD控制器
既然提到 了LCD那么我们首先必须要了解的就是他的种类,CD(liquid crystal display), 即液晶显示器,是这一种采用了液晶控制透光度计数来实现色彩的显示器,他与传统的CRT显示器相比有很多优点:轻薄,能耗低,辐射小等,市场 占有率越来越大,LCD有很多类型:STN,TFT,LTPS TFT,OLED等,各有优缺点。 一、 S3C2410,2440LCD控制器介绍 1: S3C2410,2440LCD控制器提供了驱动STNLCD TFTLCD所需要的所有信号, REGBANK是LCD控制器的寄存器组,含有17个寄存器及一块256X16的调色板内存,用来设置二线参数。 2: LCDCDMA则是CD控制器专
[单片机]
<font color='red'>ARM</font> 之LCD和LCD控制器
NVIDIA宣布ARM架构桌面CPU 丹佛计划
有关NVIDIA将进入CPU市场的传言已有多年。虽然业界一直在猜测NV何时能够获得x86授权进入PC处理器市场,但NVIDIA官方,尤其是黄仁勋本人对此的评论一直是:“ARM就是我们的处理器策略。”今天在美国拉斯维加斯举行的CES 2011 NVIDIA媒体会上,黄仁勋终于宣布了这个震撼性的消息:“Project Denver”丹佛计划,即NVIDIA自行设计的高性能ARM架构处理器。 在此之前,NVIDIA的Tegra SoC片上系统处理器已经是基于ARM架构,不过其处理器内核设计几乎完全来自ARM授权,图形等其余部分才是NVIDIA的设计。而对于丹佛计划,黄仁勋表示这将是一颗高度定制化的“ARM兼容CPU”,即获得
[嵌入式]
NVIDIA宣布<font color='red'>ARM</font>架构桌面CPU 丹佛计划
ARM首席技术官:功耗问题下的“硅黑暗时代”
  若没有进一步创新,设计师们将有可能在2020年迎来“黑暗”的硅世纪。能耗无法支撑设计出的高密度芯片。ARM公司首席技术官MikeMuller在主要讨论FPGA和上网本未来的ARM年度技术大会上这么警告说。   他在演讲中说,10年内11nm制程技术将带来16倍的晶体管数、2.4倍的速度。但届时那些产品的功耗限制也只有今天的三分之一,致使工程师们只能激活9%的晶体管。   他还说,研究人员正致力于发展多种技术,以避免功耗限制束缚未来设计。这些技术包括:在系统和任务级采取更动态的电源管理、芯片上的能源回收、通过无线互连的裸片堆叠。   “一些本地超宽带网络是解决三维芯片堆叠的良率和互联问题的最佳途径。”   在一次独立的圆
[嵌入式]
<font color='red'>ARM</font>首席技术官:功耗问题下的“硅黑暗时代”
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
最新物联网文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved