但是没有重大的系统重新设计,又该如何真正加速加密?
对于加密,高级加密标准 (AES) 是一个事实标准。
采用 AES 加密时,无法通过定义减少计算任务,从而使嵌入式系统很快达到性能极限。如图 1 所示,其中显示用Valgrind 分析工具、通过 SCP(SSH 会话)进行的文件传输的分析结果。此时AES 加密占用三分之二计算任务。
AES-128采用秘钥和 128 位块大小,使用许多并发 8 字节运算。AES 属于分组密码,基于按 4x4 字节阵列组织的固定分组大小运算。我们曾经采用 128位分组大小,它能抵挡所有已知攻击,安全性甚至强于 192 位和 256 位版本。
采用 128 位 AES 时,执行加密与解密需要 12 个回合,每个回合需要几步运算。第一项任务是通过所谓的密匙扩展过程从密钥中算出回合金钥。每个回合都采用纯文本自身的回合密匙执行纯文本的逐位异或运算。然后进行字节代替、行位移和列混合运算,并再次执行回合金钥的异或运算。
最后一个回合稍有不同,因为其中省略了一些步骤。加密过程采用所谓的S 盒(其提供非线性)执行替代。我们可以把它安置到一个 16×16×8 位矩阵中,从而能够适应常见的赛灵思 BRAM原语。多个 S 盒实例可以加速 IP 核并在适当的位置为内核提供所需数据,而无需等待对主存储器的长时间总线存取。解密过程大同小异,其采用相同密钥,但方向相反,并且使用不同 S 盒。
快 12 倍
在加密和解密中,大部分运算按行或列执行,剩下四项运算并行计算 —而硬件对此任务得心应手。这样就能够通过不同来源实现 AES 硬件的各个部分。为了加速系统,我们从庞大、快速增长的 OpenCores.org 资源库获取AES 内核。
我们删除了原有的总线接口(因为它适用于另一种 FPGA 架构),另外为APU 添加了一个接口,以便把 AES 内核作为 FCM 协处理器连接到 PowerPC上。我们共使用 8 个所谓的 UDI 指令在PowerPC 和 AES FCM 之间传输数据。工作结果非常令人满意( 见图2) 。硬件加速的系统比原实现快了12 倍。原来用以 300 MHz运行的独立的 PowerPC 加密一个单块需要 17.8微秒,而采用以 150 MHz 运行的 AESFCM 只需 1.5 微秒。如果只以升级到速度稍快的 CPU来加速运算,我们采用硬件加速后的 1.5 微秒速度表现超过基于 Intel Atom 1.6-GHz CPU 的纯软件实现(其需要 2.7 微秒)。上述结果证明了使用 FPGA 技术的硬件加速的卓越潜能。
图 2 — 硬件加速系统(中间绿条)快于独立的 PowerPC 或 Atom 处理器。
[
1] [
2]
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
推荐阅读
在5G网络中,我们会面临不同的业务需求,而传统的物理设备我们网络物理设施是无法根据这些业务来配置的,网络切片则是关键技术。在6月27日开幕的世界移动大会MWC上海展会上,联想集团、中国移动、赛灵思(Xilinx)、Napatech、锐德世(Radisys)五家公司联合推出了业界首个支持多形态加速硬件、软硬件充分解耦的移动接入网云化方案 。 联想集团副总裁、联想研究院企业服务云计算实验室和5G实验室负责人黄莹博士表示:“无线网基站云化与虚拟化是5G时代的重要技术方向,对运营商优化网络效率、促进业务创新、提升用户体验等方面,均具有深远意义。联想致力打造基于NFV技术的端到端产品与服务,在硬件加速与整体软、硬件解决方案等方面
发表于 2018-07-03 14:35:17
的认可。加速云创始人兼CEO邬刚表示:“人工智能已经进入我们的生活,但是未来发展还存在瓶颈,需要硬件技术和算法方面的突破。异构计算是计算架构的未来趋势,而FPGA 是实现异构计算的完美选择。加速云创新的异构计算加速平台解决方案,具有高性能、高效率、低延时特性以及可编程性和远程可重构能力,非常适合云上的弹性业务的需求。我们希望能够通过我们的技术,帮助更多的企业实现深度学习,在大数据时代赢得先机。”加速云本次推出的四大产品为:两个系列硬件加速产品(SC-OPS, SC-VPX)、两个IP库 (FDNN, FBLAS)、三大解决方案(深度学习解决方案、高性能计算及数字信号处理解决方案、边缘计算解决方案)。产品介绍:• SC-OPS是加速云
发表于 2018-04-18 16:56:25
根据美国专利商标局(USPTO)最新公布的专利信息显示,早在2016年9月,Intel提交了一份关于比特币挖矿硬件加速器的专利申请。根据专利文件显示,Intel的设计是打算在CPU中集成挖矿硬件加速器,对信息摘要和信息调度数据通道做特殊优化,同时可以实现ASIC、SoC、CPU、FGPA等硬件协同工作。另一方面,Intel在专利文件中更多的强调的是能效。 现在的挖矿器性能虽然高,但是因为不停地运行SHA-256计算,能耗非常高,并且占据的空间非常大。Intel在专利文件中描述,其挖矿加速器体积大大缩小,而且能效比极高,相比通用处理器可将能耗降低最多35%。
发表于 2018-04-10 19:03:38
,FPGA还非常适合用作协议和接口转换的芯片。近日KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale,它能够利用实现训练好的CNN网络,比如行业标准的ResNet、AlexNet、Tiny Yolo和VGG-16等,并将它们进行压缩输出二进制描述文件,可以部署到Xilinx全系列可编程逻辑器件上。Zynq SoC和Zynq UltraScale+ MPSoC器件PS可以提供数据给AIScale CNN加速器(PL),经过分类处理将输出数据给PS。压缩后的CNN网络占用资源相对小很多,可以部署在片上存储器中,可以更快更灵活的切换CNN网络。 图1:AIScale在计算机视觉应用案例
发表于 2018-02-03 19:39:30
Mentor, a Siemens business 宣布独立合规公司 SGS-TÜV Saar 已对 Mentor 新版 Veloce® Strato™ 硬件加速仿真平台关键软件元素的工具验证报告进行了 ISO 26262 合规性认证。认证巩固了 Mentor 在确保功能安全和硬件加速仿真技术领域的领导地位,能够帮助芯片设计人员达到并超越全球汽车行业日益严格的安全和质量要求。这是 Mentor 第 22 次通过 ISO 26262 产品认证。从这些 Mentor Safe 程序的新增功能可以看出,公司致力于使其业界领先的电子硬件和软件设计解决方案产品组合的所有标志产品通过关键文档的功能安全验证。“人们对自动驾驶和成熟 ADAS
发表于 2017-07-25 21:57:20
Mentor, a Siemens business 宣布独立合规公司 SGS-TÜV Saar 已对 Mentor 新版 Veloce® Strato™ 硬件加速仿真平台关键软件元素的工具验证报告进行了 ISO 26262 合规性认证。下面就随手机便携小编一起来了解一下相关内容吧。认证巩固了 Mentor 在确保功能安全和硬件加速仿真技术领域的领导地位,能够帮助芯片设计人员达到并超越全球汽车行业日益严格的安全和质量要求。这是 Mentor 第 22 次通过 ISO 26262 产品认证。从这些 Mentor Safe 程序的新增功能可以看出,公司致力于使其业界领先的电子硬件和软件设计解决方案产品组合的所有标志产品通过关键文档
发表于 2017-07-25 14:39:58