不久前的一天,在东北大学浑南校区信息学馆前,计算机科学与工程学院学生蒋承知的脚下有一个小小的、如螃蟹般的机器人紧紧地跟随着他,寸步不离,正在对他的行为进行“深度学习”,蒋承知则仔细地检查着机器人的各项参数,并进行详细记录。
蒋承知是东北大学的一名本科生,他和同伴于起、叶文强、甘淞元组成的创新团队,将现场可编程门阵列FPGA神经芯片运用于人工智能深度学习领域,采用卷积神经网络,尝试在芯片中模仿人脑以大规模的平行方式处理信息,目前项目组已成功实现将基于FPGA的神经芯片植入到硬件资源进行深度学习,并获得大学生创新项目国家级资助。
深度学习是指通过学习样本数据的内在规律和深层特征,使神经网络结构能够像人一样具备分析和自主学习新东西的能力,目前该技术在文字、图像处理、语音识别、机器翻译等领域,已经取得很多成果。但随着电子信息技术的发展,要求计算机能够更加“任性”地服务于生活,需要机器本身能像人一样识别与感知周围的环境,并对复杂的环境作出正确的判断,这对计算机深度学习的便捷性和低成本获取提出了更高的要求。
目前,深度学习的实现平台依赖于庞大的CPU/GPU集群,成本很高,在现实生活中很难实现和得到运用。与此同时,传统的嵌入式处理设备单片机ARM、DSP都无法实现深度学习的实时处理。
FPGA神经芯片作为一款具有现场可编程功能的逻辑门电路元件,有着强大的并行处理数据能力和优势。卷积神经网络拥有强大的特征提取能力,使其在图像分类识别、目标跟踪等领域运用广泛。蒋承知团队创新性地将FPGA神经芯片作为能够实现深度学习的嵌入式处理器,并把能够极大提升计算机感知识别周围环境能力的卷积神经网络算法应用于基于FPGA的目标跟踪设备,使设备运行速度大幅提高。经过“流片”(即工业化试生产)后,体积大幅缩小的神经芯片更适合于嵌入式应用,从而使具备深度学习能力的设备制造成本大大降低。
这项创新技术的运用范围非常广泛,可以在目标识别、跟踪、图像处理、语音、自然语言等诸多领域实现嵌入式运用,只要设置不同的参数就可以满足各个场景的需要。例如,将芯片与摄像头连接,就能直接识别出所需要的目标;将其植入机器人就可以完成目标追踪等较复杂的任务,市场化应用潜力巨大。下一步,团队将紧跟技术发展的潮流研究基于神经芯片的高质量深度相机,使其能应用于智能汽车以及无人驾驶领域,并积极推动神经芯片在“互联网+”相关领域的广泛应用。
关键字:FPGA 神经芯片
编辑:王磊 引用地址:东北大学本科生团队研发“深度学习”FPGA神经芯片
推荐阅读最新更新时间:2023-10-13 10:25
基于FPGA的UART控制器的多模块设计与实现
异步串行通信要求的传输线少,可靠性高,传输距离远,被广泛应用于微机和外设的数据交换。实现串口通信主要需要完成两部分工作:
将串口电平转换为设备电路板的工作电平,即实现RS-232电平和TTL/CMOS电平的转换;
接收并且检验串行的数据,将数据变成并行的并提供给处理器处理。
实现RS-232电平和TTL/CMOS电平转换可以用接口芯片来实现,实现数据的串行到并行转换用的是UART,它们是实现串行通信必不可少的两个部分。虽然目前大部分处理器芯片中都集成了UART,但是一般FPGA芯片却没有这个特点,所以使用FPGA作为处理器可以有两个选择,第一个选择是使用UART芯片进行串并转换,第二个选择是在FP
[工业控制]
片上网络技术的发展及其给高端FPGA带来的优势
概述 在摩尔定律的推动下,集成电路工艺取得了高速发展,单位面积上的晶体管数量不断增加。片上系统(System-on-Chip,SoC)具有集成度高、功耗低、成本低等优势,已经成为大规模集成电路系统设计的主流方向,解决了通信、图像、计算、消费电子等领域的众多挑战性的难题。 随着片上系统SoC的应用需求越来越丰富,SoC需要集成越来越多的不同应用的IP(Intellectual Property)。另外,片上多核系统MPSoC(MultiProcessor-System-on-Chip)也已经成为必然的发展趋势。 随着SoC的高度集成以及MPSoC的高速发展,对片上通信提出了更高的要求。片上网络技术(Network-on-Ch
[嵌入式]
Altera 推出具有530K逻辑元件FPGA 的开发套件
Altera 公司 (NASDAQ: ALTR) 今天宣布推出其面向 Stratix® IV FPGA 的最新开发套件。Stratix IV E FPGA 开发套件具有业界最高密度、最高性能的 FPGA。该套件为用户提供了全面的设计环境,其中包括迅速开始其高密度原型产品设计所需的硬件和软件。
Stratix IV E FPGA 开发套件基于高性能、高密度的 Stratix IV EP4SE530 FPGA。该 FPGA 具有 530K 逻辑单元 (LE),比当前市场上同类竞争产品的 FPGA 性能平均高 25%。Stratix IV EP4SE530 FPGA 所具有的性能和密度优势,让使用 Stratix I
[嵌入式]
用成型滤波器组提高测距精度的一种方法
在许多 测距 系统中,用户端接收到基站发送的帧信号后,便以该帧中特定的位置(称为帧参考时标)为基准发送“回复帧"给基站。基站收到回复帧后,提取它的帧参考时标,并以其作为测距的依据。
通常用户端的系统时钟精度较低(本文提到的系统时钟均指用户端的系统时钟),因此接收到的帧参考时标会存在误差。在用户端经过计算估计出帧参考时标的误差,再用该误差调整发送回复帧的时刻,可实现精确测距。因此测距精度取决于两个因素:帧参考时标误差的估计精度和回复帧发送时刻的调整精度。本文主要讨论如何提高回复帧发送时刻的调整精度。回复帧是由基带码组成的,因此下文中讲的发送时刻的调整均指基带码发送时刻的调整。
发送时刻的调整精度是
[测试测量]
基于FPGA的高速自适应滤波器的实现
现代通信信号处理发展到3G、4G时代后,每秒上百兆比特处理速度的要求对于自适应处理技术是一个极大的挑战。使用具有高度并行结构的FPGA实现自适应算法以及完成相应的调整和优化,相比于在DSP芯片上的算法实现可以达到更高的运行速度。本文分析了自适应LMS算法及其在FPGA上的实现,并进行算法结构的改进优化,利用DSP Builder在Altera DE2-70平台的FPGA芯片上实现相应自适应算法并下载到目标板上进行板级测试。 1 自适应LMS算法 自适应滤波器的特点在于滤波器参数可以自动地根据某种准则调整到相应的最优滤波情况。其基本框图如图1所示。
图中,X(n)为输入信号,y(n)为滤波信号,d(n)为期望
[嵌入式]
美高森美和Athena宣布为加密用户提供DPA防御对策的FPGA
现已提供功能强大的防篡改安全微控制器技术,作为用于SmartFusion2和 IGLOO2 FPGA器件的软件IP
致力于在功耗、安全、可靠和性能方面提供差异化半导体技术方案的领先供应商美高森美公司(Microsemi Corporation,纽约纳斯达克交易所代号:MSCC)和业界领先的安全、加密、防篡改和信号处理知识产权(IP)内核供应商The Athena Group, Inc. (Athena)发布具有先进侧通道分析(SCA)和差分功率分析(DPA)对策的全面IP内核产品组合。新的产品组合基于Athena的TeraFire 加密微处理器系列,面向美高森美获得奖项的SmartFusion 2 系统级芯片
[嵌入式]
基于FPGA与RS422的MⅢ总线转换板的设计与实现
机载数据总线技术是现代先进飞机电传操纵系统和航空电子综合化最重要的关键技术之一,它是计算机网络技术在航空电子底层的具体实现,决定着飞机性能和航电系统综合化程度的高低。本书从数据总线技术基础、计算机网络OSI七层参考模型两方面介绍了机载数据总线的基础技术,用于民用飞机上的ARINC-429、AmNC-629和CSDB机载数据总线,以及应用于军用飞机上的MIL-S1D-1553B、MIL-STD-1773、STANAG3838/3910机载数据总线,线性令牌传递总线LTPB、光纤分布式数据接口FDDI和航空电子统一网络中可变规模互连接口SCI,光纤通道FC,以及目前最新全双工交换式以太网AFDX,全面分析了它们的技术特点、协议规范、
[嵌入式]
赛灵思Virtex-5 FXT荣获电子业界两项大奖
赛灵思公司今天宣布,在《电子设计技术》(EDN China)杂志社于2008 年 11 月6日在深圳举办的创新大会上,专为高性能嵌入式处理而优化的65nm Virtex-5 FXT FPGA 平台荣获EDN China 创新奖的“2008年度最佳产品奖”。同时,ISE 10.1整体开发套件也获得了这一评选活动的“优秀产品奖”。此前,在由《电子产品世界》(EEPW)举办的2008年度十大国外影响中国的嵌入式系统新技术奖项评选中,Virtex-5 FXT 平台荣膺“数字IC和PLD类”年度大奖。
Virtex-5 FXT 平台是业界唯一融PowerPC® 440 处理器模块、高速 RocketIO™ GTX 收发器和
[嵌入式]