芯片的下一个大挑战在哪里?是视觉技术!

发布者:SparklingSun最新更新时间:2017-10-23 来源: ZDNET关键字:视觉技术 手机看文章 扫描二维码
随时随地手机看文章

腾讯数码讯(易静)半导体企业正在用异构系统提高硬件的性能和效率,当中有一个领域尤其重要,那就是视觉处理技术,在今年的Linley Processor Conference会议上,视觉处理成为焦点。

视觉处理用在哪里?最明显的例子就是自动驾驶汽车。今天的自动驾驶汽车有一个肮脏的小秘密:它们高度依赖大量的电子组件。传感器与软件是重点,还需要强大的CPU和多个GPU,它们会消耗大量的电力,处理所有数据,实时做出决策。月初时,Nvidia推出了Drive PX Pegasus主板,它还承认当前的硬件无法支持真正的无人驾驶。Nvidia汽车高级主管丹尼o夏皮罗(Danny Shapiro)说:“如果想开发Level 5汽车,需要更大的计算力,这就是现实。”


不只汽车如此,其它行业也一样。在机器人、无人机、智能监控摄像头、VR、AR、人机界面等领域,嵌入式视觉处理器很重要。在主题演讲中,Cognite Ventures CEO克里斯o罗恩(Chris Rowen)说,老牌IP提供商引导硅芯片复苏,比如Cadence (Tensilica)、 Ceva、英特尔(Mobileye)、Nvidia和Synopsys,它们和95家创业公司竞争,这些创业公司正在开发嵌入式视觉技术,当中包括17家正在开发神经引擎的创业公司。


Cadence营销主管普林o德塞(Pulin Desai)谈到嵌入式视觉技术时说,在推断时涉及三个独立的系统:感知(摄像头、雷达、激光雷达和麦克风)、前期和后期处理技术(降噪、图像稳定、HDR等等),还有就是用神经网络分析面部、识别对象和手势。这些感知任务都是由处理器和ISP(图像信息处理器)完成的,Cadence还开发了Tensilica Vision C5 DSP,它专门用来驱动神经网络。


德塞解释说,如果想为一款产品开发嵌入神经引擎的芯片,挑战还是很大的,这样的产品要到2019年或者2020年才能上市。他还说,在不到4年的时间里,图像识别神经网络算法需要的计算力增加了16倍。与此同时,神经网络架构快速变化,新应用涌现,硬件必须更有弹性。处理所有问题时必须追求低能耗,因为电能有限。


Vision C5是一个神经网络DSP(NNDSP,数字信息处理器),它在一个内核内处理神经网络层,网络层拥有1024个8位和512个16位MACs,每平方毫米芯片面积每秒可以完成1万亿次MACs(一个机器指令周期能实现乘加运算)运算。Vision C5有很强的扩展性,内核可以增加到任意数量,拥有更强的性能,可以编程。Vision C5是用台积电16纳米制程制造的,频率690MHz,与商用GPU相比,它能让AlexNet的运行速度提高6倍,让Inception V3提高9倍,让ResNet50提高4.5倍。


华为在新的Mate 10和Mate 10 Pro手机中安装了麒麟970处理器,它是第一块安装专用神经引擎单元的智能手机处理器,半精度运算速度达到1.92 teraflops(万亿次浮点运算)。Cadence也曾多次谈到半精度运算,但是没有透露Vision C5具体是多少。苹果A11 Bionic安装了神经引擎,其它企业也应该会跟进。Vision C5还想进入监控、汽车、无人机、穿戴设备。


Ceva-XM Vision DSP与Vision C5竞争,许多摄像头模组都用到了Ceva,将它植入ISP,比如Rockchip的RK1608,或者将它用作独立辅助芯片,用来处理图像。Ceva在神经网络方面找到一套解决办法,它将CEVA-XM与独立CNN硬件加速器(Hardware Accelerator)搭配使用,加速器最高拥有512个MAC单元。Ceva营销主管亚伊尔o西格尔(Yair Siegel)曾谈到神经网络的增长,他说,在计算和存储带宽方面,先进CNN的要求很高。Ceva Network Generator将这些模型转化为定点图,进行区分,让它在Vision DSP和Hardware Accelerator之间高效运行。Ceva说,TinyYolo如果只使用DSP,相比而言加入硬件加速器的效率高9倍。TinyYolo是一套实时对象识别算法。


Synopsys开发的EV6x Embedded Vision Processor(嵌入式视觉处理器)采用相似的方法,它将最多4个CPU(每个都有一个纯量运算单元和宽矢量DSP)与一个CNN Engine结合,CNN Engine是可以选择可以编程的,这样就可以让速度加快。CNN Engine的MACs数量可以从880增加到1760再到3520个,用台积电16纳米制造芯片,频率1.28GHz,芯片的总MACs最高可以达到4.5万亿(相当于9 teraflops的性能)。一个搭配CNN Engine的EV61矢量DSP使用的芯片面积不到1平方毫米,但是Synopsys却说这套组合产品的每瓦MACs可以达到20万亿。Synopsys产品营销经理戈尔登o库勃(Gordon Cooper)强调说,矢量DSP与CNN加速器整合相当重要,这种解决方案可以提高每瓦性能,解决ADAS(先进驾驶辅助系统)存在的一些问题,比如难以识别行人。


高通的解决办法是增加新的指令,叫作Vector eXtensions或者HVS,它将新指令放进Hexagon DSP,装进骁龙处理器。2年前高通首次引入这种技术,谷歌Pixel手机之所以支持HDR,离不开高通的技术。最近,谷歌取得突破,开发了自己的技术Pixel Visual Core,但它之前的确已经向我们证明:把TensorFlow图像识别网络从4核CPU转到Hexagon DSP可以将性能大幅提高13倍。


高通产品管理高级主管里克o莫尔(Rick Maule)说,在过去几年里,高通了解到客户需要更多的处理器周期,希望存储访问速度更快一些。高通的解决办法就是将计算单元的数量增加一倍,将频率提高50%,在计算单元中植入低延迟存储器。这样一来,骁龙820的每秒MACs数量可以从990亿增加到2880亿,最终执行Inception V3图像识别模型时速度提高了2倍。除了性能提升,高通还引进了Snapdragon Neural Processing Engine(骁龙神经处理引擎)、抽象层、Halide(面向图像处理、计算摄影的特定语言),它们可以让神经网络编程变得更容易。

这些进步引人注目,不过创业公司AImotive却认为,在50瓦之下只有专用的硬件才能支撑完整的Level 5无人驾驶系统。AImotive aiWare硬件IP主管费赫(Márton Fehér)认为,行业面临挑战,现在没有谁的硬件能够解决,也就是说系统需要处理大量的输入信息(流图像和视频),还有非常深的网络,必须确保安全,要实时处理。


费赫认为,面向嵌入式实时推断的弹性通用DNN解决方案效率不高,虽然它具有可编程性,但是是以牺牲每瓦性能作为代价的,不值得。aiWare架构可以覆盖DNN运行96-100%的范围,可以让MAC利用率达到最大化,尽量少使用外部存储器。

aiWare已经开发了一套FPGA开发者工具包,还有一套公共基准套件,它正在开发测试芯片,用GlobalFoundries 22nm FD-SOI制程制造,产品2018年一季度就会推出。aiWare已经与英特尔(Altera)、Nvidia、NXP半导体、高通建立了合作关系。AImotive还开发了aiDrive软件套件,给自动驾驶系统和驾驶模拟器使用,它还与博世、PSA集团、沃尔沃等企业建立了合作关系。


视觉处理面临挑战,解决问题的方法有很多,不过在Linley Processor Conference会议上有一点是大家都认同的:视觉处理需要强大的硬件。传感器收集的数据相当庞大,模型越来越大,处理必须实时完成,消耗的电量必须比现有解决方案低。在未来几年里,我们会看到该领域出现更多的创新成果,因为产业正在努力。

关键字:视觉技术 引用地址:芯片的下一个大挑战在哪里?是视觉技术!

上一篇:新版AlphaGo赢过旧版:不仅会自学 且只需4个TPU芯片
下一篇:高通骁龙芯片重大变革:全面AI化

推荐阅读最新更新时间:2024-05-03 01:51

机器视觉系统设计的关键技术
机器视觉系统是综合现代计算机、光学、电子技术的高科技系统。机器视觉技术通过计算机对系统摄取的图像进行处理,分析其中的信息,并做出相应的判断,进而发出对设备的控制指令。机器视觉系统的具体应用需求千差万别,视觉系统本身也可能有多种不同的形式,但都包括以下过程: 图像采集 利用光源照射被观察的物体或环境,通过光学成像系统采集图像,通过相机和图像采集卡将光学图像转换为数字图像,这是机器视觉系统的前端和信息来源。 图像处理和分析 计算机通过图像处理软件对图像进行处理,分析获取其中的有用信息。如PCB板的图像中是否存在线路断路、纺织品的图像中是否存在疵点、文档图像中存在哪些文字等。这是整个机器视觉系统的核心。 判断和控制 图像处理
[工业控制]
仿生技术、机器视觉在高交会大放异彩
给机器人装上眼睛和鼻子,让他们代替人类从事更精密、更危险的工作——在第十六届高交会上,与视觉和嗅觉有关的仿生技术给记者留下了深刻的印象。随着科技的不断发展和进步,这些新技术将让我们的生活变得更加便捷和高效。 在机器视觉研究企业深圳华用科技有限公司展台,一款其貌不扬、仅有手掌大小的智能工业相机引起记者注意。 作为机器世界的“眼睛”,这款产品可以拍照、认知、运算,还能将数据发送给机器人,进行精密控制和运作。该产品设计者李立说,如今机器人行业发展迅速,专注于视觉领域机器人研发和制造的企业还比较少。华用科技是国内首批专门进行智能工业相机研发生产的企业之一。“人类80%的信息采集靠眼睛。给机器人装上‘眼睛’,就可以使他们做更多、更精
[嵌入式]
生物医学成像:机器视觉摄像头技术规格选择及计算方法指南
研究和诊断生物医学应用通常需要成像仪具备较高的空间分辨率、准确的色彩还原度以及弱光条件下较高的灵敏度,而且许多情况需要同时具备这三种因素,才能提高数据可靠性。选择适当的显微镜学摄像头、组织学摄像头、细胞学/细胞遗传学摄像头、落射荧光摄像头,对于临床应用进行正确诊断或研究工作提供可靠数据具有至关重要的作用。那么要怎么知道什么样的机器视觉摄像头最适合您的应用呢? 以下章节涵盖了为生物医学和生命科学应用选择机器视觉摄像头时需要考虑的方面。 要考虑的应用特定因素 分辨率与色彩精度 所需的分辨率取决于样品中目标结构相对于摄像头像素大小的放大率;也就是说,显微镜应用的高分辨率可以通过 2MP、25MP 或介于这两者之间的
[传感器]
生物医学成像:机器<font color='red'>视觉</font>摄像头<font color='red'>技术</font>规格选择及计算方法指南
视觉传感器几大技术要点:技术分类、技术实现和应用
视觉传感技术是传感技术七大类中的一个,视觉传感器是指:通过对摄像机拍摄到的图像进行图像处理,来计算对象物的特征量(面积、重心、长度、位置等),并输出数据和判断结果的传感器。 什么是视觉传感器? 视觉传感器是整个机器视觉系统信息的直接来源,主要由一个或者两个图形传感器组成,有时还要配以光投射器及其他辅助设备。视觉传感器的主要功能是获取足够的机器视觉系统要处理的最原始图像。 图像传感器可以使用激光扫描器、线阵和面阵CCD摄像机或者TV摄像机,也可以是最新出现的数字摄像机等。 视觉传感技术分类 1、3D视觉传感技术 3D视觉传感器具有广泛的用途,比如多媒体手机、网络摄像、数码相机、机器人视觉导航、汽车安全系统、生物医
[传感器]
机器视技术:机器视觉≠计算机视觉
在人们从自然界获取的各种信息中,视觉获取量最高,约占总信息量的80%。随着信息技术的发展,人类的视觉功能逐步被赋予计算机、机器人或其他智能机器。目前正处在行业风口的机器视觉就是这样一种技术,它通过图像处理实现自动检测和分析应用,包括自动检测、过程控制和机器人导航等。目前,机器视觉(MV)技术已经实现产品化。视觉传感器、镜头、高速相机、光源、视觉软件、图像采集卡、视觉处理器等都变得越来越完善。在工业自动化环境中,机器视觉越来越受到行业的关注,并被大量用于诸如自动驾驶汽车、食品生产、包装和物流、机器人和无人机等。 当提到机器视觉时,技术人员可能会很多理解,本文尝试着从四个方面逐一解释有关机器视觉应了解的真相。 真相一:机器视觉
[嵌入式]
机器视<font color='red'>技术</font>:机器<font color='red'>视觉</font>≠计算机<font color='red'>视觉</font>
智能座舱系列文二:它背后的5种交互技术视觉
第二集,这集主要分解智能座舱背后的5种交互技术,这五种交互技术就蕴含了五种技术体系以及供应链,希望能给大家一些启发。通过上一集其实我们大概也明白,智能座舱和智能驾驶同理,感知输入,处理,执行输出,这一切的围绕都是人类和环境,人类与车辆的交互。所以他背后的五种交互技术为: 视觉技术 触觉技术 听觉技术 生理传感技术 车辆本体传感技术 但写的时候发现但一个视觉以及类似就有几千字了,所以这集我们切成几个小片段,毕竟太多了让人觉得太枯燥也容易忘,这一片段主要集中在视觉技术以及小部分雷达红外线等。 视觉技术视觉反馈是人类的主要感官之一,所以显示屏幕技术是非常关键。但其实视觉触摸屏显示器现在在现
[汽车电子]
智能座舱系列文二:它背后的5种交互<font color='red'>技术</font>之<font color='red'>视觉</font>
NODAR合作英纳法 将基于摄像头的3D视觉技术集成至汽车天窗系统
据外媒报道,当地时间9月6日,多摄像头3D视觉技术领先提供商NODAR宣布与英纳法汽车天窗系统集团(Inalfa Roof Systems Group)建立了合作,后者是北京海纳川汽车部件股份有限公司旗下的全球先进工程公司。此外,NODAR还未展示一种基于摄像头的高性能3D视觉技术,而且是汽车行业领先OEM的未来汽车天窗系统的集成式方案。在于当地时间9月7日至12日举行的IAA会议上,NODAR的Hammerhead™ 3D视觉技术将集成至下一代英纳法汽车天窗原型中,并进行实时演示。 Hammerhead™ 3D视觉技术(图片来源:NODAR) NODAR首席执行官Leaf Jiang表示:“NODAR很高兴能够与英纳法
[汽车电子]
NODAR合作英纳法 将基于摄像头的3D<font color='red'>视觉</font><font color='red'>技术</font>集成至汽车天窗系统
机器视觉的摄像机标定技术你知道多少?
摄像机标定的目的:三维重建 空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系是由摄像机成像的几何模型决定的,这些几何模型参数就是摄像机参数,为了得到这些参数而进行的实验与计算的过程称为摄像机标定。 在标定过程中通常要利用数学方法对从数字图像中获得的数据进行处理。通过这些数学处理,可以得到摄像机的内部和外部参数。 一、成像几何模型 1.世界坐标系 2.摄像机坐标系 3.图像坐标系 M1只与摄像机内部结构有关,称为摄像机内部参数;M2只与摄像机相对于世界坐标系的方位有关,称为摄像机外部参数;X为空间点在世界坐标系下的齐次坐标,M为矩阵,称为透视变换矩阵。 4.空间点与像点的非线性关系分析 由于摄像机的光学
[嵌入式]
机器<font color='red'>视觉</font>的摄像机标定<font color='red'>技术</font>你知道多少?
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved