嵌入式流处理器-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

由于半导体技术的不断进步和多媒体数据应用领域的不断扩大,像素帧巨大的图像处理应用的计算机体系结构,在嵌入式应用环境的体积与功耗的限制下,目前正面临着三个要解决的关键问题。一是要解决千亿次量级的运算速度;二是由于现代的半导体技术的集成度已经很高了,例如,中芯国际0.18mm的CMOS工艺在1cm2的芯片面积上可以集成40,000,000支晶体管,但由于芯片引出头数目的增加是有限的,因此,必须解决引出头的数目受限制的关键问题;三是由于多媒体数据处理几乎没有时间和空间局部性,一幅图像中的每个像素通常只是被访问一次,因而不仅要解决运算量大的问题,而且要解决处理器与存储器之间的数据带宽问题。

国内的处理器设计现在还主要处于功能仿制阶段,有单位正在研制具有MMX指令的奔腾芯片,以及具有数据并行处理能力的TMS 320C6711等芯片。就数据并行性计算来说,高性能奔腾处理器是通过57条MMX指令来支持数据并行性计算的,但其数据并行计算的程度是很低的,只能支持8个8位数据,或4个16位数据,或2个32位数据的数据并行计算。也有单位九五期间自主设计研制了含有64（8×8）个处理元的PE芯片,研制了具有4096个处理元的SIMD协处理器的图像处理机系统。但是,这些处理器还不能满足像素帧巨大的嵌入式图像处理应用的要求。

针对上述三个关键问题,近十多年来,国外对新一代多媒体处理器体系结构进行了广泛的研究,有专用多媒体处理器、可编程多媒体处理器、向量处理器以及流处理器等体系结构。

　　专用多媒体处理器

针对三维图形应用,SGI公司研制了名为InfiniteReality的专用多媒体处理器系统（1997年公布）。它由4个专用的几何引擎（Geometry Engine）和80?320个专用的图像引擎（Image Engine）构成,能提供每秒11,000,000次三角函数计算和每秒830,000,000个像素的处理。它是以存储容量的冗余为代价来提高存储器带宽的。最近,NVIDIA公司研制了名为GeForce256的专用单芯片图形处理器。该处理器能提供每秒15,000,000次峰值运算和每秒480,000,000个像素处理。这些专用多媒体处理器的缺点是只要算法稍有变化,性能就会急剧下降。

　　可编程多媒体处理器

Chromatic公司研制了名为Mpact的多媒体处理器（1996年公布）,Philip公司研制了名为TriMedia（1996年公布）和VSP（1994年公布）的多媒体处理器。它们比专用图形处理系统要灵活得多。Mpact多媒体处理器有一个4KB的全局寄存器文件（Register file）,并且利用了高带宽的Rambus DRAM来满足3-D图形处理对带宽的需求。这个相当大的全局寄存器文件,在很大程度上减小了图形处理中对工作页面进行显式缓存所需的带宽量,进而减少了对存储器的访问次数。在奔腾等高性能处理器中,通过MMX,MAX-2,和VIS,增加了多媒体扩展,也就是增加了来自存储器的预取流数据,并利用这些处理器中可以得到的数据带宽,增加了浮点数据类型SIMD操作,以支持数据并行性。

　　向量处理器

向量处理器是通过向量操作来支持数据并行性的处理器。为了有效地利用向量计算中的数据并行性,向量处理器的结构通常包括向量寄存器文件、深度流水的ALU和一维的SIMD组织形式的多种组合。向量寄存器文件存储的是数据向量,而不是单个的数据字,它们是在对向量进行操作时,顺序地进行传送的。不仅图像处理采用向量处理器技术,当前世界上处理速度最快的超级计算机——日本NEC的《地球仿真测试系统》,也是以0.15mm工艺实现的向量处理器为基础,由5120个向量处理器（共有640个节点,每个节点有8个向量处理器）组成的。

　　流处理器

流处理器是直接将多媒体的图形数据流映射到流处理器上进行处理的,有可编程和不可编程两种。1995年公布的名为Cheops中的流处理器,是针对某一个特定的视频处理功能而设计的一种不可编程的流处理器。但为了得到一定的灵活性,系统中也包含一个通用的可编程处理器。

从1996年到2001年,MIT和Standford针对图像处理的应用,研制了名为Imagine 的可编程流处理器。Imagine流处理器没有采用cache,而是采用一个流寄存器文件SRF(Stream Register File),作为流（主）存储器与处理器寄存器之间的缓冲存储器,来解决存储器带宽问题的。流存储器与SRF之间的带宽是2GB/s,SRF与处理器寄存器之间的带宽是32GB/s, ALU簇（ALU Cluster）内寄存器与ALU之间的带宽是544GB/s,三种带宽的比例关系为1:16:272。

关键字：图像可编程向量引用地址：嵌入式流处理器

上一篇：基于CELL Broadband Engine开发高性能应用
下一篇：基于自适应技术的动态CPU供电单元

推荐阅读最新更新时间：2024-03-30 21:22

基于双CPU实时图像监控系统的设计

图像监控以其直观、方便、信息内容丰富而被广泛应用于许多场合。在电子技术与通讯技术的发展过程中，图像监控系统的技术水平直接反映了不同阶段电子与通讯的技术状况。上世纪90年代末，随着多媒体技术、视频压缩编码技术和网络通讯技术的发展，数字视频监控系统迅速崛起。在数字图像监控系统中，嵌入式监控系统主要由嵌入式处理器、以太网接口控制器等相关支撑硬件及嵌入式操作系统组成。 1 设计方案采用TI公司的TMS320VC5471为处理器，此芯片是一种双内核器件，内部集成了一个带程序和数据存储器(均为RAM)的 TMS320C54x DSP子系统和一个带仿真工具的ARM7TMRISC微控制器核。在双CPU系统中，ARM7TDMI作为主CPU，

[单片机]

基于双CPU实时<font color='red'>图像</font>监控系统的设计

一种自适应耦合TV和高阶PDE的图像放大模型

摘要：针对TV模型存在分块效应，而四阶PDE模型具有保持平坦区域光滑性的特点，提出自适应耦合TV和四阶PDE的正则化图像放大模型。根据图像内容合理调整耦合系数，在图像渐变和平坦区域运用四阶PDE扩散，消除分块效应；而在图像的突变区域运用TV模型滤波，保持突变边缘。实验结果表明，该算法是一种有效的图像放大方法。关键词：图像放大；偏微分方程；总变分；高阶PDE 0 引言图像放大指增大图像尺寸或提高其分辨率，同时保持较高的质量，以得到一个较好的视觉效果，或突出某些细节。图像放大通常可分两步进行：首先对图像进行空间变换；其次对图像进行灰度级插值、处理。传统的线性插值算法有最近邻法、双线性插值法以及三次样条插值法等。这些方法用

[工业控制]

一种自适应耦合TV和高阶PDE的<font color='red'>图像</font>放大模型

思特威发布全系列手机应用了CMOS图像传感器

在智能手机多摄像头系统及智能化摄像应用的发展趋势下，高性能智能手机相机的市场需求始终热潮不退。而CMOS图像传感器作为摄像系统的核心部件，在巨大的市场需求催动下不仅出货量连年动态范围等成像性能上也在迅速地迭代和精进。近日，技术领先的CMOS图像传感器供应商思特威科技（SmartSens），全新推出了全系列手机应用图像传感器产品 | Cellphone Sensor (CS) Series产品—— SC200CS-mono/SC200CS-color，SC500CS，SC800CS，SC1300CS/SC1301CS，可覆盖2MP至13MP手机摄像头应用方案，满足智能手机客户的多元化需求，为智能手机摄像头提供行业领先的高品质成像性

[手机便携]

思特威发布全系列手机应用了CMOS<font color='red'>图像</font>传感器

提高电池性能的关键：研究人员获得首个真实的SEI层图像

比起目前的锂离子电池，锂金属电池可以在既定空间内储存更多的电荷。一场开发锂金属电池的竞赛正在拉开序幕，以用于下一代电动汽车、电子产品和其他用途。但是，电池中的电解液会腐蚀锂金属负极的表面，在负极表面形成一层薄薄的粘性物质，称为固态电解质界面，简称SEI。虽然SEI的形成被认为是不可避免的，但研究人员希望稳定和控制该层生长，以充分提升电池性能。然而，到目前为止，在正常工作的电池中，SEI浸透电解质时会是什么样子尚不明了。（图片来源：SLAC）据外媒报道，最近，美国能源部SLAC国家加速器实验室（SLAC National Accelerator Laboratory）和斯坦福大学（Stanford Universi

[汽车电子]

提高电池性能的关键：研究人员获得首个真实的SEI层<font color='red'>图像</font>

擦除解码和伽玛层重传技术消除IPTV图像问题

网络电视也称为IPTV，是三网合一应用中向用户提供的语音(VoIP)和数据服务之外的第三种服务。现有IPTV用户中，约80%通过xDSL接入，因此ADSL2+是现阶段的首选IPTV操作平台。尽管VDSL2带宽更高，但ADSL2+却拥有覆盖范围更广、成本更低这两项明显的优势。可以预计，在未来数年里，这两项xDSL技术将继续被用于IPTV，并且相得益彰。由于xDSL采用常规的铜导线传输，而铜导线这种传输介质本身易受干扰，因此IPTV有时也会受到影响。现在，已有创新性技术能够实现无干扰的IPTV接收。对于数据传输以及视频点播或网络电话等服务，DSL受到的干扰通常可忽略不计，但由于视频流具有实时性，DSL受到的干扰可能会给IPTV应

[网络通信]

擦除解码和伽玛层重传技术消除IPTV<font color='red'>图像</font>问题

内嵌ARM核的FPGA芯片EPXA10及其在图像驱动和处理方面的应用

摘要：介绍了内嵌ARM核的FPGA芯片EPXA10的主功能特点、内部结构及工作方式，通过其在图像驱动和处理方面的应用，体现了EPX10逻辑控制实现简单、对大量数据做简单处理速度快以及软件编程灵活的特点。关键词：ARM FPGA EPXA10 图像驱动图像处理随着亚微米技术的发展，FPGA芯片密度不断增加，并以强大的并行计算能力和方便灵活的动态可重构性，被广泛地应用于各个领域。但是在复杂复法的实现上，FPGA却远没有32位RISC处理器灵活方便，所以在设计具有复杂算法和控制逻辑的系统时，往往需要RISC和FPGA结合使用。这样，电路设计的难度也就相应大大增加。随着第四代EDA开发工具的使用，特别是在IP核产业的迅猛发展下产生的S

[半导体设计/制造]

最新的一次性可编程和可再编程时钟产生器概述

最新的一次性可编程和可再编程时钟产生器概述 iframe src="http://player.youku.com/embed/XMjg0MTI4NTgzNg==" width="510" height="498" frameborder="0" /iframe

[嵌入式]

连皮肤血管都能看清，SeeDevice全新图像传感器有多牛

SeeDevice公司全新图像传感器的性能远远超过目前最好的数码单反相机，可以让自动驾驶汽车更快地看到障碍物，据说还可以显示穿过皮肤的血液含量。如今，智能手机已经足够完美到可以拍摄专业的素材照片。但第一批安装在手机上的摄像头可以说是并不是那么受到青睐。但如今摩尔定律、多镜头和人工智能驱动的算法结合在一起，创造出了令人难以置信的图像品质。在过去几年里，动态范围和低光捕捉技术取得了显著进步。尽管今天的智能手机有着令人印象深刻的功能，但是在普通摄影和计算机视觉方面，更先进的成像功能仍在前方。 The SeeDevice sensor can capture blood vessels through the skin.

[传感器]

热门资源推荐
热门放大器推荐

小广播

添点儿料...

无论热点新闻、行业分析、技术干货……

发布文章

热门活动

换一批

■TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

■Follow me第二季第3期来啦！与得捷一起解锁高性能开发板【EK-RA6M5】超能力！

■报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~