行人视频检测中阴影检测与去除方法设计-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

　　行人是城市交通系统的主要参与者，保障行人安全和减少其对机动车的干扰是城市交通系统建设的重要目标，因此对行人交通的研究也越来越受到重视。行人交通研究的主要问题［1-2］包括行人检测、目标跟踪和行为分析。基于视频的行人检测与传统的红外检测、GPS检测、激光检测等方法相比，具有不破坏路面、维护方便、实时性好、可检测的参数多等优点，成为实时交通信息采集和处理技术的发展方向。

　　视频图像中的阴影会影响行人的检测与跟踪［2-4］，因为阴影的存在会造成检测目标的变形、合并、甚至丢失，使得目标定位及计数不准确。近年来，科研工作者对图像中的阴影去除问题进行了大量研究，在这些研究方法中，考察的图像特征主要有三种：光谱特征、空间特征和时间特征［5］。光谱特征针对像素点，如灰度值、颜色信息等［6］，根据当前图与背景图的色差、亮度差值等判断像素点是否为阴影，或者对图像进行变换得到光照无关图［7］进而去除阴影；空间特征是针对某一区域或某一帧图像，根据检测到的图像的轮廓、纹理、边缘等信息判断是否为阴影，如利用图像的轮廓特征［8-9］，找到目标与阴影的边界线，对本体和阴影粗分，再建立阴影像素的高斯模板进行细分，既减少了计算量又能达到较好效果；时间特征一般都是与前两种特征结合使用，可以用于对阴影方向或运动速度的估算等，以进一步提高阴影去除效果。

　　本文提出一种新的基于YUV颜色空间的阴影去除算法，因为很多摄像头的输出信号采用YUV颜色空间，与基于RGB颜色空间的处理方法相比，省去了图像颜色空间转换的步骤，能提高处理速度。在图像特征上，本文结合像素点的光谱特征与图像整体的空间特征，首先通过亮度差和色差对像素点进行判断，再利用目标本体与阴影只相接不相交的空间特征，对去除结果进行修正，使其阴影去除效果更好。同时，为了使算法适应光照、场景等的变化，采用模糊神经网络进行目标本体与阴影的分类，用遗传算法对网络参数和权值进行自适应调整，以提高算法的鲁棒性。

　　1 YUV颜色空间

　　在色彩学上，为了可以准确定量地描述颜色，将色彩定义为三大属性：“Y”表示明亮度，即灰度值；“U”和“V”表示色度，作用是描述图像色彩及饱和度，用于指定像素的颜色。根据美国国家电视制式委员会NTSC制式的标准，白光的亮度用Y来表示，色差U、V由B－Y、R－Y按不同比例压缩而成，与红、绿、蓝三色光的关系可用式（1）描述，这也是常用的转换公式。YUV到RGB的转换公式则如式（2）所示。

　　式中，R、G、B的取值范围均为0~255。通常摄像机的数据以RGB、YUV或YCrCb的格式输出。采用YUV颜色空间的重要性是它的亮度信号Y和色度信号U、V是分离的。目前有很多种颜色空间可以将图像的色度分量和亮度分量区分开来，如HSV颜色空间，但是这种转换较为复杂，对于大型图像非常耗时，并且在亮度值和饱和度较低的情况下，采用HSV颜色空间计算出来的H分量是不可靠的。

　　在YUV颜色空间中，如果只有Y信号分量而没有U、V信号分量，则这样表示的图像就是黑白灰度图像。除去亮度信号后，由U和V单纯表现出色度。因此，如果要将U与V色差信号用色相及饱和度来表示，必须从含有三维空间的色点P投影到U-V平面的P′点，如图1（a）所示。U-V平面投影法在受到不稳定光源亮度的扰动时，对于目标色度有较大的精确性且不易辨识错误，但是当光源色温变化过大时，其饱和度和色相的增减变化不易掌握。因此，如果需要判定两个任意色点是否为同一色度时，必须确定其色相与饱和度都是相等的。如图1（b）所示，对两个色点P1与P2，当其与U轴的夹角α1=α2时，表示色相相等；当其与原点的距离L1=L2时，表示饱和度相等。当两者都相等时，表示色度完全相同。

　　对于光源亮度的不稳定因素，只要光源亮度不是极值（极亮或极暗），对于相似颜色，如深蓝色和蓝色，就有相近的色度关系。对运动目标本体和阴影，也有相近的色度，但亮度值差别较大，可通过计算当前图与背景图之间的亮度差值和色差来进行阴影去除。

　　[page]

　　上述准则在应用中，要注意Ymin、ε和Δα等阈值的选取，因为这对判断结果的影响较大。要找到合适的阈值［9］，需要对视频资料进行大量的仿真实验，这需要花费很长时间，而且根据现有资料得到的阈值不能根据场景、光照等的变化自适应进行调整，实用价值不大。

　　针对上述问题，将模糊神经网络［10-11］融入到目标本体与阴影的分类中是很好的解决方法。它利用神经网络的自学习能力和自适应能力来调整模糊规则和隶属度函数，通常对神经网络的训练采用ＢＰ算法，但是ＢＰ算法具有收敛性依赖初始条件，容易陷入局部极小值等问题。因此，本文采用遗传算法优化模糊神经网络的结构和参数，并自动获得最优的模糊规则，使网络能自动适应场景与光照的变化。

　　2.3 模糊神经网络

　　模糊神经网络的结构如图2所示。

　　式中，ui表示对第i个模糊子集的隶属度，zi表示输出结论的支集值。最后，对输出结果进行二值化表示，1表示目标本体，0表示阴影。当结果小于0.05时，认定为阴影；结果大于0.95时，认定为目标本体，当结果在0.05~0.95之间时，认为无法判断。

　　2.4 网络自适应优化

　　用遗传算法对模糊神经网络的结构和参数进行优化。网络的结构优化指确定第3层节点数、第3层和第2层的连接数、以及第3层和第4层的连接数和连接权值。网络的参数优化包括输入变量的隶属度函数的中心参数和宽度参数、输出变量的隶属函数支集值。

　　种群的每个个体由网络结构和网络的输入隶属度函数参数和结论参数组成，其长度为结构基因长度+参数基因长度。结构基因中“连接”采用二值的编码，“0”表示没有连接，“1”表示有连接，连接权值ωji用（0~1）之间实数编码。输入的隶属度参数Cji和bj、结论参数zi采用实数编码。一个染色体对应一种模糊神经网络结构及其参数。初始种群中包含着对应于最大节点数及输入变量和输出变量在其变化范围内均匀划分模糊子集的个体，其余个体随机产生。将根据经验得到的规则集及输入输出模糊划分对应的向量选入初始种群。

　　遗传操作包括复制、交叉、变异。为简化运算实现实时处理，本文仅采用变异操作。二值编码按一定的概率将控制基因串中的位从0变异为1，或者从1变异为0。实数编码按下式突变：

　　[page]

　　2.5 空间特征

　　考虑到图像中阴影和目标本体相接但互不相交，对于不能判断的像素及初步识别结果，按下述规则进行判断和修正：（1）如果周围像素点多数为“阴影”，则该点是“阴影”。（2）如果周围像素点多数为“目标”，则该点是“目标”。（3）如果周围像素点多数是目标而被判断为“阴影”，则改判断为“目标”。（4）如果周围像素点多数是阴影而被判断为“目标”，则改判断为“阴影”。这里的多数是指相邻8个像素点中5个以上。

　　3 实验结果和分析

　　图3、图4是室外拍摄的视频序列的处理结果，视频序列共2 571帧，单帧图像大小为354×288，图3是第154帧图像，图4是第363帧图像。

　　童车在图3中作为背景被提取出来，而在图4中成为前景。与图3相比，图4中光照有较大变化，图3（d）、图4（d）、图5（d）表明模糊神经网络分类器能有效地进行阴影去除。由图5（d）可见，通过阴影去除，行人能被分隔开来，这样有利于提高视频检测的准确率。

　　表1是对在不同路口拍摄的行人视频进行行人检测的结果，进行阴影去除后视频检测的平均准确率由61.52%提高到80.15%。

　　本文给出了一种新的阴影去除算法，该算法以YUV颜色空间为基础，用模糊神经网络分类器识别对像素点提取的光谱特征是否为阴影，网络的结构和参数采用遗传算法进行实时更新，最后结合运动目标与阴影的空间特征对分类结果进行修正。实验表明，该方法能适应光照、场景的变化，通过阴影去除能明显提高行人视频检测的准确率。

　　本文关于行人视频检测的研究尚处于起步阶段，对视频检测中的遮挡问题、运动描述和行为理解问题还在进一步研究中。

关键字：阴影去除模糊神经网络行人视频检测遗传算法引用地址：行人视频检测中阴影检测与去除方法设计

上一篇：消防指示灯智能监控系统三端口网关设计
下一篇：基于ARM9的指纹识别门禁系统设计

推荐阅读最新更新时间：2024-03-16 10:55

遗传算法在黑盒测试中的应用

摘要：提出了一种利用遗传算法帮助测试人员在较短时间内完成软件模块的黑盒测试，并给出测试结果和好的测试用例的方法。关键词：遗传算法测试用例耦合度在软件测试中，黑盒测试主要是针对模块进行的功能测试。最普遍的方法是以软件的功能说明书为基础将软件的输入划分为若干个等价类，多次运行该软件来检验软件对于不同的等价类是否能满足要求。但是在实际应用中，有的模块太大或输入参数太多，等价类划分后需要进行的测试工作可能是一个极大的任务。这时，如何选择最优的测试用例就成为测试人员的一个重要任务。遗传算法是模仿生物遗传和进化机制的一种最优化方法，它把类似于遗传基因的一些行为，如

[测试测量]

三分量磁通门传感器非正交性误差校正

0 引言静态地磁场是一个空间矢量场，即地磁场的值是一个既有大小也有方向的矢量值。准确地测量空间地磁场值或得到完整的地磁场信息，需要使用严格正交的三分量磁通门磁强计。通常进行地磁场测量时，往往把三分量磁通门传感器视为理想的三分量正交。但由于受加工工艺和安装工艺水平的限制，三分量磁通门传感器不可能做到绝对正交，这就给测量带来了不利影响。由于三分量磁通门传感器三轴向非正交，在某测点上当传感器运动时，其相对稳定的地磁场的标量输出并不是一个稳定的值，这就给地磁测量带来误差；由于三分量磁通门传感器三轴向非正交，致使按照理想情况进行计算的磁场标量值也产生了偏差。在分辨率要求较高的情况下，就必须考虑传感器非正交性带来的影响。在地

[嵌入式]

利用代间差分遗传算法优化分形图像编码速度

摘要：研究了分形编码过程中值域块与定义域块相似程度的分布特点，提出利用代间差分遗传算法优化其编码速度。实验结果证明了该方法的有效性。关键词：图像压缩分形编码遗传算法分形图像压缩技术是利用数字图像本身固有的自相似性，在分形理论的指导下，把图像数据转变为相关的分形参数，从而达到对数据进行压缩的目的。在一些情况下分形压缩可以达到非常高的压缩比，因此这是一种极具发展潜力的图像压缩技术。分形图像压缩的概念首先由Barnsley提出，但是Barnsely基于IFS的分形压缩方法在实话时需要人机交互，无法实现自动化的压缩过程。1990年，Janquin利用局部仿射变换代替全局仿射变换而提出了一种全自动的分形图像压缩方法，使这种图

[手机便携]

热门资源推荐
热门放大器推荐

小广播

添点儿料...

无论热点新闻、行业分析、技术干货……

发布文章

热门活动

换一批

■TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

■Follow me第二季第3期来啦！与得捷一起解锁高性能开发板【EK-RA6M5】超能力！

■报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~