基于CBIR技术的手机人脸识别系统设计

发布者:qpb1234最新更新时间:2009-11-18 来源: 现代电子技术关键字:人脸识别  CBIR  接口  数据库  GUI 手机看文章 扫描二维码
随时随地手机看文章

  狭义的人脸识别(Face Recognition)特指通过人物面部进行身份确认或身份查找。目前,人脸识别技术已趋成熟,不同类型的商用系统已投入使用。人脸识别系统通过建立自动人脸识别报警网络,对特定区域的特定人员进行摄像机自动识别发现,未经登记授权进入特定区域的人员,系统即定向报警。目前的人脸识别系统设备体积较大,移动性能差,不便于携带,难以普及和广泛应用。通信技术日新月异,智能手机的摄录等功能愈加强大和普及,设计融合CBIR技术与手机通信技术的便携式人脸识别系统已成为可能。它不仅具有一般的人脸识别系统确认和查证的功能,而且充分利用了无线通讯的优势,可被广泛应用在电脑或网络安全、访问控制、门禁和考勤、户证管理、公安追逃、出入境边检、机场安检、驾照或护照等重要证件的身份认证等多种不同的安全领域,其移动性的便携功能是一般的人脸识别系统无法替代的,因而有着更为广泛的应用前景。

  1 CBIR技术

  CBIR(Content Based Image RetrievaI)即基于内容的图像检索,属于图像分析和信息处理的研究领域,是指直接采用图像内容进行图像信息的查询,目的是在给定查询图像的前提下,依据其内容信息或指定的查询标准,在图像数据库中进行内容上一致或相似性匹配,最终提供符合查询条件的相应图像。

  1.1 CBIR的基本原理

  CBIR一般由图像标引系统和图像检索系统两部分构成。图像标引系统索引图像文件并按设计要求设置检索标目即检索点,形成一个可供匹配检索的有序的标目索引系统。该系统按设计功能提供颜色、纹理、形状和对象等不同图像底层视觉特征的检索入口。

  1.2 CBIR的主要检索内容

  CBIR的主要检索内容有颜色、纹理、形状和对象等。颜色特征包括图像颜色分布、相互关系和组成等;纹理是指图像纹理结构、方向、组合及对称关系等;形状是指图像轮廓组成、形状、大小等;对象包括图像子对象的关系、数量、属性和旋转等。

  1.3 CBIR的特点

  CBIR可以直接从图像中抽取特征和语义,检索过程与语义提取直接相连,使得检索过程更加有效,适应性更强;用相似匹配(Similar Match)代替精确匹配(Exact Match),即采用相似比对的方法获得类似图像结构,渐近趋同,直至获得符合要求的结果;用户可以通过浏览选择示例或自己绘制图形来查询,并可不断改进检索式,细化检索过程;提供基于客观属性(关键词)的检索,基于内容的检索,基于对象关联检索以及概念检索等多层次的高效检索。

  1.4 CBIR技术的应用系统

  在CBIR领域,经过十几年的理论研究,产生了许多比较成熟的算法和一些有价值的系统。现普遍采用低层次的图像信息(如图像颜色、纹理、形状等)来实现图像内容查询。如IBM研究中心开发的QBIC(QueryBy Image Content)图像检索系统,哥伦比亚大学的Visual SEEK图像查询系统,麻省理工学院实验室开发的PhotoBook系统,美国UIUC大学的MARS系统等。为进一步提高检索的准确性,CBIR系统采用相似度算法,计算用户提交结果与索引数据库中记录的相似度大小,提取出满足阈值的信息作为结果并按照相似度降序的方式输出,并在同一次检索过程中不断地与用户进行交互,系统通过对这些反馈的相关信息进行学习,再次进行下一轮检索,从而达到用户的要求。

  2 基于CBIR技术的Web应用实例

  上述“基于CBIR技术的应用系统”中的系统主要利用图像的颜色、纹理、形状等进行相似度比较,多数是基于图像的底层视觉特征进行检索的,没有完整的 Web实现方案,距离普遍使用相去甚远。目前,完整实现Web化的CBIR技术应用网站主要有www.like.com和 www.polarrose.com。

      www.like.com是一个商业性的服饰购物网站,它以独特的技术实现了对服饰图像的查询和检索。用户提交衣服、鞋帽、手饰等的照片,通过匹配检索后,网站会返回该服饰的品名、价格等相关信息。该系统的最大局限性在于搜索的内容只能是服饰,并且是世界知名产品。有趣的是提交一张名人照片,就可以搜索出名人穿戴的东西,返回一系列类似服饰的价格列表供购物参考。

  www.polarrose.com利用其自有的二维图像三维模型转化技术,提供免费的面部图像检索服务。该服务是结合客户端的运行软件和服务器端的处理功能而实现的。客户端软件以电脑网络浏览器Firefox和IE的客户端软件形式对外公开。当用户浏览网站并显示含有人物面部图像的静态图像时,上述客户端软件就会在人物面部产生一个小标志。点击该标志,就能检索出面部与该人物类似的图像。假如该人物的名字已经登记到PolarRose数据库,还可确认其名字。如果选择的人物尚未登记名字,用户还可自行登记名字或更正错误的名字。PolarRose公司的副总裁尼古拉斯这样描述它的功能:“利用我们的人脸搜索技术,你就可以根据人脸部的一些基本特征,实现在不同场景、灯光的照片里寻找同一个人,只要能看清他的脸。”

   3 系统设计

  基于Internet的普及、CBIR技术的日趋成熟及其Web实现方案的成功实践,提出CBIR、Internet和无线通讯技术三位一体的设计思想,以实现一种新型的以手机为载体的移动人脸识别系统,如图1所示。

  该系统的工作原理和人脸识别过程如下:用户通过智能手机自身的拍照功能对需要确认的人物进,行面部特征拍摄,将图片以手机短信形式发送至服务器,服务器将其与数据库中存贮的图像进行“基于内容的”匹配处理后,再将匹配程度高的图片信息以短信形式发送回手机用户,用于进行人物确认。

  3.1 系统运行流程

  首先建立CBIR技术支持的人物面部图像数据库,在人物面部图像数据库中要对面部特征进行提取和标引等有序化处理,进而建立存贮面纹编码的面部特征库。这是系统工作的基础和前提。在此基础和前提的支持下,用户将手机拍摄的图像通过无线网络发送至服务器,对接收到的图像进行面部特征提取,而后在特征库内进行匹配检索,将相似度高的图片信息用SMS形式回发至手机用户,用于身份确认。

  3.2 系统开发工具及运行环境

  开发工具:Microsoft制作发行的Visual Studio2008 Tearn Suite系统;操作系统:Windows 2003 Serv-er;应用服务器:JRun 4.0,JRun是一款Macromedia公司开发的Java应用服务器,提供快速可靠的J2EE兼容平台,如果希望在Web应用中添加服务器端 Java功能,那么JRun将是最为明智的正确选择;后台数据库:Oracle9i,Oracle9i是由Oracle公司开发的面向Inter-net 支持关系对象模型的分布式数据库和高度集成的、智能化的互联网应用基础平台,是Oracle9i Database,Oracle 9i Application Server和Oracle9i Developer Suite的完整集成;服务器数量:2台。

  3.3 系统模块说明

  (1)数据库

  图像数据库1:利用Spider网络蜘蛛程序抓取网页中的人物图像及其说明文字存入图片数据库1,用以弥补专业图像库数量上的不足。

  图像数据库2:由专业图像及其注释组成,目的是为用户提供权威性的解释。

  图像特征库1:提取图像数据库1中的图像面部特征,将面纹编码存入图像特征库1。

  图像特征库2:用来存放图像数据库2中图像的面纹编码。

  “面纹编码”是根据脸部的本质特征和形状来工作的,它可以抵抗光线、皮肤色调、面部毛发、发型、眼镜、表情和姿态的变化,具有强大的可靠性,可以从百万人中精确地辨认出一个人。

  (2)图像特征提取器

  该模块由算法组成,特征向量法和面纹模板是提取器用到的两种主要算法。

  特征向量法是先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等属性,然后再计算出它们的几何特征量,这些特征量形成一描述该面部的特征向量;面纹模板法是在库中存贮若干标准面像模板或面像器官模板,在进行比对时,将采样面像所有像素与库中所有模板采用归一化相关量度量进行匹配。此外,还有采用模式识别的自相关网络或特征与模板相结合的方法。

  (3)索引器

  Index是一个图像整序模块,它对图像数据库和图像特征库进行分类索引。对图像数据库进行索引是优化数据库组织结构和提高系统工作效率的有效方法,实际上它是对图像的面纹编码进行有序化处理,可以有效缩小检索范围,提高系统的响应速度。

  (4)GUI

  GUI(Graphical User InteRFace,图形用户接口),是屏幕产品的视觉体验和互动操作部分。GUI是一种结合计算机科学、美学、心理学、行为学及各商业领域需求分析的人机系统工程,强调人一机一环境三者作为一个系统进行总体设计。这种面向客户的系统工程设计的目的是优化产品的性能,使操作更人性化,减轻使用者的认知负担,使其更适合用户的操作需求,本系统的GUI主要涉及网络查询部分和手机部分。

   (5)主要接口

  手机通过基站与系统服务器的连接,主要通过CMPP或SGIP协议实现。CMPP和SGIP(在CD-MA上是ETIP)协议分别是解决中国移动和中国联通提供的短消息互联网接人方案,它们规定信息资源站实体与互联网短信息网关的应用层接口协议。CMPP和SGIP可以为实现移动数据增值业务提供服务,包括以下业务:Email通知、语音信箱通知、Internet发送短信息、移动平台发Email、催费通知、自动综合业务信息台。

  4 结 语

  本文所述人脸识别系统成功地融合并应用了CBIR技术、Internet技术和手机通信等现有的技术成果,其独创性在于将短信息服务与手机拍照功能和基于 CBIR技术的Web识别系统有机地容为一体,这一以手机为载体的人脸识别系统既是手机增值业务的延伸,同时也为众多领域内基于CBIR技术的识别系统提供了积极的借鉴和更为广阔的应用空间。

关键字:人脸识别  CBIR  接口  数据库  GUI 引用地址:基于CBIR技术的手机人脸识别系统设计

上一篇:高通展示首款智能笔记本 由联想制造
下一篇:基于开源软件的嵌入式网络打印服务器

推荐阅读最新更新时间:2024-05-02 20:55

硅谷数模分享SlimPort最新进展及All-in-one接口技术愿景
硅谷数模努力打造SlimPort生态圈,推出创新通用控制台NANO.CONSOLE 日前,在EEVIA主办的年度ICT媒体论坛暨2015产业和技术趋势展望研讨会上,DisplayPort解决方案领域市场领先企业 硅谷数模半导体公司市场总监梁倩女士发表主题演讲,与中国主流专业媒体人士分享了硅谷数模在数字高速显示接口方面最前沿的技术以及最新的部署进展,并着重介绍了硅谷数模在CES2015上刚刚发布的可颠覆OTT盒子和主机游戏以及移动计算的创新通用控制台 SlimPort NANO.CONSOLE。 SlimPort NANO.CONSOLE 颠覆性的 硬件APP 新款SlimPort NAN
[手机便携]
硅谷数模分享SlimPort最新进展及All-in-one<font color='red'>接口</font>技术愿景
ARM/DSP双核系统的通信接口设计
引 言   嵌入式系统的核心是嵌入式微处理器和嵌入式操作系统。早期的嵌入式系统硬件核心是各种类型的8位和16位单片机;而近年来32位处理器以其高性能、低价格,得到了广泛的应用。近年来,又出现了另一类数据密集处理型芯片DSP。DSP由于其特殊的结构、专门的硬件乘法器和特殊的指令,使其能快速地实现各种数字信号处理及满足各种高实时性要求。随着现代嵌入式系统的复杂度越来越高,操作系统已成为嵌入式系统不可缺少的部分。免费的嵌入式操作系统,如Linux等,随着自身不断的改善,得到了飞速的发展。Linux是一个免费的、强大的、可信赖的、具有可伸缩性与扩充性的操作系统。Linux实现了许多现代化操作系统的理论,并且支持完整的硬件驱动程序、网络通
[工业控制]
提高设计复用能力并降低开发成本,DAC呼吁制定IP复用标准
设计自动化会议(Design Automation Conference, DAC)的一个专门研究小组尝试确定交换芯片知识产权(IP)需要的数据模型。小组成员都认为需要IP复用标准,但是没有就达成目标的具体步骤获得一致。 三星公司的SoC R&D Center的高级研究经理Songjoo Yoo认为在目前45纳米及以下的工艺技术下SoC设计极为复杂,IP提供方和接受方之间的交换需要标准化的方法,这样能够提高设计复用能力,并降低开发成本。 ARM公司设计技术经理John Goodenough认为复杂的SoC需要来自各方的IP,AMBA或者OCP互联接口等IP互用性标准在体系结构层级提供帮助,降低总体系统验证工作。ARM支持IP-
[焦点新闻]
英伟达“AI假脸王”开源:新一代GAN攻破所有人脸识别系统
还记得英伟达去年推出的StyleGAN吗?全新的生成器架构让这个“新一代GAN”生成的人脸真实到可怕。现在,StyleGAN已经开源,包括源代码和官方TensorFlow实现,附有详细使用说明。多说一句,还请谨慎使用,不要让StyleGAN成为第二个DeepFake。 还记得英伟达震撼世人的 新一代GAN 吗? 以假乱真的精细人脸生成,令不少研究人员都惊呼:已经无法分辨虚拟和现实! 上述人脸全部由计算机生成,StyleGAN的全新风格迁移生成器架构能控制发色、眼睛大小等脸部特征。来源:github.com/NVlabs/stylegan 论文、源代码、高清Flickr人脸图像数据集等所有的材料都公布了出来,非商业使用的情况
[安防电子]
英伟达“AI假脸王”开源:新一代GAN攻破所有<font color='red'>人脸识别</font>系统
利用FPGA解决TMS320C54x与SDRAM的接口问题
  在DSP应用系统中,需要大量外扩存储器的情况经常遇到。例如,在数码相机和摄像机中,为了将现场拍摄的诸多图片或图像暂存下来,需要将DSP处理后的数据转移到外存中以备后用。从目前的存储器市场看,SDRAM由于其性能价格比的优势,而被DSP开发者所青睐。DSP与SDRAM直接接口是不可能的。   FPGA(现场可编程门阵列)由于其具有使用灵活、执行速度快、开发工具丰富的特点而越来越多地出现在现场电路设计中。本文用FPGA作为接口芯片,提供控制信号和定时信号,来实现DSP到SDRAM的数据存取。    1 SDRAM介绍   本文采用的SDRAM为TMS626812A,图1为其功能框图。它内部分为两条,每条1M字节,数据宽度为8
[模拟电子]
250mA 通用蜂窝电话LED驱动器以91% 的效率提供9 个独立电流源
2007 年 8 月 7 日 - 北京 - 凌力尔特公司( Linear Technology Corporation )推出无电感器型、低噪声、高效率 LED 驱动器 LTC3219 ,该器件用于蜂窝电话显示和照明。 LTC3219 为主、副和 RGB 显示屏提供 9 个独立的可配置电流源。显示屏电流通过精确的内部电流基准设置。这些通用电流源能以数字方式控制,具有独立的调光、亮度、闪烁和灰度控制,可通过简单的两线 I 2 C 串行接口编程。 LTC3219 的 2.9V 至 5.5V 输入电压范围已经为单节锂离子 / 聚
[新品]
从刷手解锁到脑机接口 人体芯片植入能做些什么?
购物刷手机、坐车刷交通卡、进办公室刷门卡,对我们来说都已习以为常。所有操作都无须设备间有物理接触,这大大方便了我们的生活,不过要刷的东西越来越多也苦了一些马大哈,出门忘带了任何一样,那整天都会一团糟了。既然这些东西都是非接触式的,能不能直接装在身上省去麻烦?国外的一些极客早就开始这么做了,最近,一些公司也行动起来,他们做的就是人体芯片植入。   简单的芯片植入,挥手搞定所有刷卡场景   2017年夏天,美国威斯康星州一家公司允许员工自愿植入微型芯片,芯片具有快捷支付、开启公司大门、登录公司电脑、使用复印机等多种功能。澳大利亚墨尔本的一家公司也在10名志愿者手上植入了一块微型芯片,刷手就可打开家中大门、乘坐公共交通,还有闲人用它来
[手机便携]
USB接口单片机SL11R的特点及应用
    摘要: 介绍了USB接口单片机SL11R的主要特点,并简要地说明了SL11R基本应用系统的组成和开发。     关键词: USB 单片机 SL11R SL11R是Scanlogic公司生产的带有USB接口的16位RISC单片机,内核处理速度达48MIPS,有很强的控制功能和灵活的工作方式。SL11R固化有类似于80X86的内部BIOS,可以直接调用,使用非常简单,可以让开发者在很短的时间内完成设计任务。 1 USB接口简介 USB总线是通用串行总线(Universal Serial Bus)的简称,已经成为PC机的标准接口。目前256以上的PC机基本上都已经配置了USB接口。USB接口具
[应用]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved