0 引言
智能机器人研究在当前机器人研究领域具有十分突出的地位,其显著的特点是具有环境感知、判断决策、人机交互等功能。具体地说,应该具有可移动性,能根据命令或需要到达指定工作地点或区域;应具有图像识别能力,可进行人脸识别、物件识别、视觉导航;具有语音识别与合成功能,可进行人机语音交互,包括用语音命令控制机器人工作、人机语音对话聊天、媒体(视频、音频)语音点播、语音信息查询、文本语音播放等;具有超声波测距与避障功能;具有轨迹跟踪功能;具有测光与光源跟踪功能等。这些功能要求控制系统应具有较好的协调性、实时性和可靠性。针对智能机器人的上述功能特性,我们设计并实现了基于分布式控制系统的轮式智能机器人。
1 分布式控制系统
智能机器人的控制对象及功能较多,比较理想的控制系统解决方案是采用分布式控制系统(Distributed Control System,DCS),将控制功能在下位机分散,每个下位机完成一项特定功能,各下位机便可实现并行工作,这将大大提高整个系统的处理速度和能力。 DCS的核心思想是集中管理、分散控制[1],即管理与控制分离,上位机用于集中监视管理功能,下位机分散到现场实现分布式控制,各上下位机之间通过控制网络互连以实现信息传输。显然,采用DCS方案有如下明显优点:实现集中监控和管理,管理与现场分离,管理更能综合化和系统化;实现分散控制,可使各功能模块的设计、装配、调试、维护独立,系统控制的危险性分散,可靠性提高,投资减小;采用网络通信技术,可根据需要增加以微处理器为核心的功能模块,具有良好的系统开放性、扩展性和升级特性。
CAN(Controller Area Network)总线[2]作为连接各上下位机之间的通信网络,非常适用于分布式控制系统,因为它具有许多优点:CAN控制器工作于多主方式,网络中的各节点都可根据总线访问优先权向总线发送数据,通信方式灵活;CAN节点在错误严重的情况下具有自动关闭输出功能,以使总线上其他节点的操作不受影响,因而具有突出的可靠性;CAN总线的通信协议可由CAN控制器芯片及其接口芯片来实现,从而大大降低系统开发难度,缩短了开发周期;CAN总线结构简单,只有两根信号线,挂接在总线上的设备可方便地增减,因而具有优良的扩展性;此外,CAN总线还有传输速率高、实时性强、开放性好、成本低等特点。
2 控制系统的结构
基于CAN总线的分布式控制系统的上位机由主控计算机及所属的语音和图像处理单元构成,下位机则是由以1至5号单片机为核心的功能模块所组成,它们分别是移动平台伺服控制器模块、测距控制器模块、寻迹控制器模块、测光控制器模块、系统监控与电源管理模块,控制系统结构图如图1所示。
由图可见,这是一个典型的分布式控制系统结构。各功能模块单元电路在逻辑上相对独立,每个模块都是一个以自己的处理器(单片机)为核心的功能完整的子系统,且完成一项特定的功能,各单元均通过CAN控制器和CAN驱动器与CAN总线相连,实现与上位机及其它功能模块之间的信息传输。系统监控与电源管理模块除和CAN总线相连外,还有一组状态线和控制线分别与其它各功能模块相连,一方面,该功能模块要通过状态线实时监测其它功能电路的工作状态,另一方面,还要根据主控计算机的控制决策或突发事件(如电路故障报警)通过控制线对相应电路模块进行实时控制(系统复位、切断或接通电源等),以完成系统监控功能。
图1 控制系统结构图
3 智能机器人的结构及功能模块
3.1 主控计算机
主控计算机是分布式控制系统的上位机,主要用于人机语音交互、系统管理、控制决策、任务调度、图像识别与处理等。主控计算机软硬件结构图如图2所示。
图2 主控计算机软硬件结构图
功能完善的语音识别与合成、图像处理等系统往往比较庞大,需要操作系统和其它相关软件资源作支撑,又由于这些信息的处理运算量大,因此,这几项功能的实现以及分布式控制系统中的主控计算机须由一台高性能PC机承担。故上位机不仅具备系统管理、控制决策及任务调度等功能,还同相关设备或部件(CCD、图像采集卡、声卡、音频功放、调频发射与接收机等)一起组成语音识别单元、图像识别单元、语音合成单元等功能单元。[page]
3.1.1 语音控制台
人是机器人的最高决策者和命令下达者,对我们设计的这款机器人下达任何命令均通过语音控制台(手持式微型无线调频话筒)以语音方式实现。这种方式降低了人对机器人的操控难度,使之变得友好、自然,实现了真正意义下的人机对话。
3.1.2 语音识别单元
语音识别是本机器人的关键技术之一。针对不同的应用目的和平台,语音识别有多种实现途径,如用于语音玩具的只能识别较少数量孤立单词的简易专用语音识别芯片;面向嵌入式系统或设备,对系统资源要求不高的基于DSP或其它MCU的语音识别模块;支持多服务器和分布式语音识别的解决方案;基于PC环境的语音识别系统等。
由于语音识别是人机交互的关键,因此,本系统宜采用面向PC平台、功能强大、性能优异的具有连续语音识别能力的软件,如比较成熟的IBM ViaVoice SDK,以及中科院自动化所推出的基于PC平台的Pattek ASR/P2.0 SDK,这两个产品都具有许多共同特点,如识别率高,对环境噪声和口音的适应能力强;具有非特定人语音识别功能,适合不同性别和口音的普通话;接口丰富,便于二次开发,可有效缩短开发周期;抗干扰能力强;词表替换方便,且不需要重新采集语音数据训练模型等。
3.1.3 图像处理单元
本智能机器人的图像处理单元可实现人脸识别、物件识别与视觉导航。机器人视觉是近年来人工智能研究的活跃课题,也是我们本次机器人研究的重要子课题。一个优秀的人脸及物件目标自动识别系统应具有训练时间短,识别速度快,识别准确率高等特点,因此,算法的研究通常基于这几个特点展开。典型的KL算法在提取图像的代数特征方面,其效率和速度均有待提高,且得到的特征向量的可分性也不好;虽然统计不相关最佳鉴别变换拥有很好的分类效果,但如果直接利用图像向量构造图像散布矩阵运算量又会太大,导致识别速度降低。
在经典代数特征提取方法基础上,我们设计并实现了基于KL和统计不相关最佳鉴别变换的人脸及物件识别算法,较好地解决了运算量和识别速度、识别准确率之间的矛盾。实际应用表明,这套人脸及物件自动识别系统具有性能稳定可靠、识别速度快、识别准确率高等优点。
我们将改进后的算法在计算机上实现,并使用最小距离分类器进行识别测试,最终结果表明:训练时间明显减少,训练200幅图像的时间小于80秒,训练全部400幅图像的时间小于480秒;识别速度均在1秒之内,有较大提高;识别正确率提高,平均正确识别率明显高于单独的KL和统计不相关最佳鉴别变换方法,可达92%以上。
图像处理单元还有一个重要功能,即用于视觉导航。视觉导航是近年来发展起来的一种先进导航技术,然而,视觉导航是一个十分具有挑战性的复杂课题,实现该项技术具有很高的难度。其中一种方案是视觉导航系统通过识别路径引导线或标志信息为机器人提供视觉导航,在这种方案中,路径识别是视觉导航的关键。具体思路是:系统通过边缘检测法检测路径引导线,并计算自身相对于引导路径的位姿值,从而进行导航控制。
3.1.4 语音合成单元
要实现人机语音交互,机器人除应具备能听懂人的自然语言的语音识别系统(Speech Recognition,SR)外,还应具备能开口说话的语音合成系统(Speech Synthesis,SS)。TTS(Text-to-Speech)即文语转换,是将文字信息转换成语音的一种技术。实现TTS的核心技术很复杂,然而,为帮助软件开发者开发语音软件,微软公司提供了支持中文文本的识别和合成语音引擎Microsoft Speech SDK 5.1,利用该引擎,我们可轻松实现TTS,创建具有TTS功能的应用程序。
3.2 移动平台伺服控制器
本轮式机器人由轮式移动平台和平台上的机器人头部组成。机器人头部安装有一部带有控制云台的摄像机、一对全频音箱、4个超声波传感器、8只光敏传感器等零部件,而主控计算机、各功能模块电路板、电池组、调频接收机、音频放大器、红外光电传感器等零部件则安装在移动平台上。轮式移动平台采用3组正交轮驱动,具有3个自由度,可实现仿人灵活移动。如图1所示,由移动平台伺服控制器、PWM放大器、驱动电机和增量式光电码盘构成速度闭环控制。
3.3 测距控制器
在机器人头部装有4个超声波传感器,用于检测四个方向的障碍物信息,以实现测距与避障功能。传感器的有效检测距离在0.3m至5m之间,误差小于5cm。
3.4 寻迹控制器
5只用于寻迹的红外光电传感器置于机器人正前方,方向朝下,呈对称分布,用于检测地面的路线轨迹。
本机器人有多种导航方式。第一种是在其运动路径上设置导航信息媒体,由传感器检测导航信息的特性,控制机器人按规定的路线行驶的外导式[3],本机器人利用CCD进行路径识别的视觉导航、利用红外光电传感器检测地面的路线轨迹进行导航、利用超声波传感器进行的导航、利用光敏传感器进行的导航等导航方式均属于外导式。第二种是内导式,即按运动规划或预先设定的运动路径行驶的导航方式。
3.5 测光控制器
安装在机器人头部,彼此呈45度角的8只光敏传感器,连同对应的8路A/D转换器和测光控制器,构成测光单元,用于检测或追踪光源。在光敏传感器和测光控制器之间加入A/D转换器,可精确检测不同方位的光强度。
3.6 系统监控与电源管理
系统监控与电源管理模块负责对整个控制系统的工作状态实施监控和管理。该模块具备以下功能:当某一电路或功能模块发生故障时,由该模块向主控计算机和其它模块发出报警信息,并将该模块复位,复位后若故障消失,则解除警报,否则关闭该模块,并通知其它电路停止与该模块通信;实时监控系统工作状态,当某些功能电路暂不工作时,关闭其电源,以节约机载电能。
4 结语
该智能机器人经反复实验,已基本达到预期效果,大部分功能已经实现。其中,语音识别与控制、语音合成、超声波测距控制、采用红外光电传感器的寻迹与控制、测光与追光、人脸识别、移动平台的伺服控制等均取得较好效果,但物件识别的对象有一定限制,视觉导航仍有大量工作尚待完成,作为“智能机器人”的整体智能化程度有待进一步提高。
本文作者创新点:提出了一种基于分布式控制系统,具有包括图像处理(人脸识别与物件识别、视觉导航)、语音处理(语音识别与合成)在内的较高智能化程度的机器人控制系统结构;设计并实现了基于KL和统计不相关最佳鉴别变换的人脸及物件识别新算法,较好地解决了运算量和识别速度、识别准确率之间的矛盾,有效提高了识别速度和准确率;提出并实践了一种包括视觉导航、语音导航、寻线导航、超声波导航、光电导航以及运动规划导航等在内的综合策略导航方式。实践证明,采用该方案后,智能机器人系统具有较好的可靠性、开放性和鲁棒性。
参考文献:
[1] 王常力,罗安.分布式控制系统(DCS)设计与应用实例[M].北京:电子工业出版社,2004.
[2] 吕当侠.CAN总线的特点及应用.航空与航天[J],2005(3):16-20.
[3] 谭定忠等.室内移动机器人定位方法的研究.机械与电子[J],2005(9):46-47.
[4] Zhong Jin,J Y Yang,Z S Hu et al.Face Recognition based on uncorrelated discriminant transformation[J].
Pattern Recognition,2001,33(7):1405-1416.
[5] Microsoft, Microsoft Speech SDK 5.1 Documentation,
http://download.microsoft.com/download/SpeechSDK/SDK/5.1/WXP/EN-US/sapi.chm.
[6] 韩大鹏,韦庆.机器人控制器的一种模块化设计方法.微计算机信息[J],2005,21(5):3-4.
上一篇:基于Small RTOS51的PS/2键盘驱动程序开发
下一篇:嵌入式系统中用芯片替代8032时应考虑的几个问题
推荐阅读最新更新时间:2024-03-16 12:52