一种ARM处理器非特定人语音识别系统的设计方案-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

　　0 引言

　　随着高新技术在军事领域的广泛运用，武器装备逐步向高、精、尖方向发展。传统的军事训练由于训练时间长、训练费用高、训练空间窄，常常不能达到预期的训练效果，已不能满足现代军事训练的需要。为解决上述问题，模拟训练应运而生。

　　为进一步提高训练效果，本文利用智能语音交互芯片设计了某模拟训练器的示教与回放系统。示教系统为操作人员生动的演示标准操作流程及相应的操作现象，极大地缩短了对操作人员的培训时间，提高了培训效果。回放系统通过记录操作训练过程中各操作人员的口令、声音强度、动作、时间、操作现象等，待操作训练结束后通过重演训练过程，以便操作者及时纠正自己的问题。示教系统也可理解为对标准操作训练过程的回放。该系统不需要虚拟现实技术的支持，在小型的嵌入式系统上就可以实现。

　　1 系统原理

　　该模拟训练器由一台测控计算机和多台从设备组成。如图1所示。在此仅对一台从设备进行介绍，其硬件系统主要由测控计算机、Arduino mega2560 控制器、语音识别单元、声强检测单元、语音合成单元、面板控制单元、仪器面板等组成。面板控制单元较为复杂，包含多种控制电路，在模拟训练中负责该从设备在Arduino mega2560 控制器的控制下完成整个训练过程，在示教与回放系统中完成对刚才操作训练操作现象的重演，其具体电路设计在此不做介绍。

　　语音识别单元负责识别操作人员的操作口令；声强检测单元负责检测声强大小并以此作为判断是哪台从设备操作人员口令的依据；Arduino mega2560控制器负责监视仪器面板各元件的状态来识别操作人员的动作，从而完成对操作训练过程的记录。各仪器的操作现象根据操作动作事先编制无需记录。在操作回放过程中，测控计算机根据所记录的数据，通过控制相应从设备的Arduino mega2560控制器重现所记录的操作过程。

　　2 单元系统设计

　　2.1 语音识别单元设计

　　目前，语音识别技术的发展十分迅速，按照识别对象的类型可以分为特定人和非特定人语音识别。特定人是指识别对象为专门的人，非特定人是指识别对象是针对大多数用户，一般需要采集多个人的语音进行录音和训练，经过学习，从而达到较高的识别率。

　　本文采用的LD3320语音识别芯片是一颗基于非特定人语音识别（Speaker Independent Automatic SpeechRecognition,SI ASR）技术的芯片。该芯片上集成了高精度的A/D 和D/A 接口，不再需要外接辅助的FLASH 和RAM,即可以实现语音识别、声控、人机对话功能，提供了真正的单芯片语音识别解决方案。并且，识别的关键词语列表是可以动态编辑的。其语音识别过程如图2所示。

　　语音识别单元采用ATmega168 作为MCU,负责控制LD3320完成所有和语音识别相关的工作，并将识别结果通过串口上传至Arduino mega2560 控制器。对LD3320芯片的各种操作，都必须通过寄存器的操作来完成，寄存器读写操作有2种方式（标准并行方式和串行SPI方式）。在此采用并行方式，将LD3320的数据端口与MCU的I/O口相连。其硬件连接图如图3所示。

　　语音识别流程采用中断方式工作，其工作流程分为初始化、写入关键词、开始识别和响应中断等。MCU的程序采用ARDUINO IDE编写[5],调试完成后通过串口进行烧录，控制LD3320完成语音识别，并将识别结果上传至Arduino mega2560控制器。其软件流程如图4所示。

　　2.2 声强检测单元设计

　　在进行语音识别时需要判断是某一台从设备操作人员的口令，为此设计声强检测单元电路，该电路仅需能够判断出相对声强的大小，无需检测声级，对检测精度要求较低。

　　电容式MIC声音传感器将外部声音信号转换成电信号，经NE5532放大电路进行放大，将输入的微弱音频信号转换为具有一定幅值的电压信号，该电压信号经AC/DC有效值转换电路进行装换后进行再次放大，最终由Arduino mega2560控制器的A/D进行采样。图5给出了声强检测单元的电路原理图，其中D1 端接Arduinomega2560控制器的A/D,INT1端接Arduino mega2560控制器的外部中断1.当外界声音信号大于预设的阈值时，三极管导通INT1端由高电平变为低电平产生外部中断，控制器响应中断并进行A/D 采样，采样数据经均值滤波后保存，待测控计算机查询时上传该声强数据。[page]

　　2.3 语音合成单元设计

　　TTS（Text To Speech）文本转语音技术是人机智能对话发展的趋势。基于TTS技术的语音系统无需事先录音就能够随时根据查询条件查出并合成语音进行播报，从而大大减少了系统维护的工作量。利用此技术，通过MCU或者PC机就能控制语音芯片发音[4].

　　本文采用SYN6658中文语音合成芯片进行语音合成。SYN6658 通过UART 接口或SPI接口通信方式，接收待合成的文本数据，实现文本到语音（或TTS语音）的转换[6].控制器和SYN6658 语音合成芯片之间通过UART接口连接，控制器通过串口通信向SYN6658语音合成芯片发送控制命令和文本，SYN6658语音合成芯片把接收到的文本合成为语音信号输出，输出的信号经LM386 功率放大器进行放大后连接到喇叭进行播放。如图6所示。

　　SYN6658语音合成电路采用芯片硬件数据手册提供的典型应用电路进行设计[5],在此不做介绍，功率放大电路采用美国国家半导体生产的音频功率放大器LM386进行放大。

　　在进行语音合成时首先进行初始化，包括发音人选择、数字处理策略、语速调节、语调调节、音量调节等。

　　由于该系统要模拟多人发音，所以不同的从设备设置不同的发音人及语调与语速以便于区分。初始化后等待测控计算机的语音合成命令，待收到命令后芯片会向上位机发送1字节的状态回传，上位机可根据这个回传来判断芯片目前的工作状态。语音合成流程图如图7所示。

　　3 系统软件设计

　　示教与回放系统的软件设计包括测控计算机的软件设计和各从设备Arduino mega260控制器的软件设计。

　　测控计算机是整个系统的控制核心，其软件采用C#进行编写，在示教与回放系统中主要是对操作数据的记录以便根据所记录的数据对操作过程进行精确回放，需要记录的数据包括：各从设备操作人员的操作口令，操作动作，口令及动作时间，各操作对应的操作现象。为简化记录数据，事先编制好各事件代码，记录过程只记录代码，大大提高程序效率。建立结构体如下：

　　在操作训练过程中测控计算机每隔50 ms 对下位机进行控制及轮询，并记录反馈数据，在数据记录时以50 ms 为一个单位。采用定时器对时间进行控制。在回放过程中首先比对当前时间和所记录的时间，当所记录的时间与当前时间吻合时测控计算机控制下位机执行该事件，完成事件回放。

　　Arduino mega2560控制器负责接收测控计算机的控制指令并执行指令，读取语音识别结果，对声强数据采集和处理，控制语音合成单元进行语音合成等。Arduinomega2560 控制器采用串口中断的方式进行命令接收。

　　只有正确接收到命令才会执行并回传结果，若测控计算机在限定时间内未收到回传结果则表明发生错误，测控计算机需重新发送。数据接收流程图如图8所示。

　　4 总结

　　本文利用智能语音芯片设计了某模拟训练器的示教与回放系统，该系统不需要现在流行的虚拟现实技术的支持，仅在MCU的控制下就可以运行。该系统也可以在小型的便携式设备上实现，具有良好的应用前景。

关键字：ARM处理器语音识别系统 MCU 引用地址：一种ARM处理器非特定人语音识别系统的设计方案

上一篇：基于Linux环境下串口通信的应用设计
下一篇：基于ARM Cortex M3内核微控制器解决方案

推荐阅读最新更新时间：2024-03-16 13:39

STM8系列单片机时钟设置

为了降低功耗，时钟管理模块可以停止CPU、内存和其它独立外设的时钟。时钟源有四种：外部高速晶振（HSE 1-16MHZ）内部高速RC振荡器（HSI 16MHZ）外部低速晶振（LSE 32.768）内部低速RC振荡器（LSI 38KHZ）启动默认为内部2MHZ时钟（HIS/8） CSS时钟安全系统可通过软件使能，使能后，该系统在HSE停振时，可自动切换到HSI。 CCO 时钟输出功能 1、选择时钟源 void CLK_DeInit(void) 复位所有时钟寄存器 void CLK_HSICmd(FunctionalState NewState) 使能或禁能内部高速振荡器 void CLK_HSECo

[单片机]

国产芯片怎么做车规认证？

微控制器(MCU)在汽车中的应用非常广泛，是汽车电子中最重要的芯片之一。从高端的预控制器，到最简单的门窗控制，全部都要用到MCU。跟消费类、工业类甚至军品MCU相比，车规MCU具有以下特点：高可靠性，对在室外环境下的EMC要求非常严苛; 高安全，尤其是在自动辅助驾驶逐渐普及的今天，复杂电路的功能安全尤其重要; 零缺陷率，不能有错，十全十美，通过设计、管理、工艺等方面来达到这样的目标; 批一致性，对工艺、材料稳定性要求极高; 长期供货，保证10-15年供货期。根据汽车产业链特点，并围绕上述国际车企基本需求，车规芯片需满足相关规范。其中包括ISO26262这一电子电器产品设计阶段应遵守的国际安全可靠标准，2008年以后还专

[嵌入式]

瑞萨电子32位MCU在伺服电机中的应用

　　在伺服系统中，由于交流永磁同步电机具备十分优良的低速性能、可以实现弱磁高速控制，调速范围宽广、动态特性和效率都很高，已经成为伺服系统的主流之选。目前永磁同步交流伺服技术已成为工业自动化的支撑技术之一。　　本文以瑞萨电子 32位变频用MCU V850E/IX3 UPD70F3454为例，阐述其在交流伺服系统中的应用。　　关于瑞萨电子UPD70F3454 　　UPD70F3454是瑞萨电子开发的用于变频控制的32位高性能MCU，使用V850核、RISC架构、5级流水线、内置DSP功能、最大64MHZ，内置256K flash ROM及相关外围功能，例如DMA控制器，定时器/计数器，串行接口UART、SPI、IIC，A/

[嵌入式]

一种迷你数控雕刻机系统的设计方案

随着艺术模型、机械加工、工装模具等产业的飞速发展，对加工设备提出的要求越来越高，雕刻机作为上述产业的重要组成部分也发生了快速的发展。目前，传统雕刻机体积大、操作复杂、售价高。不仅需要专门的计算机搭载专门的软件，还需要专业操作人员进行控制，而且传统雕刻机主要用于批量生产，对于一些雕刻机爱好者和模具设计师想利用雕刻机雕刻单件自己设计的作品，传统雕刻机专业性强，费用高，不切实际。此外，一些传统的雕刻机使用之前需要人工通过转动三轴方向的手轮对雕刻头进行初步定位，精度、效率低。还有一些高端雕刻机采用软件对雕刻头初步定位，但是设备昂贵。鉴于此，精心设计了一种迷你数控雕刻机系统。该系统不仅操作简单、方便，而且雕刻头初步定位精度精确、效率高。

[电源管理]

基于89C51单片机的环境噪声测量仪

　　 1　引　言　　　　环境噪声监测，是人类提高生活质量，加强环境保护的一个重要环节，在各大城市的繁华街区和居民区，已有大型环境噪声显示器竖立街头。但目前国内的便携式噪声测试仪，多为价格昂贵的进口专用设备，除卫生、计量等环保专业部门拥有外，无法作为民用品推广普及。本文介绍一种以89C51单片机为核心，采用V／F转换技术构成的低成本、便携式数字显示环境噪声测量仪。该仪器工作稳定、性能良好，经校验定标后能满足一般民用需要，可广泛应用于工矿企业、机关、学校等需要对环境噪声进行测量和控制的场合。 2　声压级的测量机理　　人耳的听阈一般是20μPa，痛阈一般是200 Pa，其间相差107倍，这样宽广的声压范围很不易测量，

[单片机]

为什么说嵌入式开发比单片机难？说的太对了

单片机和嵌入式，其实没有什么标准的定义来区分他们，对于进行过单片机和嵌入式开发的开发者来说，都有他们自己的定义，接下来，就谈谈本人对这两个概念的理解和感悟。首先明确概念，什么是单片机，单片机是一种集成电路芯片，是采用超大规模集成电路技术把具有数据处理能力的中央处理器CPU、随机存储器RAM、只读存储器ROM、多种I/O口和中断系统、定时器/计数器等功能(可能还包括显示驱动电路、脉宽调制电路、模拟多路转换器、A/D转换器等电路)集成到一块硅片上构成的一个小而完善的微型计算机系统，在工业控制领域广泛应用。从上世纪80年代，由当时的4位、8位单片机，发展到现在的300M的高速单片机。比如最经典的51系列单片机，如下图所示，外

[单片机]

通过ESP8266和RP2040 MCU实现无线树莓派HAT控制的PiSquare

原文链接：PiSquare enables wireless Raspberry Pi HAT control though ESP8266 and RP2040 MCUs (Crowdfunding) 由Jean-Luc Aufranc撰写。 SB Components PiSquare 是一款外形尺寸与树莓派HAT一样的板子，它是基于树莓派RP2040微控制器和ESP-12E的无线模块，可以方便无线控制多个树莓派 HAT，而且无需将那些HAT堆叠在树莓派上。 PiSquare使用socket编程的方式来无线控制多个树莓派HAT，例如，你们可以通过SPI或UART连接多个HAT，而其扩展板不会相互冲突，因为这里的物理接口

[工业控制]

通过ESP8266和RP2040 <font color='red'>MCU</font>实现无线树莓派HAT控制的PiSquare

单片机中断系统概述

中断是通过硬件来改变CPU的运行方向的。计算机在执行程序的过程中，当出现CPU以外的某种情况时，由服务对象向CPU发出中断请求信号，要求CPU暂时中断当前程序的执行而转去执行相应的处理程序，待处理程序执行完毕后，再继续执行原来被中断的程序。这种程序在执行过程中由于外界的原因而被中间打断的情况称为“中断”。与中断有关的寄存器有4个，分别为中断源寄存器TCON和SCON、中断允许控制寄存器IE和中断优先级控制寄存器IP;中断源有5个，分别为外部中断0请求、外部中断1请求、定时器0溢出中断请求TF0、定时器1溢出中断请求TF1和串行中断请求RI或TI。5个中断源的排列顺序由中断优先级控制寄存器IP和顺序查询逻辑电路共同决定，5个中

[单片机]