基于LD332O语音识别专用芯片实现的语音控制

发布者:WhisperingWaves最新更新时间:2012-02-25 来源: 现代电子技术 关键字:语音识别  集成电路  LD3320 手机看文章 扫描二维码
随时随地手机看文章

0 引言

    语音不仅是人与人之间进行信息交流最直接、最方便和最有效的工具,也是人与机器之间进行通信的重要工具。过去的二三十年中,图形用户界面(Graphical User Interface,GUI)作为人与机器的通信接口取得了很大的进展,但使用GUI仍然摆脱不了手的操作,某些场合仍有不便。因此,语音用户界面(Voice User Interface,VUI)成为人们的下一个目标,人们希望通过声音可以对机器发出指令。

    语音识别有着非常广泛的应用领域,例如智能家电、智能家居、智能导航、智能玩具等等,这些领域下,语音识别提高了设备的易用性。另外,在某些场合,操作者需要用手控制其它设备,比如驾驶员驾驶过程中,或者非常强调响应时间,比如军事训练种情况的紧急处置,这些场合不允许操作者进行复杂的操作,语音控制就成为一项必要的选择。

    语音识别属于数字信号处理的研究领域,其算法初期是依靠计算机、数字信号处理器等来实现的,但随着微电子学和集成电路技术的新进展,近年来不断有语音识别集成电路投放市场。其中,ICRoute的LD3320就是一款性价比较高的芯片。

1 LD3320芯片介绍

    LD3320是一颗基于非特定人语音识别(SI-ASR,Speaker Independent Automatic Speech Recognition)技术的语音识别/声控芯片。该芯片集成了语音识别处理器和一些外部电路,包括ADC、DAC、麦克风接口、声音输出接口等。该芯片不需要外接任何的辅助芯片如Flash、RAM等,直接集成在现有的产品中,即可以实现语音识别/声控/人机对话功能。

    LD3320完成非特定人语音识别,每次识别最多可以设置50项候选识别句,每个识别句可以是单字、词组或短句,长度为不超过10个汉字或者79个字节的拼音串。另一方面,识别句内容可以动态编辑修改,因此可由一个系统支持多种场景。

    芯片采用48脚QFN塑料封装,工作供电为3.3V。芯片内部电路的简要逻辑图如图1所示。其核心是语音以别运算器,配合输入、输出、AD/DA转换等模块,完成语音识别的功能。LD3320还支持并行和串行接口,串行方式可以简化与其他模块的连接。

2 LD3320的应用电路设计

    LD3320的基本应用电路由一个微控制器(MCU)和LD3320组成。电路中的主控MCU芯片,是为了完成对LD3320芯片寄存器的操作。

    对LD3320芯片的各种操作,都必须通过寄存器的操作来完成。比如设置标志位:读取状态;向FIFO写入数据;识别完成后获得识别结果等。例如在编辑关键词语时,主控MCU通过把关键词语的拼音串设置进LD3320相关寄存器来完成编辑。

    其寄存器大体可以分为以下几类,FIFO数据缓存器、语音识别控制寄存器、音量调节、模拟电路和其它的辅助寄存器。寄存器读写操作有2种方式,即标准并行方式和串行SPI方式。LD3320寄存器的地址空间为8位,编号从00H到FFH,可参考文献。

    本文选用的主控MCU是51内核的单片机STC10L08XE。演示的软件程序全部烧录在MCU的内置Flash中。主控MCU直接控制LD33203完成所有和语音识别相关的工作。

    电源设计可以使用NS公司的LM1117-3.3芯片,为LD3320提供3.3V的电压:音频输入和输出,可以使用柱极体MIC和0.5W的小喇叭;语音识别完成后,为了实现对后续电路的驱动,可以利用MCU的串行口与其它模块进行连接。[page]

    主控MCU与LD3320的连接关系如图2所示,MCU的P0端口的8根线和LD3320并行方式连接,控制线也分别连接。此外还连接了复位信号和中断信号。对LD3320来说,复位信号(RSTB)由MCU发出,而中断信号由LD3320发出,MCU负责接收。

    另外,还有一些辅助电路,比如麦克风的偏置、喇叭音量的控制,以及电源的去耦等,这里不作详细介绍。

3 LD3320的软件编程
3.1 编程模式

    主控MCU通过读/写LD3320的寄存器完成操作。用户有两种编程模式:“中断模式”和“轮询模式”。

    所谓中断模式,就是系统的主控MCU在接收到外界一个触发后(比如用户按动某个按键),启动LD3320芯片的一个定时识别过程(比如5s),要求用户在这个定时过程中说出要识别的语音关键词语。过了这个过程后,需要用户再次触发才能再次启动一个识别过程。

    所谓轮询模式,就是系统的主控MCU反复启动识别过程。如果没有人说话没有识别结果,则每次识别过程的定时到时后再启动一个识别过程;如果有识别结果,则根据识别作相应处理后(比如播放某个声音作为回答)再启动一个识别过程。


3.2 程序流程

    语音识别的操作流程是:

    (1)语音识别用初始化(包括通用初始化)。在此步骤中,对各寄存器进行初始化设置。
    (2)写入识别列表。LD3320是一个基于词库的语音识别芯片,在此步骤中,应将待识别的短语写入识别列表。列表的规则是,每个识别条目对应一个特定的编号(1个字节),不同的识别条目的编号可以相同,而且不用连续,但是数值要小于256(00H~FFH)。
    (3)开始识别,并准备好中断响应函数,打开中断允许位。
    (4)响应中断。如果麦克风采集到声音,不管是否以别出正常结果,都会产生一个中断信号。而中断程序要根据寄存器的值分析结果。读取BA寄存器的值,可以知道有几个候选答案,而C5寄存器里的答案是得分最高、最可能正确的答案。

    如果不用中断方式,也可以通过查询方式工作。在“开始识别”后,读取寄存器B2H的值,如果为21H就表示有识别结果产生。在此之后读取候选项等操作与中断方式相同。

    LD3320芯片还具有MP3播放的功能,在这里不再进行介绍。

4 结论

    LD3320的功能是完成有限词组的非特定人语音识别,我们将其应用在一个虚拟环境下战术训练课题中。战术训练中,常常需要下达一些短口令,而在我们所设计的训练环境中,如果口令采用键盘或鼠标的方式进行输入,显然有违设计的初衷。所以,我们使用LD3320设计VUI控制电路,用语音识别的方式,将获得的识别结果再转换成串口信号,输入计算机,达到语音控制的目的。

    实践证明,这种方式可以满足语音控制的要求,但是语音识别的速度,即实时性还有待改进。

关键字:语音识别  集成电路  LD3320 引用地址:基于LD332O语音识别专用芯片实现的语音控制

上一篇:直角坐标机器人与关节机器人对比分析
下一篇:马达设计原理及元件安装需考虑的因素

推荐阅读最新更新时间:2024-05-02 21:55

利用HFTA-16.0建立双极型集成电路的ESD保护
ESD传递模式 静电放电强度以电压形式表示,该电压由电容的储能电荷产生,最终传递到IC。作用到IC的电压和电流强度与IC和 ESD 源之间的阻抗有关。对电荷来源进行评估后建立了 ESD 测试模型。 ESD 测试中一般使用两种充电模式(图1),人体模式(HBM)下将电荷储存在人体内(100pF等效电容),通过人体皮肤放电(1.5kΩ等效电阻)。机器模式(MM)下将电荷储存在金属物体,机器模式中的放电只受内部连接电感的限制。 图1. ESD测试模型 IC内部保护电路 标准保护方案是限制到达IC核心电路的电压和电流。图1所示保护器件包括: ESD 二极管—在信号引脚与电源或地之间提供一个低阻通道,与极性有关。 电源箝位—连
[电源管理]
利用HFTA-16.0建立双极型<font color='red'>集成电路</font>的ESD保护
争抢全球IC设计老二,大陆台湾龙虎斗
        台湾与中国大陆IC设计业者的竞争愈来愈白热化。在官方政策补助与庞大内需市场的滋养下,中国大陆IC设计业者已日益壮大,不仅在诸多应用领域与台湾厂商短兵相接,整体产业产值亦快速逼进,预估2014年即可正式超越台湾。     全球无晶圆厂(Fabless)IC设计​​产业重心已转向行动装置领域,并进入美国、台湾及中国大陆三分天下的时代。其中,美国业者产值高占整体市场七成以上,稳居第一;至于台商因晶片技术及品质领先中国大陆,则一直维持在第二名位置,市占率约15%左右。   然而,随着中国大陆本土晶片厂纷纷冒出头来,并以低价策略席卷当地白牌行动装置,已为台商带来更大威胁。据工研院IEK预估,中国大陆IC设
[手机便携]
中国制造 还缺哪些“芯”?
近日,中共中央政治局召开会议,分析研究当前一系列经济工作形势,并且强调完成今年的目标任务,需要付出艰苦努力,关键是要同高质量发展的要求对表,对得上的加紧推,对不上的要及时改。到底什么样的发展和趋势,在企业层面、政府层面,能够对得上高质量发展的标准呢? 24日晚,《央视财经评论》对目前我们中国经济发展当中,还存有的结构性和深层次的问题,该如何突破,进行了深度解析。 为期三天的数字中国建设峰会,集中展示了中国信息化建设的成果,也向普通市民展示了最前沿用的数字产品,在峰会举办期间多场论坛上,议会嘉宾表示,目前中国最需要加强的是,未来信息化建设核心技术的突破,而在这一过程中,我们的信息化建设也正在从以前的网民数量、点击率、利润和收
[嵌入式]
贸泽开售FTDI Chip FT4232HA USB转UART/MPSSE IC 为目标设计提供高速USB支持
贸泽开售FTDI Chip FT4232HA USB转UART/MPSSE IC 为目标设计提供高速USB支持 2022年12月22日 – 专注于引入新品推动行业创新™的电子元器件分销商贸泽电子 (Mouser Electronics) , 即日起开售FTDI Chip的FT4232HA高速USB转UART/MPSSE IC。FT4232HA是符合汽车标准的USB 2.0至UART 转接器IC,可无缝地为目标设计提供高速USB支持。FT4232HA器件具有四个独立的可配置接口,为一系列汽车和一般USB应用提供了高度灵活的解决方案,包括智能读卡器、工业控制、媒体播放器接口和机顶盒接口。 贸泽电子供应的FTDI Chi
[物联网]
贸泽开售FTDI Chip FT4232HA USB转UART/MPSSE <font color='red'>IC</font> 为目标设计提供高速USB支持
车载显示驱动:IC厂商眼中的“香饽饽”
近几年,在新能源汽车市场兴起和智能驾驶、智慧座舱升级换代的大背景下,车载显示市场需求保持高位增长,这让 芯片 厂商看到了巨大的市场潜力。车用显示IC产品正成为IC厂商极力发展的产品线之一。 IC厂商眼中的“香饽饽” 随着汽车电动化、智能化的快速发展,消费者娱乐及信息交互需求的升级,车载显示屏行业正逐步走向大屏化、多屏化、联屏化。 Omdia显示面板业务研究分析师蒋与杨对《中国电子报》记者指出,显示驱动芯片在汽车领域主要应用于仪表盘、中控台、抬头显示、后视镜、行车记录仪显示。随着新能源汽车市场兴起和智能驾驶、智慧座舱升级换代,消费者对车载显示屏幕的需求进一步多样化,比如娱乐系统显示、抬头显示等多个车载显示应用需求持续增长
[汽车电子]
英飞凌新推出的160V MOTIX™三相栅极驱动器IC
英飞凌新推出的160V MOTIX™三相栅极驱动器IC集成了电源管理单元、电流感应放大器和过流保护功能 【2023年02月06日,德国慕尼黑讯】 英飞凌科技股份公司专为汽车和工业电机控制应用开发的MOTIX™系列能够提供具有不同集成度的丰富产品组合 。为了进一步壮大产品阵容,英飞凌推出了MOTIX三相栅极驱动器IC 6ED2742S01Q。这款160V的绝缘体上硅(SOI)栅极驱动器集成了一个电源管理单元(PMU),并且采用了底部带有裸露焊盘的QFN-32封装,具有良好的导热性能。得益于此,该半导体器件易于集成,非常适用于各种电池供电的工业用无刷直流(BLDC)电机控制驱动器,包括无线电动工具、机器人、无人机以及轻型电动汽车(
[电源管理]
英飞凌新推出的160V MOTIX™三相栅极驱动器<font color='red'>IC</font>
Power Integrations GaN技术LED驱动器IC问市,展现出色性能
高效率、高可靠性LED驱动器IC领域的知名公司Power Integrations(纳斯达克股票代号:POWI)今日推出LYTSwitch™-6系列安全隔离型LED驱动器IC的最新成员 —— 适合智能照明应用的新器件LYT6078C。这款新的LYTSwitch-6 IC采用了Power Integrations的PowiGaN™氮化镓(GaN)技术,在该公司今天同时发布的新设计范例报告(DER-920)中,展现了其出色的效率和性能优势。 基于PowiGaN的LYT6078C IC集成了一个750V功率开关,可提供高达90W的无闪烁输出,同系列的其他器件可提供高达110W的无闪烁输出。包括PFC级和LYTSwitch-6
[电源管理]
Power Integrations GaN技术LED驱动器<font color='red'>IC</font>问市,展现出色性能
奥地利微电子推出新型单相防篡改液晶电度计量集成电路
AS8268系统级芯片内置闪存,提供了非常可靠的安全程序和数据 中国—— 全球领先的通信、工业、医疗及汽车应用集成电路设计者和制造商奥地利微电子公司(austriamicrosystems)今天宣布,随着内置闪存的单相系统级芯片计量集成电路的推出,公司旗下的电度表集成电路产品系列又添一款新产品—AS8268。AS8268为液晶显示仪表提供了集成的系统级芯片解决方案,并通过系统内置的高性能闪存,提供了安全的程序和数据。 AS8268还能满足公用事业的全部防篡改要求,并可配备客户规定的LCD显示屏。基于AS8268的仪表只需极少的外部元件,从根本上提高了仪表的可靠性,并降低了仪表系统的成本。 AS8268集成了单相电度计量所要
[新品]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved