基于LD332O语音识别专用芯片实现的语音控制-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

0 引言

语音不仅是人与人之间进行信息交流最直接、最方便和最有效的工具，也是人与机器之间进行通信的重要工具。过去的二三十年中，图形用户界面(Graphical User Interface，GUI)作为人与机器的通信接口取得了很大的进展，但使用GUI仍然摆脱不了手的操作，某些场合仍有不便。因此，语音用户界面(Voice User Interface，VUI)成为人们的下一个目标，人们希望通过声音可以对机器发出指令。

语音识别有着非常广泛的应用领域，例如智能家电、智能家居、智能导航、智能玩具等等，这些领域下，语音识别提高了设备的易用性。另外，在某些场合，操作者需要用手控制其它设备，比如驾驶员驾驶过程中，或者非常强调响应时间，比如军事训练种情况的紧急处置，这些场合不允许操作者进行复杂的操作，语音控制就成为一项必要的选择。

语音识别属于数字信号处理的研究领域，其算法初期是依靠计算机、数字信号处理器等来实现的，但随着微电子学和集成电路技术的新进展，近年来不断有语音识别集成电路投放市场。其中，ICRoute的LD3320就是一款性价比较高的芯片。

1 LD3320芯片介绍

LD3320是一颗基于非特定人语音识别(SI-ASR，Speaker Independent Automatic Speech Recognition)技术的语音识别／声控芯片。该芯片集成了语音识别处理器和一些外部电路，包括ADC、DAC、麦克风接口、声音输出接口等。该芯片不需要外接任何的辅助芯片如Flash、RAM等，直接集成在现有的产品中，即可以实现语音识别／声控／人机对话功能。

LD3320完成非特定人语音识别，每次识别最多可以设置50项候选识别句，每个识别句可以是单字、词组或短句，长度为不超过10个汉字或者79个字节的拼音串。另一方面，识别句内容可以动态编辑修改，因此可由一个系统支持多种场景。

芯片采用48脚QFN塑料封装，工作供电为3．3V。芯片内部电路的简要逻辑图如图1所示。其核心是语音以别运算器，配合输入、输出、AD／DA转换等模块，完成语音识别的功能。LD3320还支持并行和串行接口，串行方式可以简化与其他模块的连接。

2 LD3320的应用电路设计

LD3320的基本应用电路由一个微控制器(MCU)和LD3320组成。电路中的主控MCU芯片，是为了完成对LD3320芯片寄存器的操作。

对LD3320芯片的各种操作，都必须通过寄存器的操作来完成。比如设置标志位：读取状态；向FIFO写入数据；识别完成后获得识别结果等。例如在编辑关键词语时，主控MCU通过把关键词语的拼音串设置进LD3320相关寄存器来完成编辑。

其寄存器大体可以分为以下几类，FIFO数据缓存器、语音识别控制寄存器、音量调节、模拟电路和其它的辅助寄存器。寄存器读写操作有2种方式，即标准并行方式和串行SPI方式。LD3320寄存器的地址空间为8位，编号从00H到FFH，可参考文献。

本文选用的主控MCU是51内核的单片机STC10L08XE。演示的软件程序全部烧录在MCU的内置Flash中。主控MCU直接控制LD33203完成所有和语音识别相关的工作。

电源设计可以使用NS公司的LM1117-3．3芯片，为LD3320提供3．3V的电压：音频输入和输出，可以使用柱极体MIC和0．5W的小喇叭；语音识别完成后，为了实现对后续电路的驱动，可以利用MCU的串行口与其它模块进行连接。[page]

主控MCU与LD3320的连接关系如图2所示，MCU的P0端口的8根线和LD3320并行方式连接，控制线也分别连接。此外还连接了复位信号和中断信号。对LD3320来说，复位信号(RSTB)由MCU发出，而中断信号由LD3320发出，MCU负责接收。

另外，还有一些辅助电路，比如麦克风的偏置、喇叭音量的控制，以及电源的去耦等，这里不作详细介绍。

3 LD3320的软件编程
3．1 编程模式

主控MCU通过读／写LD3320的寄存器完成操作。用户有两种编程模式：“中断模式”和“轮询模式”。

所谓中断模式，就是系统的主控MCU在接收到外界一个触发后(比如用户按动某个按键)，启动LD3320芯片的一个定时识别过程(比如5s)，要求用户在这个定时过程中说出要识别的语音关键词语。过了这个过程后，需要用户再次触发才能再次启动一个识别过程。

所谓轮询模式，就是系统的主控MCU反复启动识别过程。如果没有人说话没有识别结果，则每次识别过程的定时到时后再启动一个识别过程；如果有识别结果，则根据识别作相应处理后(比如播放某个声音作为回答)再启动一个识别过程。

3．2 程序流程

语音识别的操作流程是：

    (1)语音识别用初始化(包括通用初始化)。在此步骤中，对各寄存器进行初始化设置。
    (2)写入识别列表。LD3320是一个基于词库的语音识别芯片，在此步骤中，应将待识别的短语写入识别列表。列表的规则是，每个识别条目对应一个特定的编号(1个字节)，不同的识别条目的编号可以相同，而且不用连续，但是数值要小于256(00H～FFH)。
    (3)开始识别，并准备好中断响应函数，打开中断允许位。
    (4)响应中断。如果麦克风采集到声音，不管是否以别出正常结果，都会产生一个中断信号。而中断程序要根据寄存器的值分析结果。读取BA寄存器的值，可以知道有几个候选答案，而C5寄存器里的答案是得分最高、最可能正确的答案。

如果不用中断方式，也可以通过查询方式工作。在“开始识别”后，读取寄存器B2H的值，如果为21H就表示有识别结果产生。在此之后读取候选项等操作与中断方式相同。

LD3320芯片还具有MP3播放的功能，在这里不再进行介绍。

4 结论

LD3320的功能是完成有限词组的非特定人语音识别，我们将其应用在一个虚拟环境下战术训练课题中。战术训练中，常常需要下达一些短口令，而在我们所设计的训练环境中，如果口令采用键盘或鼠标的方式进行输入，显然有违设计的初衷。所以，我们使用LD3320设计VUI控制电路，用语音识别的方式，将获得的识别结果再转换成串口信号，输入计算机，达到语音控制的目的。

实践证明，这种方式可以满足语音控制的要求，但是语音识别的速度，即实时性还有待改进。

关键字：语音识别集成电路 LD3320 引用地址：基于LD332O语音识别专用芯片实现的语音控制

上一篇：直角坐标机器人与关节机器人对比分析
下一篇：马达设计原理及元件安装需考虑的因素

推荐阅读最新更新时间：2024-05-02 21:55

利用HFTA-16.0建立双极型集成电路的ESD保护

ESD传递模式静电放电强度以电压形式表示，该电压由电容的储能电荷产生，最终传递到IC。作用到IC的电压和电流强度与IC和 ESD 源之间的阻抗有关。对电荷来源进行评估后建立了 ESD 测试模型。 ESD 测试中一般使用两种充电模式(图1)，人体模式(HBM)下将电荷储存在人体内(100pF等效电容)，通过人体皮肤放电(1.5kΩ等效电阻)。机器模式(MM)下将电荷储存在金属物体，机器模式中的放电只受内部连接电感的限制。图1. ESD测试模型 IC内部保护电路标准保护方案是限制到达IC核心电路的电压和电流。图1所示保护器件包括： ESD 二极管—在信号引脚与电源或地之间提供一个低阻通道，与极性有关。电源箝位—连

[电源管理]

利用HFTA-16.0建立双极型<font color='red'>集成电路</font>的ESD保护

争抢全球IC设计老二,大陆台湾龙虎斗

台湾与中国大陆IC设计业者的竞争愈来愈白热化。在官方政策补助与庞大内需市场的滋养下，中国大陆IC设计业者已日益壮大，不仅在诸多应用领域与台湾厂商短兵相接，整体产业产值亦快速逼进，预估2014年即可正式超越台湾。全球无晶圆厂(Fabless)IC设计产业重心已转向行动装置领域，并进入美国、台湾及中国大陆三分天下的时代。其中，美国业者产值高占整体市场七成以上，稳居第一；至于台商因晶片技术及品质领先中国大陆，则一直维持在第二名位置，市占率约15%左右。然而，随着中国大陆本土晶片厂纷纷冒出头来，并以低价策略席卷当地白牌行动装置，已为台商带来更大威胁。据工研院IEK预估，中国大陆IC设

[手机便携]

中国制造还缺哪些“芯”？

近日，中共中央政治局召开会议，分析研究当前一系列经济工作形势，并且强调完成今年的目标任务，需要付出艰苦努力，关键是要同高质量发展的要求对表，对得上的加紧推，对不上的要及时改。到底什么样的发展和趋势，在企业层面、政府层面，能够对得上高质量发展的标准呢? 24日晚，《央视财经评论》对目前我们中国经济发展当中，还存有的结构性和深层次的问题，该如何突破，进行了深度解析。为期三天的数字中国建设峰会，集中展示了中国信息化建设的成果，也向普通市民展示了最前沿用的数字产品，在峰会举办期间多场论坛上，议会嘉宾表示，目前中国最需要加强的是，未来信息化建设核心技术的突破，而在这一过程中，我们的信息化建设也正在从以前的网民数量、点击率、利润和收

[嵌入式]

贸泽开售FTDI Chip FT4232HA USB转UART/MPSSE IC 为目标设计提供高速USB支持

贸泽开售FTDI Chip FT4232HA USB转UART/MPSSE IC 为目标设计提供高速USB支持 2022年12月22日 – 专注于引入新品推动行业创新™的电子元器件分销商贸泽电子 (Mouser Electronics) , 即日起开售FTDI Chip的FT4232HA高速USB转UART/MPSSE IC。FT4232HA是符合汽车标准的USB 2.0至UART 转接器IC，可无缝地为目标设计提供高速USB支持。FT4232HA器件具有四个独立的可配置接口，为一系列汽车和一般USB应用提供了高度灵活的解决方案，包括智能读卡器、工业控制、媒体播放器接口和机顶盒接口。贸泽电子供应的FTDI Chi

[物联网]

贸泽开售FTDI Chip FT4232HA USB转UART/MPSSE <font color='red'>IC</font> 为目标设计提供高速USB支持

车载显示驱动：IC厂商眼中的“香饽饽”

近几年，在新能源汽车市场兴起和智能驾驶、智慧座舱升级换代的大背景下,车载显示市场需求保持高位增长，这让芯片厂商看到了巨大的市场潜力。车用显示IC产品正成为IC厂商极力发展的产品线之一。 IC厂商眼中的“香饽饽” 随着汽车电动化、智能化的快速发展，消费者娱乐及信息交互需求的升级，车载显示屏行业正逐步走向大屏化、多屏化、联屏化。 Omdia显示面板业务研究分析师蒋与杨对《中国电子报》记者指出，显示驱动芯片在汽车领域主要应用于仪表盘、中控台、抬头显示、后视镜、行车记录仪显示。随着新能源汽车市场兴起和智能驾驶、智慧座舱升级换代，消费者对车载显示屏幕的需求进一步多样化，比如娱乐系统显示、抬头显示等多个车载显示应用需求持续增长

[汽车电子]

英飞凌新推出的160V MOTIX™三相栅极驱动器IC

英飞凌新推出的160V MOTIX™三相栅极驱动器IC集成了电源管理单元、电流感应放大器和过流保护功能【2023年02月06日，德国慕尼黑讯】英飞凌科技股份公司专为汽车和工业电机控制应用开发的MOTIX™系列能够提供具有不同集成度的丰富产品组合。为了进一步壮大产品阵容，英飞凌推出了MOTIX三相栅极驱动器IC 6ED2742S01Q。这款160V的绝缘体上硅（SOI）栅极驱动器集成了一个电源管理单元（PMU），并且采用了底部带有裸露焊盘的QFN-32封装，具有良好的导热性能。得益于此，该半导体器件易于集成，非常适用于各种电池供电的工业用无刷直流（BLDC）电机控制驱动器，包括无线电动工具、机器人、无人机以及轻型电动汽车（

[电源管理]

英飞凌新推出的160V MOTIX™三相栅极驱动器<font color='red'>IC</font>

Power Integrations GaN技术LED驱动器IC问市，展现出色性能

高效率、高可靠性LED驱动器IC领域的知名公司Power Integrations（纳斯达克股票代号：POWI）今日推出LYTSwitch™-6系列安全隔离型LED驱动器IC的最新成员 —— 适合智能照明应用的新器件LYT6078C。这款新的LYTSwitch-6 IC采用了Power Integrations的PowiGaN™氮化镓(GaN)技术，在该公司今天同时发布的新设计范例报告(DER-920)中，展现了其出色的效率和性能优势。基于PowiGaN的LYT6078C IC集成了一个750V功率开关，可提供高达90W的无闪烁输出，同系列的其他器件可提供高达110W的无闪烁输出。包括PFC级和LYTSwitch-6

[电源管理]

Power Integrations GaN技术LED驱动器<font color='red'>IC</font>问市，展现出色性能

奥地利微电子推出新型单相防篡改液晶电度计量集成电路

AS8268系统级芯片内置闪存，提供了非常可靠的安全程序和数据中国—— 全球领先的通信、工业、医疗及汽车应用集成电路设计者和制造商奥地利微电子公司（austriamicrosystems）今天宣布，随着内置闪存的单相系统级芯片计量集成电路的推出，公司旗下的电度表集成电路产品系列又添一款新产品—AS8268。AS8268为液晶显示仪表提供了集成的系统级芯片解决方案，并通过系统内置的高性能闪存，提供了安全的程序和数据。 AS8268还能满足公用事业的全部防篡改要求，并可配备客户规定的LCD显示屏。基于AS8268的仪表只需极少的外部元件，从根本上提高了仪表的可靠性，并降低了仪表系统的成本。 AS8268集成了单相电度计量所要

[新品]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

■Follow me第二季第3期来啦！与得捷一起解锁高性能开发板【EK-RA6M5】超能力！

■报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~