基于DSP的中文语音合成系统设计

发布者:HarmoniousVibes最新更新时间:2015-11-12 关键字:DSP  语音合成  系统设计 手机看文章 扫描二维码
随时随地手机看文章
引言

本文介绍的就是一种基于DSP的中文语音合成系统的实现方法。随着语音信号处理技术的不断发展与成熟,语音合成正逐步成为信息技术中人机接口的关键技术。DSP芯片,即数字信号处理器,是专门为快速实现各种信号处理算法而设计的、具有特殊结构的微处理器,其处理速度比最快的CPU还快10~50 倍。  

1 系统总体方案

语音合成的最大特点就是要从有限的存储单元中合成出无限字汇的连续语句来[1]。为了做到这一点,本系统设计了由(1)前端预处理模块将输入文本文件转换成系统可以处理的标准格式;(2)韵律规则库给出当前语言环境下各个音节的韵律特征参数;(3)语音合成器根据给定的韵律特征参数对原始语音库中相应语音单元的声学参数进行调整;(4)将经过调整的各个语音单元拼接在一起,得到相应于输入文本的连续语音输出等4个基本流程组成。系统基本原理框图如图1所示。

 

2 硬件系统设计

*基金项目:湖南省教育厅(03C025)

该中文语音合成系统的目的是对输入的文本文件能够清晰地、自然地、能懂地以连续语音地形式输出。ATMEL公司的AT89S52单片机对键盘输入的文本文件进行 显示,再送TMS320VC5402处理,最后将合成结果输出。硬件结构框图如图2所示。

 

2.1 键盘电路和显示电路

AT89S52的键盘接口电路是采用中断方式的,有键按下时,就产生中断请求,进入中断处理,然后通过查询P1.0和P1.1的情况,进行相应的处理。用电阻和电容够成了消抖电路,以防止电路的误操作。

AT89S52把从键盘输入的文本信息送给LCD显示,同时把数据写到外部存储器CY7C133,然后TMS320 VC5402读取CY7C133上的信息进行处理。LCD的指令格式如表1所示:

表1 LCD的指令格式

 

其中RS, R/W共同决定选择哪一个寄存器,如表2所示:

表2 寄存器选择

 

2.2 TMS320VC5402与AT89S52的通信

AT89S52和TMS320VC5402各自独立工作,其信息和数据交换通过共享一片外部存储器来实现,它们之间信号联络通过硬连接和软件判断来实现[2]。

外部存储器采用的是CY7C133,它是高速的2K X 16bit的静态异步双端口RAM,其存储速度为25ns。它有两套独立的地址线、数据线和控制信号线,允许两个控制器件中的数据通过共同连接的存储器来进行通信。该双端口RAM允许两个控制器同时读取任何存储单元(包括同时读同一单元),但不允许同时写或者一读一写统一地址单元。

对于TMS320VC5402,数据存储器CY7C133的对应地址为4000H~47FFH。

对于AT89S52,数据存储器CY7C133的对应地址为2000H~27FFH。

3 软件系统设计

汉语作为一种有调语言,其韵律特征非常复杂。为了从有限的存储单元中合成出无限字汇的连续语句来,必须在一定的韵律规则下对语音库单元的韵律参数进行调整,以得到符合当前语流环境的音变单元[3]。

根据得到音变单元的方法不同,可将语音合成器分成两种类型:(1)波形拼接合成;(2)参数合成(又称源/滤波器合成)。本系统采用波形拼接合成的方法直接对波形的时域和频域波形进行调整以得到所需要的音变单元。

简单的波形拼接法很难进行音高和音长(时间长度)调整。因此,本系统采用中性语调音节直接拼接配合基音同步波形叠加(PSOLA)算法,并用码激励线性预测(CELP)编码方法对原始采样音库进行编码压缩的方法。基本流程图如图3所示。

 

 

?

 

4 结束语

本系统利用SCM实时显示输入的文本文件,能够将合成语音和输入文本文件实现对比输出,直观性强;合成算法运算复杂度低,能够用尽量小的音库来实现对容量有限的存储空间的占用程度的要求具有清晰度、能懂度和自然度高。

关键字:DSP  语音合成  系统设计 引用地址:基于DSP的中文语音合成系统设计

上一篇:Altera新版Quartus Prime设计软件延续了设计性能和效能优势
下一篇:Altera荣获Frost & Sullivan全球FPGA技术创新领先奖

推荐阅读最新更新时间:2024-05-03 00:06

基于模糊控制的恒温控制系统设计
摘要:为了克服热惯性和高温散热较快的影响,基于模糊控制算法,以单片机为基础设计了一套恒温控制系统,并介绍了硬件组成结构和软件控制方案。实验表明,该系统实现了温度的精确测量和控制,其中静态误差小于0.2℃,恒温控制的标准差小于O.3℃。同时系统还具有响应速度快、性价比高、可移植性强等优点。 关键词:恒温控制;模糊控制;单片机; AD590 在日常工业生产当中,恒温控制应用非常广泛。模糊控制技术是通过模仿人的思维方法,运用不确定的模糊信息进行决策以实现最佳的控制效果。模糊控制所关心的是目标而不是精确的数学模型,即研究的是控制器的本身而不是被控对象。因此可以利用特殊的控制媒介,研究控制器本身。本系统以此作为出发点,以单片机为核心
[工业控制]
基于模糊控制的恒温控制<font color='red'>系统设计</font>
基于闪存TMS320VC5409DSP并行引导装载方法
  TMS320VC5409是TI公司推出的新一代的高性能、低价位、低功耗数字信号处理器(DSP)。与现在流行的TMS320C5409相比,性能提高了60%,功耗效率提高了50%。它的应用对象大多是要求能脱机运行的内嵌式系统,如机顶盒(STB)、个人数字助理(PDA)和数字无线通信等。闪烁存储器(FLASH MEMORY)是可以在线电擦写、掉电后信息不丢失的存储器。FLASH与EPROM相比,具有更高的性能价格比,而且体积小、功耗低、擦写速度快、使用比较方便。因此,采用FLASH存储程序和固定数据是一种比较好的选择。AMD公司的Am29LV400B FLASH可以直接与DSP相接。    1 Am29LV400B的主要特点及编程
[嵌入式]
基于DSP的调频调制器设计
  软件无线电的基本思想是以开放的、可扩展的、结构最简的硬件为通用平台,把尽可能多通信功能用可升级、可替换软件来实现。其中心思想是:构造一个具有标准化、模块化的通用硬件平台,并通过软件加载实现各种无线通信功能的一种开放式体系结构。本文基于这一思想,首先构造一个DSP与PC机接口的硬件平台,继而在该平台上实现较为简单的FM调制器。该系统的实现为以后研究基于软件无线电其他制式的调制解调器提供了基本平台。   1 系统原理   本系统以TMS320VC5402数字信号处理器(DSP)为核心搭建硬件平台,在DSP中编程实现FM调制。系统最大的特点是采用通用计算机与DSP处理单元相结合的方案,系统中各种人机接口及控制功能、存储显示功能由
[安防电子]
基于<font color='red'>DSP</font>的调频调制器设计
基于ARMLinux的无线音视频对讲系统设计
随着数字化和网络化时代的到来,尤其是宽带无线网络的发展,为音视频这样大数据量传输业务在无线网络上的应用提供了契机。同时由于音视频独特的感官特性,使其相关的应用需求也变得越来越迫切。无线多媒体是多媒体和移动通信这两个领域的技术相互融合的产物,成为当今通信领域的一个热点。鉴于Linux内核的开源性,采用其作为操作系统,从而使整个系统具有更好的实时性和稳定性。整个系统以ARM11为核心处理器、采用新一代视频编解码标准H.264进行编译码,并通过无线网络传输音视频。它充分利用S3C6410微处理器内部集成的多媒体编解码器(Multi-FormatvideoCodec,MFC),有效提高了系统的性价比。整个系统为无线多媒体音视频的传输提供了
[单片机]
基于ARMLinux的无线音视频对讲<font color='red'>系统设计</font>
基于ClearNAND闪存的系统设计改进方案
  自问世以来,NAND闪存对ECC(纠错码)纠错能力的要求越来越高。虽然这不是一个新问题,但是支持最新的多层单元(MLC)架构和每单元存储三位数据(three-bit-per-cell)技术所需的ECC纠错能力让系统人员越来越难以应付。   过去,ECC一直被用于提高NAND闪存子系统的整体数据可靠性。但是,随着NAND单元不断缩小,每个浮栅内贮存的电子数量越来越少。因此,为弥补更小的存储单元所产生的更高的位误码率,我们必须大幅提高ECC纠错能力,以维持所需的系统可靠性。   随着系统对ECC纠错要求不断提高,实现ECC逻辑所需的逻辑门数量也在增加,同时系统复杂性也随之提高。例如,24位ECC需要大约200,000个逻辑门,
[单片机]
基于ClearNAND闪存的<font color='red'>系统设计</font>改进方案
基于STCl2C5410AD单片机的四通道声发射信号采集系统设计
0 引言 声发射技术作为一种新型动态监测技术,在无损检测技术中占有重要地位。而无损检测技术又是故障诊断中较为常用而有效的方法。因此,声发射技术在故障诊断的在线检测中具有广阔的应用前景。特别是正在执行生产任务的大型压力容器方面。由于需要长期连续不停产的工作,容易造成压力容器疲劳损伤,对安全生产造成严重威胁。而声发射检测可以在不中断生产的条件下,对大型压力容器或储罐进行动态监测,并能够快速捕捉缺陷位置,从而有效避免重大事故的发生。 1 声发射信号的特点及采集原理 声发射(Acoustic Emission)技术是一种可用于评价材料或构件损伤的无损检测诊断技术。所谓声发射,是指材料在外力或内力作用下,局部源快速释放能量而产生瞬
[单片机]
基于STCl2C5410AD单片机的四通道声发射信号采集<font color='red'>系统设计</font>
基于C8051F340的开关电源模块并联供电系统设计
近一些年来,随着微电子技术和工艺、磁性材料科学以及烧结加工工艺与其它边沿技术科学的不断改进和快速发展,开关稳压技术也得到了突破性进展。目前,多模块并联供电电源代替单一集中式电源供电已经成为电源系统发展的一个重要方向。并联分布式电源具有可并联式扩展、电源模块的功率密度高,体积、重量小等优点,但同时也存在着由于电源模块直接并联而引起一台或多台模块运行在电流极限值状态的问题。目前,均流控制是实现大功率电源和冗余电源的关键技术。文中设计并制作了一个光伏并网发电模拟装置,实现了双开关电源模块并联供电,提高了系统供电效率,且实现了电流自动分配。 1 设计任务 设计并制作一个由两个额定输出功率均为16 W的8 VDC/DC模块构成的并联供电
[单片机]
基于C8051F340的开关电源模块并联供电<font color='red'>系统设计</font>
Cadence推出两款适用于汽车的新DSP IP内核
6月30日,Cadence Design Systems宣布推出两个用于汽车、消费和工业市场嵌入式处理的新DSP IP内核:Tensilica ConnX 110和ConnX 120,进一步扩展其广受欢迎的Tensilica® ConnX系列雷达、激光雷达和通信DSP。这两个小型、低功耗DSP与经过验证的高性能ConnX B10和B20 DSP共享通用指令集架构(ISA),从而为客户提供更大的设计灵活性。这四个DSP涵盖从低端到超高端的广泛性能范围,可提供可扩展的同类最佳的功率、性能和面积(PPA)。 图片来源:Cadence 128位ConnX 110 DSP和256位ConnX 120 DSP采用N路编程模型,与Co
[汽车电子]
Cadence推出两款适用于汽车的新<font color='red'>DSP</font> IP内核
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved