一种基于DSP的中文语音合成系统设计

发布者:创新思维最新更新时间:2007-02-08 来源: EDN China关键字:算法  处理器  前端 手机看文章 扫描二维码
随时随地手机看文章

0 引言

随着语音信号处理技术的不断发展与成熟,语音合成正逐步成为信息技术中人机接口的关键技术。DSP芯片,即数字信号处理器,是专门为快速实现各种信号处理算法而设计的、具有特殊结构的微处理器,其处理速度比最快的CPU还快10~50倍。本文介绍的就是一种基于DSP的中文语音合成系统的实现方法。

1 系统总体方案

语音合成的最大特点就是要从有限的存储单元中合成出无限字汇的连续语句来[1]。为了做到这一点,本系统设计了由(1)前端预处理模块将输入文本文件转换成系统可以处理的标准格式;(2)韵律规则库给出当前语言环境下各个音节的韵律特征参数;(3)语音合成器根据给定的韵律特征参数对原始语音库中相应语音单元的声学参数进行调整;(4)将经过调整的各个语音单元拼接在一起,得到相应于输入文本的连续语音输出等4个基本流程组成。系统基本原理框图如图1所示。


2 硬件系统设计

*基金项目:湖南省教育厅(03C025)

该中文语音合成系统的目的是对输入的文本文件能够清晰地、自然地、能懂地以连续语音地形式输出。ATMEL公司的AT89S52单片机对键盘输入的文本文件进行 显示,再送TMS320VC5402处理,最后将合成结果输出。硬件结构框图如图2所示。

2.1 键盘电路和显示电路

AT89S52的键盘接口电路是采用中断方式的,有键按下时,就产生中断请求,进入中断处理,然后通过查询P1.0和P1.1的情况,进行相应的处理。用电阻和电容够成了消抖电路,以防止电路的误操作。

AT89S52把从键盘输入的文本信息送给LCD显示,同时把数据写到外部存储器CY7C133,然后TMS320 VC5402读取CY7C133上的信息进行处理。LCD的指令格式如表1所示:

表1 LCD的指令格式

其中RS, R/W共同决定选择哪一个寄存器,如表2所示:

表2 寄存器选择

2.2 TMS320VC5402与AT89S52的通信

AT89S52和TMS320VC5402各自独立工作,其信息和数据交换通过共享一片外部存储器来实现,它们之间信号联络通过硬连接和软件判断来实现[2]。

外部存储器采用的是CY7C133,它是高速的2K X 16bit的静态异步双端口RAM,其存储速度为25ns。它有两套独立的地址线、数据线和控制信号线,允许两个控制器件中的数据通过共同连接的存储器来进行通信。该双端口RAM允许两个控制器同时读取任何存储单元(包括同时读同一单元),但不允许同时写或者一读一写统一地址单元。

对于TMS320VC5402,数据存储器CY7C133的对应地址为4000H~47FFH。

对于AT89S52,数据存储器CY7C133的对应地址为2000H~27FFH。

3 软件系统设计

汉语作为一种有调语言,其韵律特征非常复杂。为了从有限的存储单元中合成出无限字汇的连续语句来,必须在一定的韵律规则下对语音库单元的韵律参数进行调整,以得到符合当前语流环境的音变单元[3]。

根据得到音变单元的方法不同,可将语音合成器分成两种类型:(1)波形拼接合成;(2)参数合成(又称源/滤波器合成)。本系统采用波形拼接合成的方法直接对波形的时域和频域波形进行调整以得到所需要的音变单元。

简单的波形拼接法很难进行音高和音长(时间长度)调整。因此,本系统采用中性语调音节直接拼接配合基音同步波形叠加(PSOLA)算法,并用码激励线性预测(CELP)编码方法对原始采样音库进行编码压缩的方法。基本流程图如图3所示。


?
?
4 结束语

本系统利用SCM实时显示输入的文本文件,能够将合成语音和输入文本文件实现对比输出,直观性强;具有清晰度、能懂度和自然度高;合成算法运算复杂度低,能够用尽量小的音库来实现对容量有限的存储空间的占用程度的要求。

关键字:算法  处理器  前端 引用地址:一种基于DSP的中文语音合成系统设计

上一篇:DSP与单片机通信的多种方案设计
下一篇:DSP/BIOS环境下的数据通信

推荐阅读最新更新时间:2024-05-13 18:17

基于ATOM处理器的工业控制系统实现
ATOM处理器采用突破性全新设计的45纳米工艺,将4 700万个晶体管集成至一块面积小于25 mm2的单一芯片中,从而成为了英特尔史上体积最小、功率最低的X86处理器。由于性能出色,功耗很低,ATOM处理器非常适用于移动互联网设备、低功耗移动互联网计算机、基础互联网台式机,以及对功耗要求苛刻的工业应用场合 。 本文针对工业控制系统小体积、低功耗的应用需求,利用Intel最新的低功耗移动ATOM处理器特点,提出一整套工业控制系统设计方案。 1 平台架构  Intel定义的“迅驰Atom处理器技术”整套平台包括Intel Atom处理器(Silverthorne和Diamondville)、低功耗“伴侣芯片”(桥芯片)以及超
[单片机]
欧德宁:2011年推首款英特尔处理器智能手机
据国外媒体报道,英特尔CEO欧德宁(Paul Otellini)周三表示,英特尔处理器迟早将打入智能手机和平板电脑市场,这是一场马拉松比赛,而不是短跑冲刺。   欧德宁称:“在平板电脑和智能手机市场,英特尔目前毫无建树。每个人都想知道我们将如何应对,但赢得这场战争需要时间。”   10多年来,英特尔一直试图将其在PC市场的主导地位普及到手机和其他移动设备市场。但目前还没有任何一款智能手机采用英特尔处理器,苹果iPad和其他厂商的平板电脑也未使用英特尔处理器。但欧德宁表示,计划在2011年展示首款采用英特尔处理器的智能手机。   作为全球最大的PC处理器制造商,英特尔四年前调整了移动处理器开发战略,推出了Atom处理器。对
[手机便携]
联想、惠普、戴尔和鸿基谁才是你值得“掏腰包”的轻薄本
无论是刚刚步入职场的新人还是需要更换工作电脑的用户,选择一款轻薄本用来办公一定是你们的首选,一台趁手的电脑能够为工作带来极大的便利,帮助你远离卡顿提高效率。 机型推荐: 联想 ideapad320s 联想ideapad320s是一款15.6英寸轻薄便携 笔记本 ,镁铝合金机身造型优美,一体化成型工艺带来了更强的抗压能力,BC面边框采用钻石切割工艺,更显精致细腻,窄边框的加入让这款产品更加吸引人。   联想ideapad320s   联想ideapad320s   联想ideapad320s搭载i5-7200U 处理器 、4GB内存、1TB机械硬盘以及GT920MX 2GB独显,整机办公性能出色,还能胜任一定的影音娱乐,非常
[嵌入式]
VaST针对SC2400处理器推出虚拟模型
VaST Systems Technology公司日前发布一款面向StarCore SC2400处理器的高性能虚拟模型。C2400是继SC1200和SC1400之后由VaST实现建模的第三个StarCore处理器。 虚拟处理器模型(VPM)技术是基于VaST虚拟系统原型的一种SoC仿真模型,具有快速和精确时钟的特性,可在现有PC机上以200MIPS的速度运行。VaST VPM具有可配置性,可提供观察执行软件情况及被选处理器内部寄存器的能力。用户通过这种虚拟处理器模型能实现结构分析和优化,并可用于进行早期的软件开发。
[嵌入式]
射频前端设计挑战加剧,下一代手机需要更高集成度
  随着移动行业向下一代网络迈进,整个行业将面临 射频 组件匹配,模块架构和电路设计上的挑战。下面就随模拟电子小编一起来了解一下相关内容吧。   直到早期的LTE网络部署, 射频 系统的设计涉及较少数量的前端组件,也因此相对的简单与直接。当无线网络开始升级成LTE-Advanced, 射频 前端的设计愈发复杂。与此同时,载波聚合、多输入多输出(MIMO)、多样性接收模块和包络跟踪等各类技术让4G网络变得更加高效和稳定。   全球众多的LTE频段组合早已增加 射频 设计的复杂性。为了支持繁多的频段与频段组合,移动设备需要更多的 射频 组件。由于智能手机内部设计的局限性,加上手机电源与整体外形设计上的限制, 射频 前端需要精心设计才
[模拟电子]
3个PLC编程算法,这篇文章也许对你很有用!
PLC编程算法(1) PLC中无非就是三大量:开关量、模拟量、脉冲量。只在搞清楚三者之间的关系,你就能熟练的掌握PLC了。 1、 开关量也称逻辑量,指仅有两个取值,0或1、ON或OFF(开关量只有两种状态0/1,包括开入量和开出量,反映的是状态)。它是最常用的控制,对它进行控制是PLC的优势,也是PLC最基本的应用。 开关量控制的目的是,根据开关量的当前输入组合与历史的输入顺序,使PLC产生相应的开关量输出,以使系统能按一定的顺序工作。所以,有时也称其为顺序控制。 而顺序控制又分为手动、半自动或自动。而采用的控制原则有分散、集中与混合控制三种。 2、 模拟量是指一些连续变化的物理量(数字量是不连续的。反映的是电量测量数值)
[嵌入式]
3个PLC编程<font color='red'>算法</font>,这篇文章也许对你很有用!
联发科明年推中高阶处理器X12,传红米3用?
    外媒gforgames报道称,有匿名消息人士透露,联发科计划于明年推出全新SoC处理器Helio X12(MT6795X),该处理器显然是Helio X10的升级版本,性能与三星Exynos 7422和高通高通Snapdragon 618/620相近。   据消息人士透露,Helio X12将采用64位八核Cortex A53核心,主频为2.25GHz,GPU采用700Hz PowerVR GX6250,支持双通道933MHz的LPDDR3,eMMC 5.1、USB 3.1,搭配最高2100万像素的摄像头,支持LTE Cat 6 网络,支持VoLTE,支持2x20MHz的载波聚合(CA),并采用台积电全新28nm HPC
[手机便携]
深度学习演算法接近线性微缩效率
IBM Research在深度学习演算法取得最新突破,据称几乎达到了线性加速的最佳微缩效率目标… IBM Research发表深度学习(deep learning)演算法的最新突破,据称几乎达到了理想微缩效率的神圣目标:新的分散式深度学习(DDL)软体可随着处理器的增加,实现趋近于线性加速的最佳效率。 如图1所示,这一发展旨在为添加至IBM分散式深度学习演算法的每一个伺服器,实现类似的加速效率。 IBM研究人员兼IBM Research加速认知基础设施部门总监Hillman Hunter认为,其目标在于“将与深度学习训练有关的等待时间,从几天或几小时减少到几分钟或甚至几秒钟。” Hunter在一篇有关这项深度学习发展的
[半导体设计/制造]
小广播
最新应用文章
换一换 更多 相关热搜器件

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 安防电子 医疗电子 工业控制

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved