基于AC48304的嵌入式多路语音记录器

发布者:Qianfeng最新更新时间:2007-03-23 来源: 控制工程网关键字:编解码  VOIP  静音 手机看文章 扫描二维码
随时随地手机看文章
1. 引言

  数字多路语音记录器在安全、监控方面有很多应用。一些传统的设计方案基于工控机,用数据采集卡实现语音的A/D转换,用软件实现语音编解码,这种方案成本高、功耗大。如果采用嵌入式的设计方案,可以实现同样的功能,并且具有低成本,低功耗的特点。

  普通的低成本嵌入式处理器性能不高,不足以实现多路语音的实时编码、解码,需要用专门的语音处理芯片完成这一工作。基于DSP自主设计语音编码器是一种方法,但工作量大。AC48304广泛应用于各种小型VOIP网关中,价格低廉,是一种很好的替代方案。同时AC48304还具有DTMF识别和静音检测等功能,便于实现电话号码识别和语音的

自动记录。

  ARM是一种应用广泛的嵌入式处理器,Samsung、Atmel等厂家生产的ARM处理器接口丰富,技术支持全面。ARM处理器价格低、性价比高,向下取代了大量单片机的应用,向上渗透高端嵌入式处理器的市场。在本多路语音记录器中,采用了Samsung的ARM9处理器S3C2410,操作系统则采用了嵌入式Linux。

2. 系统结构

  语音记录器包括语音处理模块、ARM系统模块、硬盘记录模块、网络接口模块几个部分。为使系统配置灵活,将系统设计为主控板和扩展板两个部分,在主控板上实现16路语音通道,另设计一个16通道的语音扩展板,整个系统可以用4的倍数进行语音通道的扩展,最多达到32个语音通道。计算机控制部分集成S3C2410 处理器、64MB SDRAM及16MB 的FLASH,构成一个嵌入式小系统。

  语音CODEC采用AMD的LE58QL021,该器件是3.3V单电压用户线语音处理器,在小型语音网关中是AC48304的常用搭配,支持4通道语音AD/DA,支持E1 PCM Highway,能与AC48304实现无缝连接。LE58QL021的工作模式可软件编程控制,ARM通过MPI(Microprocessor Interface)串行控制总线设置LE58QL021的各种工作参数。

  基于DM9000网络控制器,系统实现10/100Mbps自适应以太网接口,Linux操作系统提供设备驱动支持。IDE接口则是由一片CPLD实现,硬盘用于语音的本地记录。主要部分电路原理见图1。


  图1 语音处理模块的硬件电路原理图

3. AC48304语音处理器

  AC48304是AudioCodes公司基于DSP设计的一个四通道语音处理器,支持多种标准、多种码率的G系列语音编码器,如G.723.1,G.711,G.726和G.729等,支持T.38传真中继和其他语音信号处理功能。在系统中,ARM通过CPU局部总线实现对AC48304的控制及数据交换。AC48304与LE58QL021之间通过E1 PCM Highway接口实现多通道数字语音接口。E1接口由2.048Mhz时钟驱动,有0~31共32个8位时隙,工作时序如图2所示。


  图2 PCM Highway时序

  AC48304是一种专用的语音处理DSP芯片,需要运行相应的DSP程序。正常运行前, AC48304有两个程序需要下载:kernel(内核)程序和application(应用)程序。kernel程序是个只有几百字节的小程序,完成DSP的初始化工作,为下载应用程序做准备。application程序则完成AC48304的所有功能,在kernel程序程序下载完成后,才可以下载application程序。AC48304有4个工作模式:内核下载模式、程序下载模式、初始化模式、运行模式。其中运行模式有两个状态:空闲状态和激活状态,用户只能在空闲状态改变芯片的工作参数。

4. 软件设计

  4.1Linux中的驱动程序设计

  操作系统采用的是嵌入式Linux操作系统。Linux具有效率高、内核小的优点,且开放源代码,完全免费。在Linux操作系统下,应用程序不能直接访问硬件,尽管Linux在ARM平台上有较完整的板级支持包,但在该系统的开发工作中仍然要完成部分设备的驱动程序设计,包括AC48304驱动程序、LE58QL021驱动程序、S-EEPROM驱动程序等。

  设备驱动程序要为应用软件提供设备打开、关闭、设备控制及数据读/写等接口, 即一些类似于open、close、read和write的函数,在主程序中直接采用文件读写的方式实现数据的收发。LE58QL021与ARM处理器之间采用MPI串行控制总线,MPI驱动接口结构定义如下:

  static file_operations mpi_ctl_fops = {

  ioctl:  mpi_ctl_ioctl, //设备控制

  open:  mpi_open, //打开设备

  close:  mpi_ close, //关闭设备

  }

  Linux提供ioremap函数将I/O内存资源的物理地址映射到核心虚地址空间,然后可像操作寄存器那样进行数据读写。编写驱动程序的时候,必须提供两个函数,一个是module_init(),insmod在加载此模块的时候自动调用,负责进行设备驱动程序的初始化工作,一个函数是module_exit,在模块

被卸载时调用,负责进行设备驱动程序的清除工作。

  4.2 AC48304的数据读写实现

  每个AC48304可同时进行4个通道的语音编/解码,片内有数据缓存区,编码后的语音数据先存储在各通道的缓存区,然后依次拷贝到输出缓冲区。表1为本系统支持的几种主要语音编码格式的相关参数。其中G.711的A/u律数据量最大为64kbps,每个通道每秒有8000字节的数据,而AC48304的数据读取区的有效量为80字节,即每秒钟要进行100次的读取操作,对每个AC48304而言每秒钟要进行400次读取操作才能保证数据及时读取。由于语音编码包是以恒定的速率产生的,因此每2.5毫秒必须对DSP进行一次读取操作。本平台的Linux内核中,进程调度算法的时间单位为10毫秒,在进程中执行数据的读取操作很难保证数据及时读取,如果某个服务进程或者是本进程中的某个控制操作执行时间过长,就会造成语音数据的丢失。

  表1:语音数据特性

  

  Linux中程序运行的环境分为内核空间和用户空间,内核空间的程序优先级高于用户空间。为保证编码数据被及时读取,需在内核级别的进程中定时读取AC48304产生的数据。有两种方式可将用户程序加入到内核空间中运行:修改Linux内核源代码,直接将用户程序代码编译到内核中;利用Linux的模块机制,动态的将用户程序代码添加到内核空间中运行。第一种方法实现难度比较大,而且容易出错。第二种方法实现难度小,效果与第一种相同,本系统中采用的是第二种方法。

  将AC48304的读取操作作为驱动程序进行设计,使用insmod命令动态加载到内核中去,在定时中断的服务函数中读取AC48304的数据。S3C2410中有5个用户可编程的时钟中断,中断优先级别高,中断的频率可编程控制,其中时钟中断Timer3已用于DMA控制,Tmer4用于进程调度。本系统的程序设计中使用Timer2,通过配置相关控制寄存器将Timer2的中断频率设为500HZ,适当的增加读取查询操作频率,保证数据及时读取。中断服务函数是由内核来执行的,优先级高于用户程序,可保证读取操作的实时性。为AC48304的每个通道分配一个数据缓冲区,定时中断函数中读取的数据先保存在缓冲区中,用户程序通过读取该缓冲区获得语音数据,这样对外部用户而言,语音数据没有丢失,语音延迟在毫秒级别,完全可以满足需求。

  4.3 应用软件设计

  将应用程序及驱动程序文件加入文件系统中,修改有关启动的配置文件,使得系统启动完毕时自动加载目标程序,这样每次设备启动时将自动进入应用程序。主程序流程如图3所示,主程序的功能主要是:

  u 系统配置:系统的配置表存储在一片S-EEPROM中,配置表可以通过串口终端或者网络在线配置。

  u 初始化系统:包括向DSP下载内核程序和应用程序,启动DSP及LE58QL021等。

  u 语音数据读写:通过DSP的HPI总线读取DSP数据实现语音采集,通过HPI把数据写入DSP实现语音回放。

  u 数据存储:根据录音计划将需要录音的语音数据保存到硬盘中。

  u 命令处理:包括选择语音通道命令、回放命令、校时命令、增益调节命令、配置表传输命令、录音数据上传命令等。


  图3.主程序流程图

5. 结束语

  本记录器最多支持32路语音实时处理,在硬盘上实现长时间录音,并可通过10/100Mbps以太网实现数据上传和管理。经测试本记录器可以很好的完成语音数据的采集、压缩、存储、解压缩和回放,内核级别的用户进程运行正常,保证了整个系统的实时性。该语音记录器具有低成本、低功耗、结构精简、使用简单的特点,具有很好的实用价值。

  本文作者创新点:采用嵌入式实现系统设计,操作系统及应用软件完全固化在FLASH中,实现了高稳定性;相对基于工控机的语音记录器,本文设计的系统具有低成本、低功耗的特点;在本文中创新性地将VOIP语音处理器AC-48304应用在多路语音记录器中;在软件是设计中,在LINUX操作系统内核空间实现数据采集功能,从而保证了系统数据采集的实时性要求。

参考文献:

[1].华恒公司. HHARM2410平台手册. 2004.
[2].AC4830xC-C Vopp Designer's Manual.pdf. 2003.
[3].吴姣梅,李红艳,吴保荣,严明.改善嵌入式Linux实时性能的方法研究.微计算机信息.2006年,02期,72页.
[4].K.Wall,等.GUN/LINU

X编程指南.王勇等译,北京:清华大学出版社,2000.

关键字:编解码  VOIP  静音 引用地址:基于AC48304的嵌入式多路语音记录器

上一篇:基于DSP的PCI总线数据采集系统的研究
下一篇:实时系统中混合任务集的动态电压调节算法

推荐阅读最新更新时间:2024-05-13 18:35

微软申请静音语音命令专利 解决公共场所使用语音助手时的尴尬
尽管语音助手已在智能设备上大范围普及,但大多数人仅习惯在比较私人的地点使用它,因为...在公共场所使用语音助手不仅会使自己看起来十分尴尬,且非常容易向周边人群透露自身隐私。近日,微软最新的一项处理静音语音命令专利正表明,其有意帮助用户解决此类烦恼闹,语音助手的适用群体即使在公共场所也能够无障碍使用。 根据专利内容描述,微软为解决此类问题提供了一种静音语音输入方案,即通过将带有特殊模块的设备(手机、平板、手表、耳机以及独立组件等)靠近用户的嘴巴,通过检测用户吸气或渐进的气流来推断语音指令,即使用户说话声音较小也能准确识别。与常规的语音录入方法不同的是,传统语音录入检测的是用户呼出的气流。当然,目前还不清楚,微软的这款装置是否能
[家用电子]
微软申请<font color='red'>静音</font>语音命令专利 解决公共场所使用语音助手时的尴尬
基于H.264视频编解码SoC满足高清DVR设计
硬盘录像机(DVR)作为监控系统的核心部件之一,在10年里高速发展,从模拟磁带机的替代品演变成具有自己独特价值的专业监控数字平台,并被市场广泛接受。监控系统伴随DVR这些年的发展向着IP化、智能化发展。 根据行业用户的需求,DVR由以下几个方向需要被行业关注:1、DVR的编码方式向更高压缩效率的标准 H.264 发展;2、录像分辨率从CIF(352*288分辨率) 向D1(720*576)、720P、1080P发展;3、现场监控分辨率也从D1向HD高清发展;4、封闭子系统向开放IP架构系统发展;5、更方便快捷的在海量视频里面找到所需要的录像。 基于对DVR产品的发展方向的理解,海思半导体推出Hi3520,以满足日益迫切的高清DVR
[嵌入式]
基于AC48304的嵌入式多路语音记录器
1. 引言   数字多路语音记录器在安全、监控方面有很多应用。一些传统的设计方案基于工控机,用数据采集卡实现语音的A/D转换,用软件实现语音编解码,这种方案成本高、功耗大。如果采用嵌入式的设计方案,可以实现同样的功能,并且具有低成本,低功耗的特点。   普通的低成本嵌入式处理器性能不高,不足以实现多路语音的实时编码、解码,需要用专门的语音处理芯片完成这一工作。基于DSP自主设计语音编码器是一种方法,但工作量大。AC48304广泛应用于各种小型VOIP网关中,价格低廉,是一种很好的替代方案。同时AC48304还具有DTMF识别和静音检测等功能,便于实现电话号码识别和语音的 自动记录。   ARM是一种应用广泛的嵌入
[应用]
TI编解码器支持独立时钟控制的转换器采样
24 位编解码器将系统设计灵活性与卓越音频性能实现完美结合   2007 年 5 月 22 日,北京讯   日前,德州仪器 (TI) 宣布推出支持异步工作的 24 位音频编解码器 ——PCM3060,使模数转换器 (ADC) 及数模转换器 (DAC) 均能采用独立时钟进行工作。在 DVD/Blu-Ray/HD-DVD 刻录机、数字电视、数字机顶盒及汽车导航系统等应用中,音频信号往往要通过不同的采样率进行解码与编码,PCM3060的推出满足了对异步音频编解码器的需求。更多详情,敬请访问: http://focus.ti.com.cn/cn/docs/prod/folders/print/pcm3060.html 。   PCM
[嵌入式]
视频编解码原理及详细步骤
谈到视频的编解码,我们会自然地想到H.264、HEVC/H.265这些权威的视频编解码标准;谈到标准,有人觉得这个是有专门机构去研究的,我们关心应用就好;即使有兴趣读了标准和相关技术,面对更多的是各种数学公式和术语,如协方差、傅立叶变换、高频、滤波等等,需要花更多时间去理解。通常更为实际的做法是,我们只要调研如何应用这些标准,如何做好软硬件编码方案的选型,如何优化技术参数以及如何调用API,也就基本能够应对日常的视频业务了。因此,谈到视频的编解码,往往带有一丝神秘色彩。 本文的目标是以非专业的视角来看待视频编解码原理,试图将所谓高大上的专业术语或名词转换为普通IT业者略懂的话语,从而使更多人了解视频编解码到底是怎么回事。
[嵌入式]
视频<font color='red'>编解码</font>原理及详细步骤
基于LPC2214和uC/OS-II的嵌入式平台的音频编解码方案
目前流行的ARM芯片内核有ARM7TDMI、ARM720T、ARM9TDMI、ARM992T、ARM940T、ARM946T、ARM966T和ARM10TDMI等,Philips LPC2214是基于ARM7TDMI-S的高性能32位RISC微控制器,它集成了Thumb扩展指令集,256KB可在系统中编程的片内Flash和可在应用中编程的16位KB RAM,向量中断控制器,外部总线控制器,2个UART,I2C串行接口,2个SPI串行接口,2个定时器(7个捕获/比较通道),可提供多达6个PWM输出的PWM单元,8通道10位ADC,实时时钟,看门狗定时器以及112个通用I/O引脚,通过可编程的片内锁相环(PLL)可实现LPC2214最
[单片机]
基于LPC2214和uC/OS-II的嵌入式平台的音频<font color='red'>编解码</font>方案
基于AC48304的嵌入式多路语音记录器
1. 引言   数字多路语音记录器在安全、监控方面有很多应用。一些传统的设计方案基于工控机,用数据采集卡实现语音的A/D转换,用软件实现语音编解码,这种方案成本高、功耗大。如果采用嵌入式的设计方案,可以实现同样的功能,并且具有低成本,低功耗的特点。   普通的低成本嵌入式处理器性能不高,不足以实现多路语音的实时编码、解码,需要用专门的语音处理芯片完成这一工作。基于DSP自主设计语音编码器是一种方法,但工作量大。AC48304广泛应用于各种小型VOIP网关中,价格低廉,是一种很好的替代方案。同时AC48304还具有DTMF识别和静音检测等功能,便于实现电话号码识别和语音的 自动记录。   ARM是一种应用广泛的嵌入
[嵌入式]
H.264音视频编解码SoC芯片Hi3510的原理和应用
进入网络时代以来,庞大的信息流带来了人类文化的丰富,也带来了存储信息的烦恼。尤其是视频信息的庞大数据,催生了视频压缩技术的需求。视频压缩技术成为多媒体时代最热门的技术之一,并广泛地应用在电视、电影、可视电话、视频会议、远程监控等图像传输和存储的领域。 H.264视频压缩原理 从信息论观点来看,图像作为一个信源,描述信源的数据是信息量(信源熵)和信息冗余量之和。信息冗余量有许多种,如空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余等,数据压缩实质上是减少这些冗余量。可见冗余量减少可以减少数据量而不减少信源的信息量。从数学上讲,图像可以看作一个多维函数,压缩描述这个函数的数据量实质是减少其相关性。 根据图像信息的组成元素,H.26
[嵌入式]
小广播
最新应用文章
换一换 更多 相关热搜器件

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 安防电子 医疗电子 工业控制

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved