当今处于物联网时代,而语音识别被视作为人机交互的入口,由于人工智能和机器学习迅猛发展,语音控制也变得更为实用。在接下来的几年里智能语音将成为人机交互的新范式,语音技术将解放人类双手和眼睛,用户以较低的成本实现随时访问。下面就随网络通信小编一起来了解一下相关内容吧。
语音识别面临三大挑战
语音识别是现在最为耀眼、大家生活中接触最多的语音技术。近些年来,语音识别技术突飞猛进,自然受到广大公众的极大关注。毕竟,语音识别的进步代表着机器的听力发展,是人工智能的重要一步。目前语音识别存在可穿戴设备的交互与通用应用程序入口两个急切需求。可穿戴设备因体积等原因限制,仅拥有局限输入输出设备。通用应用程序入口简单点说就是现在的VIV正在干或者说想干的事情。VIV希望通过一个语音助手解决所有现在所需要用APP去解决的所有问题。
智能语音存在两大技术瓶颈。第一个远场环境复杂,夹杂噪音、混响、自噪声等,容易导致机器端“听不清”,从而影响后续一系列操作。解决了这个问题,偏命令控制的终端便能带来良好的用户体验;第二个更深层次的智能问题,真正的智能需要实现语义的突破、需要声音与视觉的融合,这样的方案才更适合做拟人形态的机器人;第三个该项技术熟悉各种各样的语言、口音和方言。也许,这一点在中国尤为重要。
快速发展需跨越三座大山
要快速发展就必须跨越硬件、算法、内容这三座大山。首先是硬件,硬件部分芯片与麦克风阵列是核心部件。当下的语音技术还只在算法阶段。一类是成本较低的传统语音模式识别技术,通过波形比较、波形匹配以及特征化实现;另一类是基于AI技术的,由于适应性好,可做到更加精准地识别。只要芯片支持音频输入功能和对应的运算性能即可,比如CPU能够达到ARM双核1.2G就可满足语音识别的要求,但称之为专用的智能语音芯片并不严谨。其次是算法,主要包括语音检测、降噪、去混响和回声消除等传统音箱和通讯工具也需要具备的基本算法。智能音箱的关键算法是唤醒、语音识别、自然语言理解、对话管理、自然语言生成和文语转换等算法。第三是内容,语音识别的目的是将语音信号转化为文本,目前,语音识别技术相对成熟。声纹识别是根据语音波形反映出的个人生理和行为特征的语音参数,并以此来识别说话者的身份。现实中,该识别的准确率并不如指纹、虹膜识别。这也是智能语音更高“智能”形态的表现特征。
总结:智能语音技术的发展并非一朝一夕,所以在技术层面已具有根基,现有的硬件与方案是可以满足当下智能语音要求的,但若在性能、成本、智能程度上更进一层,仍需继续深耕,因为产品的逐级落地自然就有一个不断完善的过程。随着人工智能的发展和深度学习技术的使用,语音识别准确率已经达到了95%以上。计算机和智能终端的界面正在从“键盘+鼠标”变为“麦克风+按钮”,智能语音带来的交互新体验正在渗透。有数据显示,预计到2020年,全球语音识别的市场规模将从2015年的61.9亿美元增长到200亿美元,可以说语音识别未来的市场发展十分有看头。
以上是关于网络通信中-语音识别面临三大挑战 智能语音快速发展需跨越三座大山的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息
关键字:语音识别 智能语音
引用地址:
语音识别面临三大挑战 智能语音快速发展需跨越三座大山
推荐阅读最新更新时间:2024-05-07 17:38
准确率提高9.5% 亚马逊Alexa推出新语音识别系统
导语:亚马逊Alexa部门的研究人员开发了2-mic语音识别系统,相较于传统的7-mic系统,该方法将语音识别准确率提高了9.5%。 在语音识别方面,两个麦克风比一个麦克风更好,这是一个公认的事实。直观的说,这是有一定道理的:声波到达多个麦克风的时间延迟不同,这可以用来提高来自某个方向的信号的强度,同时减少来自其他方向信号的干扰。传统上,语音增强(将语音从噪声中分离出来)的问题一直是独立于语音识别来解决的,但是相关实验结果表明,这种方法所取得的效果并不太好。最近,亚马逊研究人员对此提出了自己的解决办法。 亚马逊Alexa部门的研究人员认为,他们已经开发出一种新的声学建模框架,通过统一语音增强和语音识别来提高性能。在实验中,当应用
[家用电子]
AI已成为IoT时代的新船票,人机交互,智能语音是关键!
我们都记得,AlphaGo击败了世界上最好的人类棋手,消息一出瞬间炸响了神州大地,屏幕上的比分改写了历史的同时也向世界证明AI技术将在未来的“不同凡响”。紧跟人工智能风潮,目前,中国正在向“2030年成为世界领先的人工智能创新中心”这个目标大步迈进, 四个新成立的国家人工智能开放创新平台更是相当引人注目,Al将在今后以人类辅助性伙伴的形式参与到人类各项实际应用之中。 其中,创新平台阿里以智慧交通为切入点,立足于杭州,针对交通大数据进行分析,对道路实时流量监控和控制,从而提升交通效率;百度公开无人驾驶平台,合作伙伴可通过该平台快速搭建自己的无人驾驶系统,被定义为自动驾驶领域的安卓。依托腾讯公司建设的医疗影像国家新一代人工智能开放
[嵌入式]
国产类Siri应用层出不穷 语音识别开智控新时代
随着3G时代的到来,随着科技快速发展,智能化、人性化已成为发展趋势。苹果Siri的推出引发国内市场的热潮,带火了消费端产品语音控制的概念,在成功地吸引了高关注度的同时,也带来了智能语音市场新一轮的效仿与竞争。近日,贵州大学的9名法学生研发的一款号称“中文版的Siri”的国产语音助手Airi就在网络上红火了一把。Airi不仅能听、会说,可以幽默对话,而且Airi支持中文。智能手机“又能听又会说”功能,彻底改变了人与手机之间的交互方式,使人与手机之间的“沟通”变得更加自然方便,这将为手机行业带来巨大变化。
Siri让语音控制手机成为现实
苹果Siri的流行带火了消费端产品语音控制的概念,更是革新了语音识别的定义。苹
[网络通信]
百度宣布全资收购智能语音创业公司KITT.AI
7月5日消息,AI创业公司KITT.AI正式加入 百度 。景鲲在 百度 开发者大会现场宣布: 百度 将全资收购KITT.AI,把KITT.AI的语音能力和自然语言处理能力融入到百度平台中,全面免费向百度的合作伙伴赋能开放。下面就随网络通信小编一起来了解一下相关内容吧。 百度宣布全资收购智能语音创业公司KITT.AI KITT.AI专注语音唤醒和自然语音交互技术,是世界上唯一一家获得亚马逊Alexa和微软联合创始人Paul Allen投资的公司,并入选了CB Insights人工智能创业一百强。 KITT.AI联合创始人、CTO陈果果现在演示了如何使用KITT.AI语音唤醒技术快速打造一个语音唤醒设备。根据陈果
[网络通信]
智能语音提示芯片在手持吸尘器的应用
手持吸尘器的工作原理是,利用电动机带动叶片高速旋转,在密封的壳体内产生空气负压,吸取尘屑,因为体积小、便捷性强的特点,许多消费者家庭都会配备一台小型的吸尘器,可以清除沙发、汽车坐垫、办公桌台等细小的杂物; 市面上的吸尘器款式众多,功能也大同小异,但若出了问题无法第一时间知道原因,譬如:电池供电的电量不足、过滤芯堵塞、等原因,如果加入了语音提示功能,用户便可第一时间了解到,当前的异常状态; 深圳唯创知音,研发了一款智能语音提示芯片:WT588F02B-8S,单芯片拥有220KB的Flash,支持6K~32Khz的WAV文件,在较高音质下,最大可存放170秒语音内容,若对音质没有要求可存放320秒的语音,WT588F02B-8
[嵌入式]
嵌入式语音识别处理ISD-SR3000应用电路设计
ISD-SR3000是新型嵌入式语音识别处理器,它由语音识别引擎、语音压缩引擎和录间功能组成。并带有最优指令系统为核心的PISC/ PSP 、灵活的CODEC接口和串行主控制器接口,文中介绍了ISD-SR3000的特点、引脚排列和功能。给出了一个用 SR3000组成的语音识别系统电路。 基于SR3000的语音识别系统 由ISD-SR3000构成的语音识别系统由电路如图2所示。以下分别介绍电路中各部分的功能。 时钟电路 SR3000内含片内振荡器,但应用时也可通过X1和X2/CLKIN端的外接晶振或外部时钟源来产生时钟信号。外部时钟源信号应通过X2/CLKIN端输入。要注意的是,外部时钟源电平与CL
[电源管理]
智能玩具的设计-聪明宝宝
1 引言 智能化已成为玩具行业的新趋势,让语音技术融入到玩具中,不仅可以赋予玩具“听”“说”的交流能力,使其更加生动、智能,还有利于在儿童中普及现代科学技术,推动语音技术产业化的发展。一些领先技术被应用于今天的玩具领域如:无线电、红外通讯、传感器、语音识别等等。 本文介绍的是基于SPCE061A的一种具有语音识别功能的玩具产品,并着重介绍了软硬件设计方法。 2 系统结构 硬件结构框图如图 2.1所示:主要由按键输入电路、触摸键输入电路、直流电机驱动电路、光敏器件输入电路、单片机最小系统等部分组成。 图 2.1 系统整体框图 整个系统工作于4.5V电压下,由3节5号电池提供4.5V电压,经过SPY0029稳压
[单片机]
2010 Nuance语音识别技术论坛
语音、文字智能输入和图像解决方案提供商Nuance(NASDAQ: NUAN)通讯公司的2010 Nuance 语音识别技术论坛分别于9月8日在北京和9月10日在上海成功举行,并于9月14日移师香港。 Nuance此次技术论坛的主题为 “呼叫中心全新客户体验”,是希望通过其领先的语音识别技术,多行业多领域的实施经验,提升呼叫中心与企业自动化系统的自助服务质量并降低服务成本。在此次论坛上,对于寻求提升客户体验的呼叫中心而言,不仅能够获知如何通过语音识别技术和智能用户界面设计,让自助服务解决方案更吸引企业的用户,而且在了解Nuance公司在中国市场投入及技术改进的同时,可以在Nuance众多的成功案例中汲取经验,获得可以
[网络通信]