语音识别技术未来会成为你的“数字版双胞胎”

发布者:Xiangtan最新更新时间:2018-12-28 来源: 腾讯关键字:语音识别  XMOS 手机看文章 扫描二维码
随时随地手机看文章

语音命令是与电子设备互动的一种更自然的方式,尤其是无需笨拙的拨弄按钮和触控屏幕。最近几年以来,语音助手的普及程度突飞猛进,现在我们几乎所有能想到的家用智能设备都已经可以使用语音助手来控制。

而现在一家名叫XMOS公司的努力使这种技术的进一步增长成为可能。也许你这个名字可能不太熟悉,但如果你曾经使用过亚马逊Echo智能音箱,那么就从这种技术中受益过。

XMOS是一家专注于语音处理的无晶圆片半导体公司,它的算法能够检测整个房间的轻声语音指令,即使是在非常有挑战性的条件下(比如有很多杂物或墙壁的房间里)。那么,为什么语音技术进步得如此之快呢?

XMOS算法工程师亚历克斯·克拉辛(Alex Craciun)表示:“我认为是语音技术让生活变得更容易。你不必处理那么多消息和复杂的指令。我们要做的只需要给出命令,设备就可以自己进行优化,或者告诉你想要的东西,这就简单多了。”

该公司营销总监Esther Connock补充说:“语音技术可以帮助我的服务,我们认为语音命令会让一切变得简单,因为这种技术会告诉你它是如何工作的。它不需要遥控器、也不需要带说明书,我们只需要用一种非常自然的方式进行对话和与它交谈,这对我们来说是技术的民主化,因为你不需要花费太多的时间成本去学习如何使用它,同时你也不需要带着一定的知识储备去做。”

“所以,如果想想那些文化水平或受教育程度比较低的用户,突然之间就会意识到这是一个更加开放的竞争环境。社会的弱势群体可以利用这种技术减少孤立感。所以对我们来说,声音是世界上最自然的东西。”

有助于聊天

XMOS是来自英国布里斯托尔蓬勃市发展的科技产业的一部分,由该市的两所大学联合发展而来,这两所大学还包括Ultrahaptics(利用超声波在空中制造触觉反馈)、Reach Robotics (Mekamon增强现实机器人的创造者)和Graphcore (XMOS的子公司)。

其语音检测和隔离技术包括波束形成(跟踪一个人的声音、他们所处的空间以及自动跟着他们的麦克风移动)、声学回声取消(分离用户的声音从声音播放的设备本身)和补偿回波、噪声抑制、停止音频播放设备的检测到唤醒语以及固定或自动增益控制(确保电话会议中的所有声音都能以相同的音量听到,不管对方说话的声音有多大)。

该公司成立于2005年,以布里斯托尔大学的研究为基础。“他们开发了一种微控制器,可以做很多处理,并且有很多功率和能力可选,可以同时执行很多任务,”康诺克解释说,“这非常令人兴奋。”

2008年,苹果决定关闭FireWire接口,这一决定彻底打开了USB音频市场,XMOS开始在这个市场找到了自己的定位。该公司进行了多元化经营,为哈曼·卡顿(Harmon Kardon)和雅马哈(Yamaha)等大公司工作,也为拥有混音平台的DJ等小客户服务,然后转向多通道音频平台。

康诺克解释说:“有了一块处理能力很强的电路板,我们可以产生多达32通道的输出能力,这样我们就可以得到非常棒的多通道音频效果。这种声音和音频的专长在声音开始出现时就把我们引入了这项技术。我们的一位客户表示,凭借你所有的专业知识,就应该考虑使用麦克风和捕捉声音技术,而这正是我们所做的事情。”

2017年,XMOS凭借其远场语音接口技术获得亚马逊的青睐。康诺克说:“我们仍然是亚马逊唯一有资格的立体声解决方案合作伙伴,所以对于任何开发电视、音条和机顶盒类产品,并在真正的立体声系统中工作的客户来说,我们是唯一能够在立体声系统中消除杂音的技术供应商。这对我们来说真的很重要,也是我们今年在CES上重点关注的事情。同时我们也刚刚通过了百度的测试,这非常令人兴奋,我们另外也在与NTT Docomo合作,总体来说,我们正在全球各个地区扩张。”

户外音频技术

XMOS目前专注于房间边缘语音应用,但该公司也在研究其他领域,包括车内语音接口。

“我们在波士顿开发了一种新技术:声源分离,可以在对话中提取多种声音,这非常适合汽车环境,”康诺克说。“所以,如果你能想象我可以给你打电话时,即使我在开车,系统会把你能听到的一切杂音都去掉,只保留我的声音。孩子们可以在后面大喊大叫,他们也可以正在看一部在线流媒体电影,但对方能听到的只有我的声音。”

该公司还对语音技术的未来做出了一个有趣的预测:作为一名个人语音助理(内置到灵活的、可穿戴的智能手机中),它将介于我们现有和目前的大公司提供的语音识别服务之间。

“如果我看看亚马逊和谷歌(从某种程度上说,还有苹果和Apple Music),他们都有一种目的,就是他们想卖给我们东西。我更喜欢亚马逊卖给我的东西,但我不想要的是语音垃圾邮件,一旦这种东西开始出现,会导致用户远离语音技术。”

这种解决方案是一种中间地带,可以过滤掉任何垃圾邮件,并指向具有最相关内容的服务(它将根据用户的喜好通过人工智能技术学习这些内容)。

数字版的双胞胎

这不仅仅是一种理论,XMOS已经在实际中通过对话来来实现它。“这将很快发生,”康诺克说,“所以我们正在考虑合作、完善、购买,以创建那种生态系统。”所以这里面有很多我们认识的很多人在这个领域工作。它是开放的,已经准备好了,我们想要利用它。”

据康诺克介绍,这将导致公司创造出一位“数字双胞胎”,她承认这个词听起来有点矫情,但很贴切。它会学习并适应用户使用它的方式。例如,它会知道你不想让它跟你说话,除非你先开口。

“它不仅能了解我对音乐的喜好,还能了解我对所有事物的喜好。当我想要沟通的时候,我会优先和我的朋友们交谈,包括一切在内。”

交流更自然

然而,即使有一个真正的个人助理来过滤任何垃圾邮件,语音识别技术仍然面临一些阻力。

“当你看到这个”康诺克边说边捡起她的智能手机。“它有一个摄像头,它总是能听到你的声音,有传感器来采集大量数据,根据你输入的一切。因为我们如此依赖它,并且如此接近我们,所以大家不认为这是一个隐私问题。”

“但当你把一个扬声器放在房间中央时,每个人都会说,‘哦,它在监听我,没错,但它还不像智能手机那么贵。”

康诺克相信,与语音助手相关、可信的内容将是声音控制被广泛接受的关键。一旦行业将销售设备置于用户体验之上,它就会出现问题,所以XMOS要确保自己处于领先地位,并准备在这种情况下做出正确的反应。

还有自然语言的问题,而不是给人感觉像是命令。Alexa的技能非常有用,但它与另一个人交谈时完全不同,目前XMOS的算法工程师正在努力使交互更加自然,接近人类的语气。

“你需要感觉到机器能够理解你的情绪,就像它没有遇到任何问题,然后它就会溜得起飞。”康诺克说。

这听起来像是科幻小说,但康诺克说这比我们意识到的程度更接近现实。“我认为这种情况已经发生了,”她说。“我们看到亚马逊的很多的产品和进展,每个月都会有一些新的东西出现,所以这个领域发展得非常非常快。也许明天会有更自然的产品出现,给我们带来惊喜。”


关键字:语音识别  XMOS 引用地址:语音识别技术未来会成为你的“数字版双胞胎”

上一篇:2018年十大技术推动安防行业阔步向前
下一篇:嵌入式人脸终端在泛安防领域的发展

推荐阅读最新更新时间:2024-03-16 11:31

新型语音识别电路AP7003及其应用
    摘要: 介绍了新型、低成本语音识别电路AP7003的性能、引脚、指令等内容,并给出了应用电路原理图及详细的应用方法。     关键词: 语音识别 键盘控制 CPU控制 存储体 1 AP7003简介     AP7003是一款新型、低成本语音识别专用集成电路,内置有麦克风放大器、A/D转换器、语音处理器和I/O控制器,经预处理后可识别12组不同的字词,每组1.5秒时长,可连词或单词识别。AP7003包括AP7003-01(由CPU串行控制)和AP7003-02(由按键直接控制)两种型号,且最有高度的I/O可编程性,使用简单方便,可广泛应用于玩具、识别转控、自动答录等领域。     A
[应用]
XMOS委任Mark Lippett为总裁兼首席执行官
布里斯托尔 (2016年7月26日) 用于物联网 (IoT) 的语音使能控制器领导厂商XMOS (XMOS Ltd.)宣布任命Mark Lippett为总裁兼首席执行官。 Lippett在XMOS任职十年,经验丰富,先前在公司担任工程技术副总裁和首席运营官。在加入XMOS之前,他在Ignios担任首席技术官,并曾在德州仪器、Lucent和Madge Networks担任工程技术和市场营销职务。 Lippett表示: 我很高兴在XMOS这个重要发展时机获得任命。世界即将出现巨大变革,人们在家庭、工作场所和建筑环境中将与无所不在的电子装置打交道。他们将会使用数以十亿计的语音觉知 (voice-aware) 产品来与智能
[物联网]
<font color='red'>XMOS</font>委任Mark Lippett为总裁兼首席执行官
实时语音识别系统在家庭监护机器人的实现
语音是人类最常用的交流方式,也是人类和计算机交流最渴望的方式。因此用语音同计算机交流也成为了最近研究的热点,计算机对语音的理解是计算机科学中的一个引人人胜的、富有挑战性的课题。 进入90年代,随着多媒体时代的来临,迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Apple、AT&T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资。IBM公司于1997年开发出汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice’98。目前市场上已经出现了语音识别电话、语音识别记事本等产品,如美国VPTC公司的Voice Organizer和
[嵌入式]
实时语音识别系统在家庭监护机器人电路设计
  文中所研究和设计的功能,都是应用在移动机器人上的。因而系统的研究设计需要考虑到体积小、省电、便于移动的特性,并需具有便于家庭用户操作的友好显示界面。对于语音识别部分,需要用到用于语音识别算法处理的处理器、语音采集电路和语音输出电路。其中语音识别算法运算的处理器主要负责算法的运算处理,相当于机器人的大脑;语音采集电路负责采集外部的声音信号,相当于机器人的耳朵;语音输出电路负责输出话语声音,相当于机器人的嘴巴。   本文的设计是用在移动机器人上的,因而需要语音的输入、识别处理及语音输出的功能。对于语音的输入采集,本文使用声音传感器麦克风及外围电路来实现。对于语音输出部分,使用功率放大器结合喇叭来使用。设计语音部分原理图如图3所示。
[电源管理]
实时<font color='red'>语音识别</font>系统在家庭监护机器人电路设计
智能音箱大火,分享全栈语音识别工程师修炼手册
近日,百度发布了渡鸦 智能音箱 和DuerOS开发板SoundPi,至此,国内再一名巨头加入智能音箱大战。迄今为止,国内战场上的巨头有阿里、京东、腾讯、百度、小米、科大讯飞等,国外则有苹果、微软、亚马逊、谷歌、脸书、三星等,这些巨头占据了全球市值的排名榜,同时发力争夺未来人工智能时代的语音入口,甚至亚马逊和阿里率先不惜代价开启了补贴大战。这些全球巨头的激烈竞争,将对未来十年产生极其重要的影响,同时,这更是新一波的职业快速发展机会。   语音智能当前的核心关键是声学问题和语义理解,随着市场需求的爆发,能够补齐其中一项技术短板的全栈 语音识别 工程师将会变成职场香饽饽,而且这类人才的培养成本非常高昂,至少会在未来十年内成为各大巨头和创
[嵌入式]
MEMS麦克风用于高保真音频回放、VoIP和语音识别
MEMS麦克风用于高保真音频回放、VoIP和语音识别 许多便携式电子设备正处于音频变革的前锋。虽然近年来设计师一直致力于开发一些令人激动的新功能,如无线互联网访问和移动电视接收,但音频功能的发展始终落在后头。Analog Devices, Inc.最新推出两款 MEMS 麦克风,用于向便携式电子产品提供先进的音频功能。这些功能包括高保真音频/视频回放、免提通信、内置风噪抑制功能的语音识别以及符合 TIA-920 标准的 VoIP。    新推出的 ADMP 404 和 ADMP405 iMEMS(R) 麦克风整合了 ADI 的音频信号处理专业技术和获得专利及专利待批的创新型 iMEMS 运动传感技术。这种 MEMS
[模拟电子]
MCU也玩八核!xCORE多核控制器强势来袭
就全球看来,当前在嵌入式系统应用领域,真正值得称道的嵌入式后起之秀并不多,但作为嵌入式新秀的XMOS公司近期以凌厉的市场攻势,吸引了众多科技专业媒体的关注。可以说,嵌入式市场又加入了一员具备竞争力的悍将。在2013年11月5日的新品发布暨媒体见面会上,XMOS率先发布具有里程碑意义的基于采用eXtended架构的xCORE器件产品中的xCORE-XA系列芯片,凭借其强大的可编程SoC性能,将大幅增强在低成本、低功耗和可编程的市场存在及其竞争力,强力威胁着微处理器(MCU)厂商和FPGA大厂在嵌入式市场的布局。 XMOS公司全球市场总监Andy Gothard在演示xCORE-XA的DEMO。他表示,MCU多核化、低功耗和可
[单片机]
AVR单片机语音识别电路模块设计
  基于AVR单片机的语音识别系统设计,系统以 AVR 单片机为控制核心,实现对人的语音的识别控制。系统采用的主控芯片为Atreel公司的ATMEGAl28,语音识别功能采用 ICR  oute公司的单芯片LD3320。LD3320内部集成语音识别算法,无需外部 FLASH , RAM 资源,可以很好地完成非特定人的语音识别任务。同时该芯片内部集成了MP3播放功能,支持MPEG等格式,可实现语音提示或 MP3 歌曲的播放功能。由于内部含有16位A/D、D/A转换器和功放电路,所以不需要外接功放电路就可以产生清晰的声音。该系统已经预留好各种接口,具有良好的扩展性。    控制器电路   控制器选用Atmel公司生产的ATMEGA1
[电源管理]
AVR单片机<font color='red'>语音识别</font>电路模块设计
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
最新安防电子文章
换一换 更多 相关热搜器件

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved