只闻其声也能“看透”你,来自“声音画像师”的秘密

2019-04-22来源: 机器之心关键字:AI  NUANCE

你感到抑郁吗?会在开车时打瞌睡吗?有被骗保经历吗?有心脏病隐患吗?AI 或许能够过倾听你的声音来解决这些问题。

人类的声音中蕴藏着比我们想象中还要丰富的信息,你的年龄、身高、体重、精神、情绪、甚至情感、气质、进取心、创造力……与此同时,声音似乎比图像更加安全可控。

基于 AI 算法与声音分析学的融合,「声音画像师」正在帮助医院可以提早发现神疾病及身体疾病,让呼叫中心进行个性化营销,为公司筛选出更为合适的求职者……

日益强大的机器学习方法,使一切变得皆有可能。

AI 系统可以测量音调、节奏及其他语音特征,并将其与存储的语音模式,包括快乐、悲伤、疯狂及其他情绪进行比较。

虽然声音分析学已经发展了几十年,但成本更低廉的计算力与新一代的 AI 工具,如谷歌的 TensorFlow,才使那些雄心勃勃的项目成为可能。

在情感 AI 或情感计算领域,该技术与计算机视觉结合后,功能将变得愈加强大。例如,车载语音系统可判断驾驶员是否哈欠不断,视觉系统则能判断驾驶员是否在打瞌睡。

咨询公司 Gartner 认为,情感 AI 甚至可能进入消费品市场,Gartner 预测,到 2022 年,10% 的个人设备(目前这一比例少于 1%)将具备情感 AI 功能,如监测个人精神状态的可穿戴设备,和基于玩家情绪自动调整的视频游戏。

但在情感 AI 成为主流之前,必须先克服一个巨大的阻碍:人们的不适应情绪。Gartner 在去年发布的一份调查报告指出,来自美国和英国的 4000 多名受访者中,有 52% 的人表示不希望 AI 分析自己的面部表情,63% 的人表示不希望 AI 为了解她/他们而经常「入侵」其工作与生活。

此外,消费者还特别关心自身隐私,约有 65% 的人坚信,AI 会侵犯其隐私。

Gartner 分析师 Annette Zimmermann 撰写了关于情感 AI 的报告,她表示:「人们普遍不相信 AI。至于大家对 AI 的感受,我认为这是仁者见仁、智者见智的问题,但的确有许多理由令人生疑。」

Zimmermann 表示,系统都不完美,最佳系统的精确率也不超过 85%。

CMU(Carnegie Mellon University,美国卡耐基梅隆大学)语音学家 Rita Singh 说,「这不完全正确。而且我们也不知道系统何时才能变得精确。但是,快了。」

带着上述防止误解的说明,我们来了解下 AI 语音分析技术已经影响以及即将颠覆的领域。

01 医学领域:疾病监控师

2017 年,根据美国国家精神卫生研究所的数据,2017 年,全美有五分之一的人(约 4660 万)饱受精神疾病的困扰。据估计,接受治疗的人仅占需要接受治疗的人数的一半,而新兴的语音技术可能使该问题更容易被发现。

2018 年底,从行为分析公司 Cogito 衍生出的 CompanionMx 公司发布了一款名为 Companion 的移动心理健康监测系统。该系统由美国国防高级研究计划局、美国退伍军人事务部及美国国家精神卫生研究所资助研发。

正接受抑郁症、双相情感障碍和其他疾病治疗的患者,可通过 Companion 下载一个 APP,在智能手机上创建音频日志。系统要求患者定期描述个人感受,并将信息自动传输到 AI 模块进行分析。

运用 Cogito 研发的情感 AI 技术,CompanionMX 可以分析患者的音频及某些行为数据,以了解其情感、情绪或行为的变化。譬如,CompanionMX 通过监测智能手机活动,看患者是否减少与外界的联系。如果护理人员看到有问题的迹象,他们会主动联系患者。

美国国家精神卫生研究所资助了一项关于该 APP 的研究项目,自 2015 年 5 月至 2017 年 8 月。

「研究结果十分令人鼓舞。」项目联合首席研究员、布莱根妇女医院 (Brigham and Women's Hospital) 与哈佛医学院数字行为健康与信息学研究项目负责人 David Ahern 说。

Ahern 表示,这款 APP 可以作为护理人员的早期监测系统。因为多数需要治疗的患者直到病情严重才会寻求治疗,所以,此款 APP 是一个非常必要的工具。

根据疾病控制和预防中心 (Centers for disease Control and Prevention) 的数据,全美每年有 60 多万人死于心脏病。研究人员正尝试使用语音 AI 发现警告信号,帮助人们快速获得治疗。

梅奥诊所进行了一项为期两年的研究项目(2017 年 2 月结束),旨在验证语音分析是否能够检测出冠心病。梅奥医学中心心血管研究中心主任 Amir Lerman 解释说,每个人的声音频率不尽相同,它们可以被分析。

梅奥与语音 AI 公司 Beyond Verbal 合作,采用机器学习识别冠心病的语音生物特征判定标识,而后,在计划进行血管造影的患者人群中展开测试。

所有研究参与者都在手机 APP 上录制了自己的声音,而后,Beyond Verbal 对这些声音进行了分析。研究发现:在血管造影上有冠心病病症的患者也有该疾病的语音生物特征判定标识。

Lerman 博士表示,梅奥希望在不久的将来部署这项技术。「我认为这是一个令人惊叹的新领域,为我们如何治疗患者打开了新的大门。」他说。

02 智能驾驶:评估驾驶员精神状态

根据国家公路交通安全管理局 2017 年 10 月的统计数据,在 2015 年,有 800 多名美国人因为疲劳驾驶而丧生,超过 3 万人在司机疲劳驾驶导致的撞车事故中受伤。

现如今,许多大型汽车公司与 AI 公司正在设计一种 AI,运用语音分析与面部识别技术评估驾驶员的警觉性及情绪状态。

你能看出我生气了吗?

声谱图可用于分析说话人的声音特征。谐波(深色平行线)表示说话人音调和语调的变化。

高情绪活动

线条的剧烈运动反应了语调的快速变化。在较高频率下,线条颜色越深,其代表语音质量越高。

低情绪活动

声音更柔和、平静,谐波的强度要小的多,特别是在高频率下。

请输入图片描述

去年的消费电子展(CES)上,丰田发布了一款概念车 Concept-i,它可以识别面部表情及语音声调。该车在转向柱上安装了一个红外摄像头,在仪表盘上安装了一对 3D 传感器,还搭载了语音识别与对话系统。

系统协同工作,以评估驾驶员的状态。例如,头部下垂、弯腰驼背的姿势、困倦或低沉的声音(或者打呵欠的声音)都表示驾驶人员处于疲惫状态。如果系统注意到驾驶人的疲惫状态,会迅速做出反应。

例如,车载语音助手可以与驾驶员进行对话,提高其警觉级别。并且,随着时间点的推移,对话系统会知道哪些话题最可能吸引驾驶员的注意。

去年 9 月,两家 AI 公司──Affectiva 与 Nuance Communications 表示,他们将携手合作,把情感智能融入 Nuance 的对话型汽车助手中,理解并回应驾驶员需求。

Nuance 声称,目前在奥迪、宝马、戴姆勒、菲亚特、福特、通用、现代和丰田等 2 亿多辆汽车上都可以找到这款名为 Dragon Drive 的对话型汽车助手。

该项由 lovetiva 和 Nuance 公司研发的新技术将使用摄像头来检测面部表情(如微笑),采用麦克风识别声音情绪(如愤怒)。他们的算法采用深度学习、计算机视觉与语音技术,来识别情绪和疲惫的特征指标。

如果驾驶人员已显露疲态,语音助手可通过一些简单的话语提示驾驶员,如「你看起来很疲倦,你想停车休息一下吗?」

目前,上述技术仍处于研发阶段,但是据 Nuance CEO Joe Petro 透露,这些技术或将于几年内正式投入使用。

03 智能营销:个性化的呼叫中心

房地产咨询服务商 Site Selection Group 的数据显示,尽管许多公司将客服业务转移到了海外,但全美仍有 7400 座呼叫中心雇佣了 300 多万名员工。

包括哈门那(Humana,美国大的医疗保险公司)、美国大都会人寿保险公司(MetLife)在内的许多公司,已经部署 Cogito 的 AI 软件,以此来保持保险经纪人的敏锐度及客户满意度。

该系统分析保险经纪人与客户之间的对话,实时跟踪其交互方式。

当呼叫中心接到电话后,会将其流处理至 Cogito 的系统,该系统可评估成百上千个数据点,包括语速、音调等。如果保险经纪人在回答问题前停顿,那可能表明其分心了。如果顾客提高嗓门,这可能是一种沮丧的迹象。

当 Cogito 的系统检测到呼叫过程中可能出现问题时,它将以图标或短信息的形式推送通知到员工的屏幕上,帮助保险经纪人识别、了解客户的情绪。

Cogito CEO Joshua Feast 表示,该系统的主要目标是训练保险经纪人,让她/他们更自信、更投入,更有同情心,「学会与各式各样的客户交谈是一项真正的技能,并非与生俱来,必须后天习得。」

Cogito 表示,其呼叫中心产品的准确性因各类使用场景(如客户服务中心、销售部或理赔管理部)和在各领域中的监控行为而异。

总体上,Cogito 称,该产品的平均准确率为 82%。该公司表示,他们通过人工评审呼叫效果、客户反馈及机器学习分析来验证结果。

大都会保险全球客户解决方案负责人 Kristine Poznanski 表示,大约 15 个月前,大都会在其客户服务中心部署了 Cogito 的系统。

该系统除了为客户服务代表提供呼叫即时反馈及实时指导,还能向经理展示呼叫实时状态。呼叫中心经理可通过数据监控正在进行的呼叫,或者在呼叫结束后与保险经纪人一起复盘呼叫过程。

Poznanski 说道,自从部署该系

[1] [2]

关键字:AI  NUANCE

编辑:鲁迪 引用地址:http://news.eeworld.com.cn/szds/ic459349.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:韩国用设计AR/VR超薄显示器,投影动态、多色3D全息图像
下一篇:Facebook研发新AI模型,动态人物视频也能造假

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

MathWorks 发布2019b MATLAB 和 Simulink,助力AI,汽车发展

MathWorks宣布推出了 Release 2019b,其中包含一系列的 MATLAB 和 Simulink 新功能,包括对人工智能、深度学习和汽车行业的支持。另外,R2019b 引入了支持机器人技术的新产品、基于事件建模的新培训资源,以及对 MATLAB 和 Simulink 产品系列的更新和 Bug 修复。版本亮点包括: MATLAB  R2019b 中的 MATLAB 亮点包括引入了Live Editor(实时编辑器)任务,让用户能够交互式地浏览参数、预处理数据,并生成 MATLAB 代码,成为Live Script(实时脚本)的一部分。现在,MATLAB 用户能够专注于任务本身,而不是语法或复杂的代码,
发表于 2019-09-17

上海AI定制巴士来了,该如何乘坐?

AI正在向各行各业渗透,用AI来定制公交就是其中之一,上海AI定制巴士已经上路了。比打车便宜,准时、有座,从家里直达公司楼下,这样的公交你愿意坐吗?从9月16日起,上海市民在支付宝上就能一键预约定制巴士,价格只有打车的1/10。这也是上海首条由AI“算”出来的定制巴士线路。定制巴士是一种新型公共交通出行方式,采用“家门口到办公室”的模式,给上班族提供更好的出行服务。和传统公交不同,定制巴士采用支付宝预约售票,确保“一人一座”。行驶途中不停靠,只停靠小区门口和写字楼周边站点,与传统线路相比大大提升了运行速度。乘客戴小姐家住上海松江新城附近。过去,她需要从松江新城坐地铁9号线到张江高科站,算上地铁换乘,下车步行或单车骑行接驳,耗时接近
发表于 2019-09-17

地平线携征程二代车规级AI芯片亮相IAA,加速全球业务拓展

具有“汽车奥运会”之称的法兰克福车展(IAA)正式拉开帷幕。大会以“驶向未来”为主题,吸引了来自全球的顶尖车厂、科技公司同台竞技。具备世界领先技术的人工智能企业地平线携其高性能、低功耗、低延时的最新边缘AI芯片及解决方案亮相车展,向全世界展示了其产品实力与商业落地能力。 IAA地平线展台Hall 9, D08 在位于 Hall 9, D08 展位的地平线展台,中国首款车规级 AI 芯片 -- 征程二代重磅亮相,这也是该芯片的海外首展。同时亮相并引发关注的,还有基于征程二代芯片高性能、低功耗、低成本产品与解决方案,包括全新 Matrix 自动驾驶计算平台、自动驾驶视觉感知、NavNet 高精地图建图与定位、车内
发表于 2019-09-17
地平线携征程二代车规级AI芯片亮相IAA,加速全球业务拓展

政务服务有AI,办事能变得简单又高效

出行、智能机器人等实际场景中规模化落地。凭借自身在视觉AI领域20余年的行业积淀及实践,虹软免费开放的人脸识别技术,降低了企业应用AI技术的门槛,让人脸识别成为大家都用得起的普惠技术,真正让AI赋能行业创新。  人工智能已经站在了技术与商业的临界点。AI产业化落地全面爆发的当下,谁能抓住机遇,谁就能在AI商业变现的大时代中占有一席之地。为加速推动AI技术产业落地,虹软将安排在9月19日举办“金洽会”麒麟科创园专场活动暨虹软“New vision | AI 无限”AI落地赋能创享会,届时将邀约江苏本地产业界合作伙伴,共同探讨人工智能赋能行业现状,更有最新应用案例、行业资讯与产业链资源对接,助力参会嘉宾立足行业最前
发表于 2019-09-16
政务服务有AI,办事能变得简单又高效

高云半导体发布GoAITM--全球首例基于国产FPGA AI解决方案

全球增长最快的可编程逻辑器件供应商—广东高云半导体科技股份有限公司(以下简称“高云半导体”),今日发布基于高云国产FPGA硬件平台的人工智能(AI)边缘计算最新解决方案—GoAITM。相比当前采用标准微处理器的其他类似边缘计算方案,GoAITM加速方案可获得将近78倍的速度提升,加速优势显著。同时GoAITM的设计流程与目前AI、神经网络的开发框架完全融合,为用户开发使用带来了极大的便利。  人工智能在物联网(IoT)终端及云的边缘应用中突飞猛进,这主要得益于其无需网络连接到数据中心就能进行智能决策,且具有低功耗、小尺寸、高性价比的优势;高云 GoAITM全面支持目前通用的人工智能开发工具,通过连接到现有
发表于 2019-09-16
高云半导体发布GoAITM--全球首例基于国产FPGA AI解决方案

自然语言和三维姿态模型结合,AI研究者将文字转成肢体语音

卡内基梅隆大学(Carnegie Mellon University)的人工智能研究人员发明了一种人工智能代理,能够将文字转化成身体动作。这种方法被称为Joint Language-to-Pose,或JL2P,它将自然语言与三维姿态模型相结合。JL2P动画目前仅限于简笔画,但将文字翻译成类似人类动作的能力有朝一日可以帮助类人机器人在现实世界中执行物理任务,或帮助创意人员为视频游戏或电影等制作虚拟人物动画。JL2P能够做一些比如走路或跑步,演奏乐器(如吉他或小提琴),遵循方向指示(左或右),或控制速度(快或慢)的动作。这项研究最初发布于arXiv.org上的一篇论文,并且将于9月19日在魁北克举行的3D视觉国际会议上由CMU语言技术研
发表于 2019-09-14
自然语言和三维姿态模型结合,AI研究者将文字转成肢体语音

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 电视相关 白色家电 数字家庭 PC互联网 数码影像 维修拆解 综合资讯 其他技术 技术产品 应用设计 论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2019 EEWORLD.com.cn, Inc. All rights reserved