AI助手赋予人类外貌,如何靠语音助手打开情感表达?

发布者:飘然出尘最新更新时间:2020-09-14 来源: eefocus关键字:AI语音助手  腾讯  智能音箱  NLP技术  数字助力 手机看文章 扫描二维码
随时随地手机看文章

日本声优(配音演员)花泽香菜官宣结婚的那一天,不少宅男都直呼“爷青结”(爷的青春结束了)。互联网上被奉为“大众情人”的男神 / 女神,哪个不是声形并茂的存在?

 

“颜控”如人类的情感就是如此不讲道理。所以尽管科技厂商们都努力将 AI 助手的声音“打扮”得亲切可人,但距离真正进入用户心扉还远远不够。尤其是对于智能家居、养老照护等重要语音落地场景来说,情感色彩的缺位就更加显现出不足了。

 

而近期,许多能说会道的 AI 人物,也逐步进入我们的视野。比如《时代周刊》刊发了一张马丁·路德·金的“肖像照片”,“他”还会在沉浸式展览《游行》中,重现马丁·路德·金的经典演讲《我有一个梦想》。

 

在许多岗位上,AI 语音助手也开始被赋予真人一样的外貌,能够通过眼神、表情、动作进行自然流畅的表达。比如疫情期间许多办公楼里,都引入了数字人来执行测温任务,让这一行为更具温情,不再是机器语音例行公事一般冷冰冰的提醒。

 

 

腾讯全球数字生态大会上,一位来自《镜双城》动画番剧里的女主角那笙,就跟现场观众打起了招呼——“原本我只能出现在动漫世界里,现在的我能够读懂你、听懂你,还有自己的小个性、小脾气哦~”

 

一副娇俏少女的模样,让这样的“女神”成为自己的导游、助理、客服、老师等等,听起来就十分令人神往,是腾讯云小微和 AI lab 共同打造的数字虚拟人,也成为腾讯云小微“数字助手”解决方案的“颜值担当”。

 

 

当然,让人类与数字助理自然相处,其中既受限于理性的技术发展周期因素,也会受到人类虚无缥缈的情感左右。那么作为一种另辟蹊径的实现方式,腾讯云小微所打造的形象化 AI 助手,其想象空间到底来自哪里?又将把 AI 语音技术引向怎样的下一站?

 

“颜控”企业的出现,折射出哪些现实需求

智能语音助手早已在许多商业场景中落地,比如拨打客服电话时的语音服务,亦或是会为儿童朗读绘本的智能音箱。那为什么大家突然又开始“看脸”了呢?

 

其实,从智能语音助手中广泛存在的手机 / 音箱等产品的交互尴尬,就可以解开这个问题。

 

首先是打开频率。许多主打智能语音功能的硬件(比如音箱),只有在刚拿到手的新鲜劲里,或者是网络上又出现了“调戏”语音助手的段子,才会想起来跟它们对话。背后的关键原因是语音助理所能承载的工具性需求,大部分都已经被智能手机等设备完成的很好了,只能作为“备胎”被偶尔提起。

 

 

二是情感联系。语音交互是即忘形式的,这就决定了它无法承载更具私密性、情感性的交互活动。我们会让语音助手帮我们打开电视、启动扫地机器人,但跟它进行充满情绪色彩、大段大段地闲聊?估计大部分用户都会产生抵触心理。就算自己不介意,被其他人撞到抱着一个音箱喃喃自语也很难不引起误会不是……

 

三是技术瓶颈。伴随着 NLP 技术的进步,语音助手已经能很不错地完成声纹识别、多轮对话、语义理解等复杂任务了,但距离自然交流显然还有一定的差距。动不动就“我听不懂”“难倒我了”,娱乐消费产品会被弃之高阁,万一企业不小心聘用了这种“智障型”AI 助理为消费者提供服务,难以达到普通用户期盼的准确无误、近似真人的交互效果,带来的就可能是订单的损失和品牌口碑的下跌。

 

针对这些 AI 语音助手在产业端、市场端的落地尴尬,存不存在可能的解决之道呢?从“工具人”转变为“数字人”,让用户从“声控”转变为“颜控”,就是腾讯数字生态大会上给出的一个十分吸睛的解题思路。

 

让用户跟 AI 多聊两句,数字助理需要具备哪些超能力?

“如果那笙哪里做的不对,主人不要嫌弃我我有在努力呢”——试问听到这种对话,你还会吐槽语音助手偶尔出现的小失误,甚至还有点想反思自己是不是过于吹毛求疵了呢?

 

沿着这个思路,我们可以看到形象化之后,腾讯云小微在数字助手领域都打造出了哪些超能力:

 

1. 语音+视觉交互,借助腾讯系海量 IP 打造出各种形象、生动、贴近现实需求的形象,提升交互频率,从而真正有效地减轻人类工作负担。比如疫情期间,就有老师表示希望有分身到每个学生身边指导他们,而数字助理的拟人化交互恰好可以完成这一任务;

 

2. 丰富的知识体系,利用知识图谱与深度学习技术,数字助手可以快速调用海量信息,完成问答、资讯等服务,再通过拟人化的形象输出给用户,人们会在服务过程中对技术产生一定的包容和理解。为故宫打造的清朝内阁大学士“福大人”,就担任起了知识渊博的游览助手;

 

 

3. 个性化情感关系:智能语音助手等新鲜事物的核心受众群以年轻人为主,而随着国漫崛起,年轻人对标新立异的虚拟形象更感兴趣。而对于渴求增长与变化的企业来说,与其按部就班地在声音世界里打转, 尤其是在线上化业务增多,用户的交互频率和方式增长的情况下,年轻市场也需要新的服务形态来被重新激活;

 

此外,伴随着产业数字化程度的推进,企业想要在数据洪潮中传达出具象的品牌形象,新的视觉载体是不可或缺的。消费者的行为和决策链路也在数字世界中变得更加隐蔽、复杂,如何保持黏性,建立用户与品牌的情感连接也成为应有之义……

 

上述种种,或许都可以通过一个人格化、陪伴式的“数字助理”,来触发全新的可能性。

 

AI 语音的下一站,开启人机交互的“宁静时代”

技术领域有个名词叫“宁静技术”,简单来说就是通过对用户的情景感知能力,最小化用户的注意力,让人机交互变得隐匿和不可见(invisible)。

 

就像进入电梯间之后按下楼层键一样,已经成为现代人潜移默化的惯性动作,谁还记得曾经按电梯也是一种职业,甚至需要考证呢。

 

而人机之间的语音交互,也正在从“好像有点尴尬”进入到自然而然地唤起阶段。接下来,就是要让这种已经在一些场景(比如客厅)成为习惯的事,隐匿到更大的社会空间之中,让 AI 助手能够在更广阔的商业世界里与人们自然顺畅地进行交流。

 

这既是技术发展的必然趋势,也离不开科技企业们的不断努力。以腾讯云小微 AI 语音助手为例,就已经在出行、文旅、教育等等领域开始落地。

 

 

之所以能达成这一成就,首先来自于腾讯在语音技术上核心技术链的深耕。

 

通过 ASR、NLP、TTS 等技术,对声音进行降噪、文本转化、语义理解,这一才能让 AI 助手能够在复杂环境中依然能够识别不同的方言或者口音。

 

想要达成和真人一样的交流,机器还需要听得懂,才能避免“所答非所问”的情况,来真正帮助用户解决问题,成为一个业务能力强大的“数字员工”。因此腾讯除了在语义技术方面发力之外,还十分重视知识图谱的建构。等于为 AI 搭建了一个先验的知识库,让它能够及时调动庞大的知识储备,更好地理解用户言语的意图,来显示出“智商很高”的样子。

 

除此之外,数字员工的“情商”也很重要。利用利用个性化、沉浸式的 TTS 语音合成技术,再结合虚拟人技术,将对话内容以多模态、多层次的形式表达出来,就能很好地通过表情、动作传达出语言的情绪,让用户更加可感、可知。

 

 

而这一整个技术体系要真正落地,一方面需要打通数据闭环,从而训练出更可靠、精准的对话模型。因此腾讯云小微团队也建构了一套系统工程。从没有数据怎么办开始,系统地钻研数据如何打通,推动数据共享,到缺失数据的采集,系统化地为客户规划了基于数据智能化目标的数据采集和信息化建设方案。

 

另外,数字助理的最终目标不是“卖萌”,而是帮助企业提质增效,推动数字生产力变革,达成体验 / 服务到业绩 / 留存的真实转化。因此要具备统筹全局、贯穿业务周期的能力。所以也需要对企业的全业务场景进行覆盖,来保证无论是简单的问题咨询,还是复杂的业务流程办理,抑或只是想跟数字员工闲聊谈心,背后的语音技术解决方案都能够通过正确响应来满足用户所需、企业所想。在这一点上,腾讯云小微也通过流式语义+语义 VAD 技术,让 AI 在极低时延的情况下也能边听边思考。

 

也正是“数据+业务”的双重闭环,形成了数字助理进入产业规模化的能力谱系,得以为企业智能化转型全程护航。

 

AI 语音助手+X=无限可能

毫无疑问,数字化、智能化潮流的全面喷发,未来会有更多的数字助理、AI 助手被纳入到人类的工作环境当中。对于广大普通人来说,数字助理的能力蝶变真的有现实意义吗?

 

答案是肯定的。可以预期的是,至少有几种社会生活会被革新:

 

一是文旅导游。一场疫情让旅游行业元气大伤,而防疫的“持久战”也决定了限人限流会成为一段时期依赖的常态,如何在这样的情况下依然保持甚至超越原有的服务质量,将基础讲解工作交给数字员工,就是一个不错的选择。未来走进景区,打开手机,也许就是一个数字导游引领我们游览,实时讲解,互动答疑;

 

 

二是家居场景。你的家里有多少智能音箱在等着落灰?年迈的父母呼唤语音助手的名字时是否还是会感到一丝尴尬?而一旦语音助手有了数字形象,被赋予拟人化色彩之后,一切可能都会变得不同。从原本的一问一答,到有情感、更自然的交流,大概率会有不少人开始发帖“我觉得家里的 AI 助理才是我爸妈亲生的”。

 

三是教育产业。一进九月临近教师节,家长群们总少不了“送礼物担心老师不收,不送礼物担心孩子得不到关照”的年度讨论,而现实中,确实存在老师无法针对学生进行一对一特定辅导、难以记住所有学生的学情状况、教学压力大等情况。能化身虚拟老师的“数字助手”,无疑就是妥妥的多赢,老师们得以从机械工作中解放出来,学生们也能得到实时、个性化的辅导,而家长们也不用发愁怎样才能在 AI 眼里刷存在感了。

 

四是智能营销。对于企业来说,数字助手不仅仅是一位德智体美劳全面发展的优秀员工,还可以是辅助商业营销决策的“超级智囊”。举个例子,一些汽车小白用户,通过互联网的消费行为偏好分析,进而设计出一些“傻瓜式”产品功能,比如一键询问维修、一键呼叫客户、智能导航、辅助驾驶等等,而这些用户洞察,基于腾讯云小微所处的数字生态都可以转化为车机企业争取潜在用户好感度的关键武器。

 

 

一个能听会说、知识全面,又善于表达、喜怒形于色的数字员工,拥有的可能性还有很多。不难发现,不仅企业需要重新认知数字助理所带来的价值红利,想要扩大数字助理的商业价值与应用边界,还需要一套体系化的平台性技术解决方案,来降低各行各业引入数字员工的门槛及成本。

 

从这一点来看,数字生态大会上所展示的人机交互技术前景与商业宏图,不是一种偶然,而是腾讯云小微从长期实战与技术研发中生长出来的确定性。

 

腾讯云小微扳动了一下技术齿轮,人与机器如同精密仪器适配一样,在某个瞬间发出“咔”的一声,于是我们知道,一个全新的产业世界大门,开启了……

关键字:AI语音助手  腾讯  智能音箱  NLP技术  数字助力 引用地址:AI助手赋予人类外貌,如何靠语音助手打开情感表达?

上一篇:东莞缘何成为各大巨头们的投资热门?
下一篇:半导体设备行业蒙上一层阴影,国产光刻机渡劫难

推荐阅读最新更新时间:2024-11-21 20:24

腾讯首个软硬件全自研的多模态四足机器人Max正式发布!
美国波士顿动力公司的网红狗子Spot时不时上热门,一只卖53万,甚至跑到切尔诺贝利核电站上班。 其实,国内的机器狗也非常聪明了。去年11月,腾讯发布了机器狗Jamoca,是国内首个能完成走梅花桩复杂挑战的四足机器人。 而今天,腾讯正式发布机器狗Max,它是腾讯首个软硬件全自研的多模态四足机器人。 当前机器狗主要有两大主流方向: 足式:在复杂环境里,以足式为主,像足类动物一样可以跑、跳、翻越障碍,需要适应复杂的地形和环境。 轮式:在城市里,接触的主要是平坦道路,这个时候可以滑行的轮式机器人就更有优势。 机器狗Max就厉害了,它是二者的结合,采用了腾讯Robotics X实验室原创自研的足轮融合方案,也就是有腿又有轮。在不同的环境
[机器人]
天猫精灵、小米小爱越来越聪明,你愿意为智能音箱买单吗
能聊天,会唱歌,能讲笑话,会说评书,能语音控制家电,还能听懂杭州话……要说2017年最火的消费类智能硬件产品,智能音箱算一个。统计数据显示,从2017年12月至2018年2月,智能音响的普及率增幅达50%。2017年,包括阿里 天猫精灵 、小米小爱同学、猎豹移动小豹、百度RavenH在内的众多 AI音箱 产品相继问世,智能音箱已经不是什么稀罕物。     但是,低价位“千元机”、简单语音交互、功能极度相似的AI音箱在市面上越来越普遍,“你有我也有”似乎成了各品牌推出新产品的唯一门槛。从实际销售情况来看,低端化、同质化的智能音箱已经越来越跟不上消费者对音质和语音互动体验的需求升级,开发新功能、开辟新品类成了各个“兵家”需要突破的
[嵌入式]
图普科技CEO李明强:用AI建立螺旋式渐进的商业闭环
2018 全球人工智能与机器人峰会(CCF-G AI R)在深圳召开。图普科技CEO李明强应邀出席,并参加计算机视觉专场圆桌论坛。   本次峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会。本次峰会共吸引超过2500余位AI业界人士参会,其中包含来自全球的140位在人工智能领域享有盛誉的顶级嘉宾。在这其中,包括图灵奖获得者、中美科学院院士、中美工程院院士,以及 CMU 、MIT、斯坦福等多个名校的顶级教授;同时也有来自工业界的 AI 高管,涵盖微软、英特尔、 阿里巴巴 、 腾讯 、百度等多家企业。   图/中国科学院院士、清华大学教授张钹
[嵌入式]
面对智能音箱这片红海,华为终于坐不住了
面对 智能音箱 这片红海, 华为 终于坐不住了。   过去两年,BATJ、小米以及N多个中小型创业企业相继进入智能音箱大战。华为在经过内部多次讨论,不断否定又不断重启,终于也将在今年年内(预计10月份)推出智能音箱。一位华为研究院员工向蓝鲸TMT记者侧面证实了这一点。   入局智能音箱较晚的巨头,除了华为就是三星了。前不久,2018年8月10日,在三星Note 9发布会上,三星推出了一款智能音箱Galaxy Home。Galaxy Home内置六个扬声器一个低音炮,八个检测语音输入的远场麦克风,具备播放音乐、远场识别声音、控制智能家电设备等功能。   不过由于Galaxy Home外形颜色“特别黑”,底部安装了三角支架,横过来特别
[嵌入式]
新型六位半数字电压测量模块助力突破工业精密测量边界
俗话说“差之毫厘,谬以千里”,在当下精密工业领域,仪表测量的精确性直接影响生产过程中的自动化控制水平及设备工作的安全可靠性。电压,作为电力系统中的基本参数之一,如何借助小尺寸且易于系统集成的高可靠性单元实现精确测量,成为众多领域客户提出的创新性需求。作为全球领先的半导体技术提供商, ADI开创性推出了新型六位半数字电压测量模块,大大降低了实现精确电压测量的门槛。 多种场景下的高精度电压信号采集挑战如何破? 事实上,无论是在电子系统设计中进行电压采样和功耗测试,还是在半导体自动化测试过程中控制和监测输入电压以保障测试的精确度,或是在实验室环境中利用数字电压测量单元确保实验结果的精确性和可重复性,高精度电压信号的采集在多领域
[测试测量]
新型六位半<font color='red'>数字</font>电压测量模块<font color='red'>助力</font>突破工业精密测量边界
华为平台全面下架了腾讯游戏
1月1日上午消息,华为游戏中心社区发布公告,因腾讯游戏单方面就双方合作做出重大变更,导致双方的继续合作产生重大障碍,华为将腾讯游戏从华为平台下架。 以下为华为游戏中心社区公共全文: 致华为游戏中心腾讯游戏用户: 首先,华为游戏中心衷心祝3年来陪伴我们共同成长的各位用户新年快乐!感谢3年以来大家的支持、包容与陪伴。感谢3年来每一份真诚,每一份欢喜,每一份热情与每一份信赖。 3年来,我们积极携手腾讯游戏,秉持着为各位用户提供极致手游娱乐体验的理念砥砺前行。但腾讯游戏于2020年12月31日17点57分单方面就双方合作做出重大变更,导致双方的继续合作产生重大障碍。经过我司法务的谨慎评估,我们不得不依照腾讯单方面要求暂停相关合作,将腾讯游
[手机便携]
华为平台全面下架了<font color='red'>腾讯</font>游戏
吴军捕风捉影式的“口嗨”将三家科技巨头推至舆论的风口
吴军的“素质三连”将他推上了“舆论浪潮之巅”。 《浪潮之巅》的作者、原腾讯副总裁的吴军,在媒体面前谈到老东家时也全然不留情面,即使面对谷歌,曾经任职谷歌资深研究员的吴军也毫不客气:“谷歌管理很混乱,公司发展不行跟CEO(桑达尔˙皮查伊)平庸有很大关系。” 无论是对谷歌平庸的质疑,还是对腾讯不具备To B基因的diss,亦或是对百度没有未来的论断,事实上这样的类似言论只是捕风捉影式的“口嗨”,但这一次,有着诸多互联网身份标签的吴军在媒体面前的“素质三连”,使得三家科技巨头再次被推至舆论的风口。 腾讯没有To B基因?只是太阳黑子的光芒被掩盖 自2018年国庆前夕,腾讯对外宣布人事重大调整转型To B业务以来,“腾讯没有T
[嵌入式]
广告业务仅占12% 微信撕下腾讯“遮羞布”
     “它无孔不入,你无处可藏,不是它可恶,而是它不懂你,我们试图,做些改变。”这是微信发布的首则广告“预告”,充满文艺气息。   旋即,一份网上流传的数据迅速火了起来:朋友圈广告投放价格500万元起步,并预测腾讯因此可能获得100亿元以上收益;与此同时,关于首单广告投放品牌商的传言也甚嚣尘上,包括宝马、VIVO等品牌均在传闻之列。   从游戏、电商、支付到流量入口开发,微信商业化一路走来始终是欲语还休,而此次决定对广告商开放朋友圈,某种程度上等于宣布:我要开始“大大方方”赚钱了。而究竟是什么力量,让微信撕下了那块“遮羞布”?   广告浅试水   1月21日,微信官方宣布,第一条朋友圈广告亮相。不
[手机便携]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved