看完这篇文章 你就知道Siri和小冰的差距在哪了

发布者:梦回归处最新更新时间:2018-08-01 来源: 中关村在线关键字:Siri  人工智能  小冰  差距  语音 手机看文章 扫描二维码
随时随地手机看文章

   

微软在上周正式发布了第六代微软小冰人工智能机器人,人们不免将其与苹果的Siri再进行一番比较,而比较的结果几乎是一边倒的,那就是在小冰的面前,Siri实在是有点逊。

  在之前我们面对这样的结论,给出的理由更过是感官上的直接感受,而这一次我们试图通过一些技术层面的解析来搞清楚Siri和小冰之间到底存在哪些差距。

  这里我们主要引入两个概念:全双工语音和共感模型。在此之前我们想稍微聊聊Siri和小冰两者在设计意图上的不同,而这很有可能是导致二者差异的重要原因。

  Siri的设计目标是一个任务型人工智能,她的作用是帮助用户解决具体的问题的;而小冰则从开始就是一个聊天机器人,并不解决具体问题,就是陪人闲聊用的。

  因此,Siri在设计上是以IQ为优先的,而小冰则是以EQ为优先,从这一点上来看,与Siri和小冰的对话交互过程就有明显的区别。Siri更像是机器,而小冰则更像是人,但现在第六代小冰推出之后,也开始附加IQ特性,能够处理一些具体的事务了。

  就人工智能的发展来说,IQ,也就是数据处理方面的研发是相对简单的,而EQ,即情感认知则是相当大的难题,因此微软先EQ后IQ的模式显然更有优势。

  既然我们已经说到了人工智能的EQ塑造,那么小冰到底是通过哪些技术来实现这种情感交互的呢?

  大概在过去四五年前的时候,对话式人工智能成为业界的热门课题,并且绝大多数都选择了任务型或是知识传递型的对话系统,但这种人机交互实际却非常生硬,比如具体到开灯关灯、打开电器上,其实和语音命令之间的区别并不大。

  而全双工语音就是让小冰与其他人工智能交互截然不同的技术之一,这使得人们与小冰之间的交流不再局限于一问一答,而是更加自然的沟通过程。

  举一个例子,当你开着车出去郊游的时候,车载的不是Siri那种可以帮你干这个干那个的人工智能,而是通过全双工的方式进行交流的小冰。她除了会根据你的指令执行任务之外,还会对你的车载音乐发表观点。当你们交流时,她看到远处有一座山,就会和你说这个地方很漂亮,可以下次再来。

  这种感觉不是你在车上安装了一个机器人,而是多了一个真正的副驾驶陪你旅行。

  这就涉及到了一个问题,那就是小冰能够通过视觉捕捉环境信息,这是同样也是微软的研究项目,称为实时视觉,并有一个面向全程的对话引擎。

  值得一提的是,现在小冰的全双工语音已经支持群组功能,利用SpeakerID分类器来判断说话的人到底是谁,甚至听得出这些人的年龄、性别等信息,并以此来进行不同的对话和群聊。

  比如不同的家庭成员和小冰说“我的电话找不到了”,小冰能够区分的出来是谁,并且分别打到他们各自的手机上去。

  比如当一个小孩子对小冰说“打开电饭锅”,小冰能够识别出发出命令的是个小孩子,并由此拒绝执行指令,并劝说小孩远离电器。

  在这里,小冰不再单单是家里的一个智能语音工具,而是一个新的家庭成员,能够与家庭成员之间建立自然的联系。

微软小冰

  虽然我们一直都在强调小冰的EQ情商,但大家都清楚人工智能本身是不可能产生感情的,因此小冰的EQ本质上是来自一个基本的情感计算框架。

  从理性的角度来说,一个对话式人工智能的情商,其实是可以控制一个对话全程的能力,能够去控制对话全程的走势,保持一个对话的长度。

  现在这个框架已经从去年的生成模型升级到了共感模型。生成模型就是让小冰可以自创她的回应,而不是像以前一样,从一个已有的语料库中间检索。当她能够自创回应的时候,她就可以有更好的能力去控制对话,有更好的上下文结合能力。

  而共感模型则更进一步,当小冰一方面进行回应的生成时,也同时在运用她的策略来判断是不是应该引导这个对话,然后去主动的进行观察,然后偷偷地进行求证,最后再去确证。比如不停地通过各种方式去反复的尝试人类最关注的兴趣到底是在哪个领域,而一旦确认了对方的兴趣点,在抓住了一个机会之后就可以引导对方在这个领域进行更加深入的交流。

  这个过程中也是保持全双工语音的,而不是你一轮我一轮的“对讲机式交互”,更重要的是这个过程中小冰对于对话是经过情感思考的。

  看到这里大家可能就能够看出,Siri之所以在体验方面与小冰相差甚远,本质上是指令性工具与情感交互系统之间的差距,而我们认为后者无疑才是未来人机交互的发展方向。

  现在的智能家居系统在命令集成方面已经做得不错了,但交互体验仍然不够自然,如果小冰能够更快地渗入这套系统,智能家居产品的体验无疑将变得更加动人。


关键字:Siri  人工智能  小冰  差距  语音 引用地址:看完这篇文章 你就知道Siri和小冰的差距在哪了

上一篇:iPhone 双卡双待!iOS 12 新固件把苹果秘密全曝了
下一篇:爆料大神暗示Android P正式版将于8月20日发布

推荐阅读最新更新时间:2024-05-03 18:40

图灵奖得主华人门徒AI芯片创业项目OURS进国内市场
    3月28日消息,AI芯片公司OURS近日宣布进军国内市场,且已经与国内一家电子制造企业进行业务合作。同时,OURS也将在中国选择办公地点,目前正在选址。   OURS简写自Optical Universal RISC Systems,是一家2017年2月创建于美国硅谷圣克拉拉的“硅光”公司,主打的核心技术产品为低功耗端计算 (Edge Computing) AI芯片,目的是让机器能够智能地以3D的方式感知世界。   OURS公司2017年5月获得A轮融资,2017年6月获得A-1轮融资,投资方包括北极光创投、Oriza Ventures(元禾谷风创投)以及创新工场。   目前,OURS公司团队有十余人,超过80
[半导体设计/制造]
AI遇上招聘,猎头可能要失业了
人工智能( AI )发展可以提升许多产业的效率,增加生产力,降低人性缺陷造成的影响,现在人工智能还可以简化冗长的面试流程,优化人才 招聘 的结果,让企业与 求职 者找到更适合的职位。   麻省理工科技评论(MIT Technology Review)报导,求职是一条辛苦的道路,对企业人力资源部门来说也是一项沉重的负担,尤其是现在网络媒体渠道众多,人力资源部门除了看求职者简历之外,有时还要参考求职者的社交网站,如 Facebook、YouTube、LinkedIn 等,加上一关关的面试、考试,再做综合评估,由于同一个工作可能有非常多人应征,因此查看资料是一个重复性的工作,这时人工智能就可以派上用场。     求职网站 Enter
[嵌入式]
鼎晖投资联手商汤科技 融资30亿设立AI基金
网易科技讯 10月31日消息,据路透社报道,据两位知情人士透露,中国内地的鼎晖投资(CDH Investments)正联手香港的初创企业商汤科技(SenseTime Group),计划融资30亿元人民币,用以投资那些致力于研发AI技术的科技公司。 根据知情人士的说法,鼎晖投资和商汤科技共同设立的这个基金主要用于在全球范围内,投资那些正处于成长期的AI初创企业。现如今,AI正加速成长成为众多领域的关键技术,而中国也决心要成为AI技术研发方面的领军者。 AI技术曾经只是少数科研人员的“心爱之物”,但如今无论是医疗保健还是金融服务,AI技术已经成功吸引了所有行业的眼球,各行各业都希望能用算法来梳理海量的数据,识别出变化中的模式,并进而解
[嵌入式]
科大讯飞:人工智能龙头,2C业务异军突起
科大讯飞 002230 智能语音龙头,攀登人工智能新高地。讯飞是我国众多软件企业中极少数掌握关键核心技术的企业,是我国智能语音与人工智能产业领导者。公司智能语音核心技术代表全球最高水平,在国内语音市场中占有70%以上的份额,名列第一。2018年,公司在人工智能关键核心技术领域摘取了十二项国际第一,核心技术始终保持国际领先,进一步为公司各产品的市场竞争树立了较高的技术壁垒和领先优势。在关键赛道上,随着实际应用场景的数据驱动+专家知识经验的不断积累,公司“领先一步到领先一路”的格局持续加强,业务增长势头强劲。 “平台赋能+赛道下沉”打造多层次人工智能产业生态。在“平台”方面,讯飞开放平台开发者数量由2014年的3.7万,大幅增长至20
[机器人]
智能化渗透率提升 J.D.Power:实时导航与智能语音成“刚需”
8月3日,权威机构J.D.Power发布了最新一期《2023中国汽车智能化体验研究SM》(以下简称TXI):2023年智能化水平相较上年提升了23分。其中新能源汽车与燃油车相比,新能源汽车的智能化领先优势进一步扩大,两者差距相比2022年的27分扩大至37分。 随TXI研究报告的发布,J.D.Power同期也公布了各细分市场、品牌智能化的榜单,其中,中国品牌的智能化优势明显,而造车新势力的智能化水平在中国品牌中位居前列,相反合资品牌的智能化水平却显得有些滞后。 消费者更重视智能化体验 虽然小编觉得汽车智能化科技发展至今,几乎很难再找到令人眼前一亮的全新体验,但是消费者们对此的看法却并
[汽车电子]
智能化渗透率提升 J.D.Power:实时导航与智能<font color='red'>语音</font>成“刚需”
斯坦福联手丰田利用AI开发新型动力电池
当前,电池企业和科学家正在积极研发新型电池或寻找优化电池制造的新工艺。 外媒报道称,斯坦福大学与丰田研究人员合作开发了一种新机器学习方法,可以加速电动汽车电池的开发。 具体而言,麻省理工学院斯坦福分校和丰田研究院的研究团队开发了一种基于机器学习的方法,将电池充电测试时间从近两年缩短至16天,缩短了近15倍,有助于加速新型电池的开发进度。 在电池开发过程的每个阶段,必须对新技术进行数月甚至数年的测试,以确定它们将持续多长时间。 而设计超快速充电电池是一个重大挑战,主要是因为很难使它们持续使用。更快的充电强度会使电池承受更大的压力,这通常会导致电池过早失效。 为此,麻省理工学院和丰田研究所希望找到在10分钟内为EV电
[汽车电子]
斯坦福联手丰田利用<font color='red'>AI</font>开发新型动力电池
功能趋向多样化的语音编译码芯片
由于可携式产品愈来愈多,因此对于音效播出的功能要求也就愈被要求能够达到高音质输出的能力,事实上,目前在市场上有相当多的音效语音解决方案,然而经过更新技术的加持,使得这些音效语音编译码的输出能力,已经不亚于CD的质量,甚至于如果内建高阶处理器的话,还能够提供包括数字模拟转换、除错、以及系统控制等功能。 不过从基本的架构上来看,对于数字音讯数据处理而言,现在所内建的各种功能都并不是绝对备需要的,因为这些作业都可以利用一个或多个数字接口,藉由外部强大的处理器来进行,但是因为成本与轻薄应用的考虑之下,有些业者采取的策略便是把处理器内建于音效语音编译码芯片之中,至于孰优孰劣就是视个人见解来决定了。 依据不同的应用 选择各式各样的编解碼技术
[嵌入式]
DTMF电话语音接收器BU8874/BU8874F及其应用
    摘要: BU8874/UB8874F是ROHM公司生产的DTMF电话语音应答器。它的最大特点是其动态范围很宽,并可将16种不同的DTMF信号转换成4位二进制串行数据。文中介绍了BU8874/BU8874F的主要特点、仙部结构、功能参数和设计方法。最后给出了它的典型应用电路。     关键词: 电话 应答器 DTMF BU8874/BU8874F 1 概述 DTMF电话语音接收器集成电路BU8874/BU8874F是ROMHM公司生产的一类电话语音应答器。它们可以将16种不同的DTMF信号转换成4位二进制串行数据。其中BU8874采用8脚DIP封装形式,而BU8874F则采用18脚封装,两种芯片内部
[应用]
小广播
最新手机便携文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved