电话的从发明至今已经有上百年的历史了,在这上百年里,人类与电话的交互方式也悄然发生了质的改变。直到手机被发明后标志着智能时代的到来。而智能手机交互方式却变得止步不前,除了触摸还是触摸,就没有点新鲜的吗?我们每天捧着手机刷朋友圈,打农药真的以为我们是在玩手机?而不是手机玩我们?
笔者认为,智能手机应该是无时无刻可以听懂人话,才叫智能。而恰逢此时智能语音助手的出现才让我们充分感觉到了智能的存在。那么在了语音交互之前我们还是先来看看从古至今,人类在信息交互上是如何发展的吧。
快搬小板凳 开始讲课了
通讯基本靠吼 传递基本靠腿
在古代,人类没有的传递信息方式靠的就是一张嘴,一双腿。马拉松的故事大家应该都听过,一名雅典士兵靠着一双腿跑回了故乡告诉部队胜利的消息。那个年代人类更多的通讯交互方式是靠自身或是以动物为载体来传达。
人类因电话发明而改变
140年前电话诞生后,人类通讯才真正意义上有了交互。电话的发展历史就是一篇人类通讯史。电话的出现让人与人之间变得更近,也让世界变得越来越小。而最早的电话使用最广的则是在战争领域。
手摇式电话机(图片来自网络)
手摇电话机在战场中运用的最为广泛,前线指挥官在电话上摇两下就可以接到后方指挥官。那时候的电话机属于单线联系,无需拨号但需要人工连线才能帮忙接通。
不过随着改革开放的到来,“楼上楼下,电灯电话”的梦想在千百中国人心中扎根,那些年家里能有个电话已经是富贵的象征。而那时候电话座机与目前其实模样相差并不多,采用数字键拨号来与电话控制。
1973年美国摩托罗拉发明了第一款推向民用的移动电话,但人与电话之间依然是靠按键的形式进行交互,而知道2007年乔老爷子发布第一款iPhone后,交互方式才彻底被改变。
乔布斯发布第一代iPhone
触摸的交互形式其实并非苹果首创,但苹果在当时将触摸的体验做到最好。那时候大家才发觉到屏幕还能如此一般的触摸简直不可思议,都被那丝滑的流畅和多点触控带来的良好体验所折服。
智能语音不是聊天机器人
纵观整个手机和电话发展史,人类与电话之间的交互不管是摇还是按,再到触摸,都没有离开过我们的双手。如今智能的功能越做越丰富,而在交互逻辑上除了触摸还是触摸,但为了能彻底解放我们的双手,就需要新的一种交互方式,智能语音。
提到智能语音就不得不提到人工智能,有智能语音的加持,所有的智能设备才可以变得真的只能。智能设备首先就是要先从听得懂人话开始。而智能语音可不是单纯的聊天机器人,智能语音是通过及时对话完成交互,实现帮用户解决问题甚至提出一些合理的建议。
说起手机语音助手方面就不得不提苹果的Siri和谷歌的Google Now。
苹果Siri
Siri成立于2007年,2010年被苹果以2亿美金收购,最初是以文字聊天服务为主,随后通过与全球最大的语音识别厂商Nuance合作,Siri实现了语音识别功能。
Siri智能语音助手
每年苹果都会在iOS系统更新上花大力气优化Siri,一句“Hi Siri”就可以完全激活Sir语音助手。其最大的特色,则是人机的互动方面,不仅有十分生动的对话接口,其针对用户询问所给予的回答,也不至于答非所问,有时候更是让人有种心有灵犀的惊喜,例如使用者如果在说出、输入的内容包括了“喝了点”、“家”这些字(甚至不需要符合语法,相当人性化。。。),Siri 则会判断为喝醉酒、要回家,并自动建议是否要帮忙叫出租车。
Google Now
说完了苹果那必须就要来说说他的对手Google,Google Now是在谷歌I/O大会上随安卓4.1系统同时推出的一款应用,作为一款语音助手,它会全面了解用户的各种习惯和正在进行的动作,并向用户提供相关信息。
Google Now
相比于Siri作为最早发布的个人智能语音助理产品,Siri必定会遇到强有力的竞争对手,被超越也属正常情况。Google Now优于Siri的一个先天优势在于与Google搜索功能的结合,用户搜索的关键词被记录下来,Google Now智能化读取关键词后,为用户提供相关的语音服务。除了处理速度快之外,Google Now针对用户需求“主动”为用户发出提醒,而不仅仅是回答用户的提问,产品性能更为人性化。
但是作为中国用户,在中文语境下两款的语音体验都不尽如人意,Siri的语音识别率不高,稍微有点方言就听不懂,但是人工智能做的比较好,调戏Siri已经它存在的意义,不过搜索引擎够强大。
网友调戏Siri(图片来自微博)
Google Now语音识别率很高,但Google Now不像Siri那样有人情味,比较呆滞死板,不能调戏。还一个重要的一点,在中国我们压根就用不了谷歌的任何服务,而且就算可以用还需要将手机界面设置成英语。
中文语音助手不鸡肋
话说我们中国语言博大精深,一句话可以就可以有多重含义。
“夏天能穿多少穿多少,冬天能穿多少穿多少”。
有时候我们不得不佩服老祖宗,能把这么复杂的语言传承下来实属不易。在语音识别方面谷歌和苹果甚至微软都很难做到准确识别中文,明明识别非常好,可到了中文模式下本是智能的语音助手却变成了智障语音。
在中文语境里做的比较好的不得不提一下讯飞,笔者知道讯飞做智能语音应该还是说因为锤子的坚果Pro上的闪念胶囊,孤陋寡闻的我以前并不是很看好语音输入和语音识别。但在坚果Pro上看到了讯飞语音输入后才彻底改变了我对这一事物的看法。
随坚果Pro推出的闪念胶囊(图片来自网络)
抛开锤子的闪念胶囊,讯飞可以让中文语音输入做到如此高的准确率实属难得,而讯飞推出的灵犀语音助手也针对中文口音问题进行了识别优化。目前在国内成为了代替Google Now的语音助手。
智能语音是强智能还是弱智能?
弱智能,直接开门见山的给出我的答案。目前来看,智能语音助手还处于很基础的阶段,除了可以满足用户的查看天气预报和定闹钟以外很难想象得到能有别的什么用。英文语境下的智能程度多少要比中文高,其中的原因我分析有两个。
第一是受语言环境所致,上面也阐述到了,中文的语言表述非常复杂,复杂程度可以说就连我们自己有时候都听不明白,一句话可以有好几种表达方法。再加之中国的方言千变万化,就算是普通话还会分南区北区江浙区之分。
“刘奶奶找牛奶奶买榴莲牛奶,牛奶奶给刘奶奶拿榴莲牛奶”这句话让NL不分的南方同学念出来估计要难为死了。
第二个原因则是大部分掌握智能语音核心技术的都是国外公司,国外公司不愿意将主要心思放在中国,而我们国内的智能语音研发公司又比较稀缺,使得国内的智能语音使用率偏低。
不过随着人工智能浪潮的来袭,我们会更加的急需智能语音助手的帮助。在智能家居如果连人话都听不懂只是简单靠两三个APP支持那还叫什么智能?在智能汽车中,如果汽车连我要去大栅(shi)栏还是大栅(zha)栏都听不懂还怎么导航?
终极交互方式联想(纯属联想 只为娱乐)
智能语音交互可以说是目前最靠谱的未来畅想,而人类的钻研和进步是永无止境的,此时我们每天用的叫手机,那今后随着技术的不断更新,手机或许也就不叫手机了。
眼球交互
早在若干年以前,三星就在Note3上搭载过眼球翻页的技术,也算得上是当时一项黑科技的存在,但不知道因为翻页时过于尴尬所以才取消这技术。试想一下如果这项技术在今后可以实现,那么应该会极大程度上避免斗鸡眼的发病率。
全息投影
手掌投影操作(图片来自网络)
手腕上可以带上一种全息投影装置,随用随打开,但终究还是靠手指来进行交互操作,所以只能说是在设备上进行了创新。不过倒是对练练左手很有帮助。
意念交互
意念控制(图片来自网络)
使用意念来控制设备应该是人类的最终极状态,每个人脑中都可以植入一颗电子芯片,通过思想来控制智能设备。开车时用意念控制车辆的行驶,通话时只需要用意念控制通讯设备拨打电话。到那时人类才算是彻底解放了双手。
写在最后
当智能语音刚刚出现在手机当中时,它只是作为了一款辅助工具来使用,更多的只是完成一些很机械式的工作。但随着智能家居和智能移动设备的智能化,手机将肯定还是会作为一个智能中枢,来起到与智能设备联动的作用。
笔者认为只有智能语音的加强才可以让设备听懂我们需要什么。虽然目前来说智能语音只是扮演一个助手角色,而作为设备联动中枢的手机,首先是要先听懂。所以今后手机交互的将来,最可能实现的就是让语音助手变成“语音主手”。
不知大家有什么意见呢?可以随时留言与笔者沟通。
上一篇:未来的答案之荣耀赵明的内心独白
下一篇:手机IP67有多强 零下24度冰冻后惊呆
推荐阅读最新更新时间:2024-05-03 17:52
- 消息称苹果、三星超薄高密度电池均开发失败,iPhone 17 Air、Galaxy S25 Slim手机“变厚”
- 美光亮相2024年进博会,持续深耕中国市场,引领可持续发展
- Qorvo:创新技术引领下一代移动产业
- BOE独供努比亚和红魔旗舰新品 全新一代屏下显示技术引领行业迈入真全面屏时代
- OPPO与香港理工大学续约合作 升级创新研究中心,拓展AI影像新边界
- 古尔曼:Vision Pro 将升级芯片,苹果还考虑推出与 iPhone 连接的眼镜
- 汇顶助力,一加13新十年首款旗舰全方位实现“样样超Pro”
- 汇顶科技助力iQOO 13打造电竞性能旗舰新体验
- BOE(京东方)全新一代发光器件赋能iQOO 13 全面引领柔性显示行业性能新高度