不久前,苹果公司宣布下一代iPhone将启用一项新的语音识别系统:Siri。关于它的简介和部分发布会演示照片请参看果迷网之前的《Siri智能语音识别,iPhone 4S能够听懂你的话》一文。Cult of Mac则对Siri进行了一番深入的解析,看过此文或许能让你更有理由相信,人工智能已经走进我们的生活。
说道Siri,这是一道硬菜。可在Android上,这个功能一年前就有了,苹果不过是想在这方面“不输他人”,而且其功能也并非如此强大。对吧?
错。除了它确实是一道硬菜以外,其他的都错。
其实,Siri是十年内移动平台上最重要的事件之一。
对Siri持否定看法的人一般会分成两个阵营:一边会说它没什么了不起的;另一边会说Android上之前已经有了。这两方的说法都不正确。
Siri的意义相当重大
我们不妨先从Siri的血统说起。Siri直接发端于史上最大的人工智能项目:五角大楼的CALO项目。CALO是“Cognitive Assistant that Learns and Organizes”的缩写(会学习和组织的认知助理),这个项目汇聚了全球人工智能方面的顶尖科研人员。
整个CALO计划的带头人名叫Adam Cheyer,他现在也是苹果iPhone团队的工程总监。
在《麻省理工技术评论》的采访中,Cheyer说CALO早已开始探索如何把“对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考、服务代表全部融合到一个⋯⋯模仿人类的助理中,帮助人们完成不同的事情。”
他形容说Siri计划就是寻求在一件消费产品中做同样的事情。其实,在过去的四年里,Cheyer和他的团队一直在钻研如何优化CALO,使其能够在一台强大的移动电话中发挥效用,每天都能被成千上万的用户使用。在过去一年半中,他们把主要精力放在Siri技术和iOS及其应用程序的整合上。
它不是单纯的“声音识别”。它是人工智能。当人工智能进入了你的手机,难道意义还不够重大?
Siri和Voice Actions是两码事
Android系统的Voice Actions也是一项伟大的技术,并已经被许多Android用户所熟知和使用。但说真的,它和Siri不是同一个层面的产品。
Voice Actions提供了非常坚实可靠的声音识别引擎,它的高识别度把曾经一度流行的语音识别工具都比了下去。
不过,和过去的所有语音命令系统一样,它要求你说的话严格符合一系列特定的语法,否则它就无法理解。
Siri和以前公众使用过的所有产品都不相同。你说的话可以和你想表达的意思在字面上毫不相干,从严格的技术上看也似乎是文不对题,但Siri会根据上下文、人类历史以及能够理解一般人类语言的人工智能去分析,并在多数情况下领会你的意思。
打个比方,你想小睡一会,并准备上个闹钟,只需要说“20分钟后叫醒我”。如果你想查阅后面的日程安排,你可以说:“我今天接下来都有什么事?”
这些语句中既不包括会用到的应用程序名称,也不包括所需数据的名称。Siri仍然能够理解。
对人类而言,这些句子再平常不过了。但要让机器去理解这些变化多端的棘手词汇,就是人工智能的圣杯了。
而更加人性化的特点是,一旦你开始和Siri进入一段对话,它甚至能理解许多含义模糊或者引申的语义。比如,你可以问它:“步行范围内有没有什么顶尖的意大利餐馆?”如果Siri查询后回答“没有”的话,你可以说:“那墨西哥的呢?”Siri会将你的这个问题连同上文的“顶尖的餐馆”和“步行范围”一道进行理解。
Android的Voice Actions做不到这样的事情,因为它是一个声控命令软件,而并非人工智能。
Siri有时会为你显示网页搜索的结果,有时能替你执行一些操作,有时能够直接控制iPhone里的应用程序。
而且Siri同样能够回答问题,这要归功于它整合的Wolfram-Alpha。你可以随机提问:“30英里是多少公里?”,“巴黎现在几点?”,“钢琴上有多少个八度?”,或者“天空为何是蓝色的?”Siri能够直接回答这些问题。不是唰地显示一个网页。就是回答你的问题。
关于Siri,重中之重是什么?
从历史和文明的角度来看,关于Siri,最伟大的事情并非人工智能本身。而是苹果通过Siri把人工智能带进了现实生活中。
理由就是:苹果将Siri做成了iPhone的一个核心组成部分,并且让它作为手机使用的主流,让每个用户都觉得除了使用很方便之外,更想时时刻刻都尝试使用它。
提到“主流”,我指的是捡起那些被人类文明边缘化了的东西,并使其成为大量人群每日生活的一部分。现在,Google出品的Voice Actions不得不面临被边缘化的境地。一般人甚至都没听说过它。
Siri会成为主流的。人们会逐渐熟知它,甚至包括非iPhone用户。
爱迪生并不是发明灯泡的人。他是通过产品设计和市场营销,将灯泡变为主流的人。
福特并不是发明汽车的人。他是通过控制成本和市场营销,将汽车变为主流的人。
我们总是记住那些将事物变成主流的人,因为正是这些人和公司让科学技术真正融入每个人每天的生活。于是,说道灯泡,它就溯源于爱迪生;说道汽车,它就溯源于福特。
Google的Voice Actions并非人工智能,虽说它确实让用户省去了打字输入、触摸操作的工序,只需要使用声音去控制机器就可以完成一系列事情。但是,Voice Actions最终没有让声控成为主流。或许一些极客们会学着使用它吧。
然而,妈妈们会选择Siri。
And One More Thing(还有一件事)
iPhone 4S也许会成为第一款支持蓝牙4.0的手机,这项技术可以降低能耗,同时可以做到一件非常特别的事:唤醒设备。
如果把Siri和这项无线技术结合起来,其使用范围就更加广泛了。例如,可以想象你戴着一款“超长待机”手表,它会一直睡眠,你触摸它才会显示时间,或者在iPhone收到短信时,手表会被Siri唤醒。你如果要和Siri交谈,只需要对着手表说话就可以了,甚至连手机都不用掏出来。
同样,可以试想一下,有这么一款桌面麦克风,当你说话时会唤醒iPhone,就像《星际迷航》里那样不用按任何按钮直接说话,并从企业号,呃我是说iPhone的人工智能,得到回应。
那么让我们来总结一下Siri对于人类而言意味着什么。Siri是人机交互新纪元的黎明,是大众进入真正的人工智能时代的开端。
当然,目前它尚未达到完美,苹果目前将其定位在“beta”阶段。并且,它也还不是你在科幻电影里看到的那种无限高能的人工智能。
但它的步伐远未停止。iPhone 4S里的Siri只是一个开端。相信以后会有更加复杂的版本出现。
Google、微软和其他公司也终会拿出自己的人工智能产品的(并且我预言就是按照这个排序)。
所以,一旦你最终和Siri搭上话了,请善待它。Siri具有非常非常重大的现实意义,和以往任何产品都不同。它能够代表计算机发展的一个新纪元。当然,它会让每个人都“说”起来的。
上一篇:桌面风暴来袭 百度浏览器1.3正式版发布
下一篇:苹果iOS 5移动操作系统正式在全球范围内推出
- 热门资源推荐
- 热门放大器推荐
小广播
热门活动
换一批
更多
最新手机便携文章
- 苹果遭4000万英国iCloud用户集体诉讼,面临276亿元索赔
- 消息称苹果、三星超薄高密度电池均开发失败,iPhone 17 Air、Galaxy S25 Slim手机“变厚”
- 美光亮相2024年进博会,持续深耕中国市场,引领可持续发展
- Qorvo:创新技术引领下一代移动产业
- BOE独供努比亚和红魔旗舰新品 全新一代屏下显示技术引领行业迈入真全面屏时代
- OPPO与香港理工大学续约合作 升级创新研究中心,拓展AI影像新边界
- 古尔曼:Vision Pro 将升级芯片,苹果还考虑推出与 iPhone 连接的眼镜
- 汇顶助力,一加13新十年首款旗舰全方位实现“样样超Pro”
- 汇顶科技助力iQOO 13打造电竞性能旗舰新体验
更多精选电路图
更多热门文章
更多每日新闻
- Allegro MicroSystems 在 2024 年德国慕尼黑电子展上推出先进的磁性和电感式位置感测解决方案
- 左手车钥匙,右手活体检测雷达,UWB上车势在必行!
- 狂飙十年,国产CIS挤上牌桌
- 神盾短刀电池+雷神EM-i超级电混,吉利新能源甩出了两张“王炸”
- 浅谈功能安全之故障(fault),错误(error),失效(failure)
- 智能汽车2.0周期,这几大核心产业链迎来重大机会!
- 美日研发新型电池,宁德时代面临挑战?中国新能源电池产业如何应对?
- Rambus推出业界首款HBM 4控制器IP:背后有哪些技术细节?
- 村田推出高精度汽车用6轴惯性传感器
- 福特获得预充电报警专利 有助于节约成本和应对紧急情况
更多往期活动
11月17日历史上的今天
厂商技术中心