语音是人机交互的未来？人工智能打开全新世界-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

想象这样的情景：你躺在床上，忽然想关掉头顶刺眼得令你无法直视的智能灯泡。于是你开始四处翻找手机、解锁、打开控制APP、寻找这盏灯的选项、点击按钮——好了，总算关掉了。发现了没？原本可能5秒走过去按个开关的事，硬生生的花去了你将近1分钟的时间。

上面的情景，并不是个例。从目前智能硬件的发展状况来看，大部分智能设备仍只是“伪智能”设备，仅通过Wi－Fi通信模块提供了基础的联网控制。在家庭设备的互联领域，目前的重点都仍在设备及硬件连接上——然而，真正的智能化设备不仅仅是实现通信连接，更要在人与设备间的交互上不断进化。

语音＝人机交互的未来？

回顾人机交互的发展历程，实际上是工程师对机器不断改造，以解放人的过程。最早期，键盘是唯一的输入设备，与你为伴的只有枯燥的指令与冰冷的字符界面；后来有了图形界面，才有了鼠标。但是鼠标和键盘都只是交互的介质，并不符合直觉。真正好的交互，应该符合人的直觉，上手即可用。

装备了触摸屏的智能手机，让我们离这个目标更近了一步。灵敏的指尖，代替了键盘／鼠标这层中间介质，做到了所触即所得，身体得以进一步解放。然而，虽然在空间上，你的身体不再需要端坐在电脑前——但操控一部手机，仍然需要手指和眼睛的全程参与——人机交互理应有更好的未来。

语音交互，则为人机交互打开了新世界的大门。首先，感官占用更少了，手可以解放出来；其次，开口说话是我们先天具备的沟通技能，学习成本最小；最重要的是，声波天然可以摆脱设备位置的束缚自由传播，未来甚至可以做到device－free，在任何地方发出指令，都可以进行交互。在信息输入的速度上，语音直接说出指令也比触控点选来的方便。

想象一下，你再也不用翻箱倒柜的找手机，然后从一排排密密麻麻的APP中翻找目标——你只需自然的说出来：“卧室的灯关了吧，太晃眼了”，它就会乖乖的熄灭掉，甚至下次再打开时，你会发现亮度变低不那么晃眼了。

人工智能帮助提升人机交互体验

要保证上面这种级别的语音交互，机器需要准确提炼出的重要讯息有“卧室、灯、关、晃眼”，并最终组合为2个单独的指令“卧室灯→关闭”“卧室灯→初始亮度75％这需要设备具备自然语言理解的能力（NaturalLanguageUnderstanding，NLU），以正确地理解用户的语音指令。而谈到NLU技术，人工智能是无法避开的一个话题。

击败国际顶级棋手李世石的“AlphaGO”，可能最为人熟知的人工智能了。帮助它在围棋上击败对手的技术，和帮助机器理解人类语言的NLU，是基于同一种的、起源于上世纪50年代的技术——机器学习。作为人工智能的核心技术之一，机器学习的核心在于“学习”二字上。通过模拟人类的学习过程，机器学习用一些特定的算法指导计算机利用已知数据得出适当的模型，并利用此模型对新的情境给出判断。这其中的关键，在于一种叫做“神经网络”的算法，它通过模仿人类神经元工作方式，让单一神经元处理接收到的信号，并基于信号特性，给出相应的反馈信息传递给关联的其他神经元，最终经过多层神经元的彼此筛选，得出针对信号的结论。

听起很复杂的过程，实际上因为模拟了人脑处理信号的方式，可以通过有限次数的训练，让程序自己学会对新信号的处理能力，即NLU（自然语言理解）。在神经网络算法，只要有足够数量的语音数据来训练，机器也可以准确的理解人类语言的意图，甚至是“言外之意”——问完天气的你随口抱怨一句“最近外面好冷”，它或许会调皮的提醒你，要不要规划一趟飞往热带的海岛之旅。

取代“伪智能”，语音交互让设备服务链接更紧密

NLU技术在美国市场的应用最为成熟，各巨头也纷纷推出其基于语音交互的智能设备，希望提前抢占市场。而这一市场，目前有着界限鲜明的两派：一边是以Apple、Microsoft为代表的语音辅助派，把自家的手机版助手直接移植到了AppleTV、XBOX设备上，语音仅作为辅助交互手段。而另一边是则更为激进的Google和Amazon，其推出的智能设备GoogleHome、AmazonEcho仅支持语音交互。技术方案各有不同，但四家巨头在商业上的战略野心惊人的相似：通过融入家庭生活，而成为家庭成员获取服务的新入口。

如果把目光转回国内，国内有此野心的厂商目前并不在少数，但市场反响平平。究其原因，智能音箱只是连接服务的一个可以实现语音交互的端口，最重要的是通过不断叠加不同的服务，并提升使用体验，实现真正意义的智慧服务系统——设备＋云服务，这才是智慧家庭产业的重要发展方向。

在2015年底的第二次世界互联网大会上，联想集团总裁杨元庆曾提出：“未来的用户需要的是设备＋云服务的完美结合体验，为此我们就必须打造更加智能的连接”，并很快组建了SmartHome（联想智慧家庭）部门。

有消息表明，联想SmartHome的首个智能设备将于近期推出。其“设备＋云服务”的概念将如何践行？设备的人机交互会采用Apple还是Amazon模式？如何更好的让NLU适应中国人的习惯？一切答案，恐怕只能等产品浮出水面才能揭晓了，让我们共同期待吧！

关键字：语音人机交互人工智能引用地址：语音是人机交互的未来？人工智能打开全新世界

上一篇：潘轶超：工业机器人向“人机协作机器人”升级
下一篇：如何跨越人工智能技术与产品的鸿沟？

推荐阅读最新更新时间：2024-05-03 01:01

英特尔加入PyTorch基金会，通过PyTorch*推动AI普及

不久前，英特尔宣布以Premier会员的身份加入PyTorch*基金会，并期待与各行各业的领军企业在开源PyTorch框架和生态系统上开展合作。 PyTorch能够加速人工智能应用的开发，这将促进试验与创新，在加速AI发展方面发挥关键作用。加入PyTorch基金会，进一步彰显了英特尔致力于通过技术支持并培育其生态系统以加速机器学习框架的演进。英特尔自2018年起为PyTorch提供支持，旨在通过丰富的硬件和开放的软件推动AI普及。英特尔正在不断推进PyTorch并拓展生态，以创新为先，推动构建一个“AI触手可及”的未来。英特尔通过优化，提升PyTorch* 2.0功能 PyTorch受益于英特尔为x86提供的诸

[网络通信]

AI时代索尼和设备厂将挑起日本半导体大梁

　　日本半导体业荣景虽成明日黄花，但在若干部分仍有良好表现，比方Sony的CMOS影像传感器，东京威力科创(Tokyo Electron)等设备厂，推动组织改造有成的瑞萨电子(Renesas Electronics)，以及购并安谋(ARM)的软银(SoftBank)。连同其它新创企业，这些业者能否成为日本半导体业新主力，也可观察。下面就随手机便携小编一起来了解一下相关内容吧。 AI时代索尼和设备厂将挑起日本半导体大梁　　随东芝存储器(Toshiba Memory)出售案发展，日本在全球还具举足轻重地位的半导体产品，可说只剩Sony的CMOS影像传感器，在全球智能型手机摄影模块部分的市占率逼近40%，而且还朝汽车等

[手机便携]

为什么说AI大模型才是智能座舱最佳打开方式？

智能座舱的下一步该怎么走？是上马更强的车规芯片还是提供更丰富的车机功能？或许都不是。在我看来，“AI大模型上车”才是解决上述问题的正确思路。这期内容，我们也将从三个方面跟小伙伴们聊一聊为什么AI大模型才是智能座舱的最佳打开方式。 AI大模型的“三高” 经常阅读IT类文章的小伙伴可能对AI大模型这类事物已经有所了解，但考虑到阅读人群的差异，我们觉得还是要花一丢丢的时间和大家科普一下什么叫“AI大模型”。AI大模型其实就是一种基于深度学习技术的大型人工智能模型，它由大量神经网络组成且可以自动从积累的数据中提取有用的信息。那么问题来了，AI大模型的优点又在哪里？答案是高准确性、高效以及高通用性。只要经过一段时间训练，A

[汽车电子]

为什么说<font color='red'>AI</font>大模型才是智能座舱最佳打开方式？

人工智能科学家杨乐昆狂批马斯克：AI终结人类太不负责任

上个月，在美国加州霍桑的SpaceX总部举行的一场活动上，埃隆· 马斯克（Elon Musk）发表了讲话。 Facebook首席人工智能科学家杨乐昆（Yann LeCun）表示，在这个相对较早的发展阶段，马斯克太“疯狂”，并呼吁对人工智能进行监管。 Yann LeCun说，虽然在过去的几年里人工智能在很多重要的领域取得突破，但人工智能仍处于初期阶段。试着和Siri进行深入的对话，你很快就会看到。最复杂的人工智能助理可以在某些特定的任务上表现出色，比如游戏，但是它们缺乏常识和跨多个领域学习的能力。然而，马斯克曾多次警告说，人工智能可能意味着人类的终结，他认为这项技术有可能比核武器更危险，甚至可能引发第三次世界大战。他

[嵌入式]

医疗AI目前发展如何？未来方向在哪？

医疗 AI ，拥有无限的想象空间。腾讯医疗AI实验室推出的AI心电图智能分析系统，未来可应用于心血管疾病从预防到诊断、监测的医疗全流程；医疗人员利用AI视频分析技术进行帕金森病运动功能智能评估；香港玛丽医院顾问医生杜启峻副教授则通过AI技术，实现发现病人早期脊柱侧弯的情况。医疗AI目前发展情况如何？未来发展方向在哪里？近日，在2018年国家重点研发计划中的“数字诊疗装备研发专项” ——“基于人工智能的临床辅助决策支持技术及其服务模式解决方案研究”项目启动会上，复旦大学附属华山医院外科教授、主任医师张群华表示，医疗AI肯定不像无人驾驶汽车般纯数字化，而是需要文化、医生的经验。它的关键在于解决临床上的痛点，临床医生和人工智能的技术

[医疗电子]

谷歌向第三方开放自研AI芯片TPU：每小时6.5美元

　　北京时间2月13日早间消息，谷歌在一篇博客文章中正式宣布，将以“有限数量”向谷歌云客户开放张量处理器（Tensor Processing Unit，简称TPU）服务。　　TPU是谷歌为机器学习而设计的人工智能定制芯片。将TPU开放，对于选择在谷歌云平台上运行机器学习模型的客户来说，可谓好事一桩。但谷歌这次开放的TPU数量有限，而且按时收费，每小时成本为6.50美元。　　谷歌在2016年低调推出了TPU项目，并在去年5月的年度开发者大会上推出了第二代TPU。这次更新让谷歌进入了更为复杂的深度学习培训阶段。　　TPU专用于人工智能和机器学习，可为谷歌带来两大好处：　　首先，利用自主研发的芯片，谷歌可以

[嵌入式]

谷歌向第三方开放自研<font color='red'>AI</font>芯片TPU：每小时6.5美元

2017中国人工智能产业报告发布

被誉为中国IT产业风向标的年度盛会——2017中国(深圳)IT领袖峰会，今日在深圳五洲宾馆举行。马云、李彦宏、马化腾、朱民等行业领袖和知名学者将再度同台，共话智能新时代，深度揭示行业未来发展趋势。今年峰会主题为“迈进智能新时代”。艾媒咨询受邀参加此次大会，并作为权威移动互联网第三方机构首发《2017中国人工智能产业报告》。 “2017中国(深圳)IT领袖峰会”今日在深圳五洲宾馆隆重举行，此次主题为“迈进智能新时代”的IT峰会备受关注。业界除了期待马云、马化腾、李彦宏同台碰撞出智慧火花外，多家国际国内知名研究机构的多位信息行业资深行业分析师发布的细分行业市场报告也受到广泛期待。面对正在到来的智能新时代，理想如何照进现实？

[安防电子]

美光推出全球首款四端口 SSD，为数据密集型自动驾驶和AI智能汽车工作负载提速

2024 年 4 月 10 日，中国上海 — Micron Technology Inc.（美光科技股份有限公司）（Nasdaq: MU）今日宣布，美光车规级 4150AT SSD 已开始送样。作为全球首款四端口 SSD，该产品提供多达四个片上系统（SoC）接口，可实现软件定义智能汽车的集中存储。美光 4150AT SSD 集多项市场领先特性于一身，例如单根输入/输出虚拟化（SR-IOV）、PCIe ® 4.0 接口和坚固耐用的车规级设计。凭借这些产品特性，美光车规级 4150AT SSD 将为汽车生态系统提供数据中心级别的灵活性和强大功能。美光嵌入式产品和系统部门副总裁 Michael Basca

[手机便携]

美光推出全球首款四端口 SSD，为数据密集型自动驾驶和<font color='red'>AI</font>智能汽车工作负载提速

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■有奖直播报名中！抢占工业4.1先机文晔科技日等你来！

■罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

■STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

■免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！