百度的人工智能终于走在辙上 但还差了那么一点

发布者:DazzlingSpirit最新更新时间:2017-02-20 来源: ofweek关键字:百度  人工智能 手机看文章 扫描二维码
随时随地手机看文章

有两条关于百度的消息很有意思:一条是收购渡鸦团队,一条是把度秘团队升级为度秘事业部,两边都向陆奇汇报工作。这种软硬融合的战略选择是极其正确的。这并不是马后炮,我在2016年10月发的《虽然很投入,但李彦宏可能正在错过人工智能》里核心观点之一就是:百度是国内对人工智能投入力度最大的公司,但其不碰硬件的战略很可能导致它最终错过人工智能里对它最关键的部分。虽然大方向正确,但如果互联网公司真想学亚马逊,就还差了那么一点东西。

语音赛道的AI到底需要解决什么问题

国内绝不缺和Echo类似的产品,但此前的命运都是折戟沉沙,这里的关键在于对什么是这类产品上要解决的核心问题认知不清。自由交流,唤醒词,速度,方言,内容,习惯等每个似乎都可以成为要解决的核心问题,但实际上所有这个赛道上玩家最核心的问题是:

在语义、方言这些刚性约束不突破的条件下打造出速度、精度、内容相匹配的产品。

智能语音也就是说要解决的并非宽适配问题,而是要在面对主流人群真在技术上下功夫,把体验做好。语音交互上糊弄的空间极小,两句话就能感受出体验咋样。

这里面最受关注的是语义的问题,因为人们总是向往自由的交流,语义肯定是交互的一个瓶颈,但我们可以把语音交互根据语义的技术进展分解为两个阶段:

第一阶段是语义并没有核心突破,也就是说最理想状态也就达到75分。这时候打造产品的根本出发点是不指望自由语言交流,而让语音交互偏命令控制,但也打造出极为优秀的用户体验。Echo大的定位就是这样一种产品。这时候产品的核心瓶颈是前端的声学(麦克风阵列+声学算法),这是眼下的问题,不解决产品体验不可能好。基于这判断我在2015年末开始使了很大力气为公司寻找公司,最终这也是我2016年投资声智科技的核心原因,当时逻辑很简单:这个问题显然中科院声学所更擅长解决,而声智科技几乎是声学所人员所创办的唯一的一家AI企业。

第二阶段是语义真的取得突破,这无疑会更大的扩展语音交互的应用范围,一旦这个点得以突破,语音交互会变的无处不在,但我们必须承认什么时候语义能够彻底解决仍然不确定,这是属于未来的事情。

这种时间轴上的错乱是很可怕的,那样就会在现有产品上挑战不可能解决的问题,比如不用唤醒词,指望Echo这类产品什么都能干等。

总结来看我们可以这样讲:如果真想做出Echo那样的产品,声学(麦克风阵列+算法),语音识别,语义三层里面眼下的瓶颈是声学,未来的瓶颈是语义,前者影响现在产品卖不卖的出去,后者影响适用范围的大小。但即使只是前者这也是一个足以对标Pad的新品类。


差的那么一点点

真走软硬融合的道路,显然的关键要素是:良好的产品定义,足够成熟的技术要素,系统整合产品的能力(其实还有通畅的销售渠道)。系统整合一项要求一个公司整合软硬团队,否则不同利益诉求会导致软硬团队很难高度配合,而在产业初期,不同层次间接口标准化很差,容易导致产品夭折。产品定义则高度依赖于个人,就看当事人的能力,对公司而言需要一点运气。

这样一来唯一欠缺的是足够成熟的技术要素。

这是非常麻烦的一点,对于互联网公司尤其艰难,因为真往这条路上走欠缺的并非是计算机算法上的认识,也还牵扯物理,这对于互联网公司是个大大的盲点。

从这个视角正好可以理解苹果和Google的差别,苹果是要高度关注物理层面的东西的,比如材料、电池、屏幕、传感器等,Google显然会更关注算法。所以苹果的云端技术始终不好,而Google做产品就也总是一般。乔布斯万众瞩目所以大家看到的是他的偏执、癫狂乃至艺术气息,但实际上他背后是有一坨人在帮他解决物理上的麻烦事的,现在的库克就是其中之一。

这并不只是百度一个公司的问题,而是新时代趋势对互联网公司的一种系统型挑战。我在之前的文章中曾经提到过,一个行业的兴起事实上是三个大的阶段:

第一阶段是Enabling技术的成熟,类比的话就是手机上的高通和MTK,在语音产业链上声智科技扮演类似的角色。

第二阶段是硬件产品的成熟,类比的话就是Apple II或者iPhone 1代,在语音产业链上就是Echo。需要注意Echo是起点而不是终点,是刚跨过可用线的一款产品。

第三阶段才是新硬件平台上软件应用的成熟,比如PC上就是Office,手机上就是微信。在语音产业链上这点还没展开。

互联网缩短了第一阶段和第二阶段间的过渡过程,相当于两者在同步发生,也正因此才需要软硬融合。但互联网公司独自解决第一个问题能力会偏弱,这就是欠缺的那一点点。

硝烟会从今日起

也许是为了提振股价,百度十分高调的公布了这件事情。这也很有意思,因为百度这样做很可能会引起连锁反应。在这之前,大家基本都处于观望状态,当其中一个真的下注后,别的人就会开始系统考虑这件事情别人做成了对我会有什么样的影响。

这事一旦开始推敲,腾讯、阿里就会认识到这是自己输不起的战争。

这点我在之前的文章里提到过,但很有必要在百度采取行动的时候再次重述:

我们先做个基本的假设,那就是Alexa获得了巨大成功(Echo、智能音箱、Alexa有关联,但其实是不同的东西,这点在之前文章中有说,这里不再重复),渗透到各种设备之中,包围了人们的生活,人们有50%的时间在通过语音和设备打交道,并且日活逼近Android。

那这时候一定会衍生这样的需求,用户会说:Alexa,帮我通知下马化腾,明天我不见他了。这时候就需要有一种通讯的IM来实现这种需求。这时候亚马逊就有两个选择:第一它接入一种已有IM,比如Whatsapp,或者Skype。第二种是自己做一个嵌在Alexa里面。亚马逊至少有一半的几率会选择后者,而不是把这种基础设施开放给别人,因为前两种要么属于Facebook,要么属于微软。如果在中国是阿里巴巴做成了Alexa,那估计百分百不会选择对接微信。这样一来配合一个语音交互的核心特征,颠覆性的事情就出现了:

语音交互背后隐藏的各种应用具有唯一性。

我们很难想象这种语音交互方式:Alexa帮我用Whatsapp给马化腾留个消息,明天我不见他了。在语音交互中WhatsApp这类应用的标识很可能会被优化掉。如果Alexa还只是百万级、千万级DAU的应用时那这个特性还不关键,但如果它是10亿DAU的系统,那这个特性的影响就会被无限放大,也就说搜索、IM、电商很可能都只有一家,而不是像现在虽然少,但还有个1,2,3名。

小结

今天几乎已经没人再怀疑语音交互的成立了,有意思的事情是这种变化只发生在过去不到半年的时间里。现在看2017年的热闹很可能在这里发生,这是件牵连极广的事情:它会牵涉人工智能(声学、语音语义公司),它会升级智能硬件公司,原本的智能硬件其实已经被鄙视了,但Echo显然不是什么万物互联赛道而是人工智能赛道。

好吧,想做的要尽快进来,不想做这个行业的,可以搬个板凳看热闹了。


关键字:百度  人工智能 引用地址:百度的人工智能终于走在辙上 但还差了那么一点

上一篇:李开复6000字演讲解读:不接受AI+概念就完蛋
下一篇:人工智能风头正劲 哪些改变超出你的想象?

推荐阅读最新更新时间:2024-05-03 01:03

人工智能有了幽默感很危险?可能会因“有趣”杀人
近日,据国外媒体报道,专家警告称,被设计拥有 幽默感 的机器人可能很难理解究竟什么叫“好玩的事情”,甚至可能因此而杀人。 研究人员指出, 人工智能 机器无法真正掌握开玩笑的时机,也不具备对玩笑的鉴赏力。这除了让它们开不合时宜的玩笑之外,还可能招致灾难性后果。自动化软件可能会把杀人当成一件好玩的事情,所以,让 人工智能 具备理解幽默的能力是一件很有必要的事情。 德国达姆施塔特大学计算机科学家与语言学家崔斯坦•米勒(Tristan Miller)称,这能增进机器与人类之间的联系,尤其是如果能让他们理解何为讽刺的话。这也许还能促进不同语言之间自动化翻译的发展。 但一些专家对机器人能否理解幽默仍持怀疑态度,“ 人工智能 永远无法像人类一样
[安防电子]
工业融合的四大要素:物联网、云计算、数据分析和AI
作者:Jeff DeAngelis,Managing Director, Industrial Communications, Maxim Integrated 实现产业融合所需的四个基本要素是:工业物联网(IIoT)、云计算、数据分析和人工智能(AI)。 很显然随着许多公司努力创建智能制造设施,提高制造产量和效率,同时降低运营成本,这一趋势正在广泛建立。 这些智能工厂将通过4G / 5G网络提供实时通信,以使用基于Web的应用程序接收和确认订单。它们还提供必要的灵活性,通过利用强大的AI技术进行实时决策,利用从IIoT提供的大量智能制造机器,机器人和智能传感器收集的基于云的信息,进行实时决策。这听起来像是一个白日梦,但奥卡多科技
[工业控制]
工业融合的四大要素:物联网、云计算、数据分析和<font color='red'>AI</font>
捷豹路虎应用AI新技术,研发情绪探测舒缓系统
捷豹 路虎宣布其正在研发全新情绪探测及舒缓系统,该系统采用最新的AI技术,能够辨识人类面部表情的细微差别自动调节和优化车内环境,并拥有学习能力。 据悉,该系统在行车过程中,能够通过面部摄像和生物传感技术,探测和评估驾驶者的情绪,并相应调节供暖、通风和空调系统、车载媒体、照明等车内配置,从而舒缓驾驶者的日常压力、提升其出行幸福感。例如,当系统探测到驾驶者的紧张情绪,环境照明将转变为镇静色,以舒缓压力;当系统探测到驾驶者的疲惫状态,车载媒体将播放驾驶者最喜欢的歌曲,以恢复精神;当系统探测到驾驶者的困倦迹象,如打哈欠,空调温度将随之降低,以保持清醒。 此外,捷豹路虎还在测试适用于后排乘客的同类技术。如果系统识别到用户的困倦迹
[汽车电子]
捷豹路虎应用<font color='red'>AI</font>新技术,研发情绪探测舒缓系统
弹性因应运算需求变革 FPGA显著强化AI/大数据处理
物联网(IoT)、人工智能(AI)蓬勃发展,数据处理需求不仅日益庞大,也越来越多元化;尤其以AI应用来说,现行CPU/GPU硬件配置越来越难因应算法进化、多元情境转换,现场可程序逻辑门阵列(FPGA) 进而逐渐成为发展智能联网的另一选项。 为此,英特尔(Intel)自2015年收购Altera起持续投入FPGA研发,近来则陆续推出各种相关解决方案,协助微软(Microsoft)、亚马逊(Amazon)等厂商/机构强化运算业务,以期加速实现智能连网世界。 英特尔可编程解决方案事业部亚太区副总裁庄秉翰表示,待影音串流等服务更为普及、自驾车与智能工厂等新技术应用落地,未来将有500亿个联网装置,创造每年多达2,300EB的海量数据,如何
[半导体设计/制造]
英伟达的生财之道:深入人工智能市场
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。下面就随嵌入式小编一起来了解一下相关内容吧。 人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。可以说几乎是自然科学和社会科学的所有学科,其范围已远远超出了计算机科学的范畴,人工智能与思维科学的关系是实践和理论的关系,人工智能是处于思维科学的技术应用层次,是它的一个应用分支。从思维观点看,人工智能不仅限于逻辑思维,要考虑形象思维、灵感思维才能促进人工智能的突破性的发展,数学常被认为是多种学科的基础科学,数学也进入语言、思维领域,人工智能学科也必须
[嵌入式]
香港大学计算机科学系衍生公司"Stellaris AI" 推出具有千亿参数的突破性语言模型"Stellaris GPT"
香港大学计算机科学系衍生公司 Stellaris AI 推出具有千亿参数的突破性语言模型 Stellaris GPT 香港 - Media OutReach - 2023年5月30日 - 香港大学(港大)计算机科学系衍生公司 Stellaris AI , 宣布推出具有千亿参数的突破性大规模语言模型 Stellaris GPT (SGPT) 。 该模型完全由Stellaris 人工智能团队自主研发,并不依赖于OpenAI或任何其他类ChatGPT系统,该突破性技术提供了一个没有版权或法律风险的人工智能驱动的语言模型/系统。 SGPT v2.5是由Stellaris从零开始自主研发的,研究团队包括港大-渣打慈善基金金
[网络通信]
香港大学计算机科学系衍生公司AI" 推出具有千亿参数的突破性语言模型"Stellaris GPT"" />
CEEC科技联展,百度AI大巴首次来深圳
Hello  AI 科技联展,人工智能时代,未来已来。6月8日,由CEEC、 百度 、创意银行携手举办的“Hello AI科技联展”在深圳福田深业上城拉开帷幕。这是百度大巴首次开入广东,停驻深圳。   此前,百度AI科普大巴先后走过北京、厦门、重庆、武汉等城市,给千万民众展示AI核心技术,感受AI生活的便利神奇。此次科技联展,更有创意银行,Alpha机器人、HoloEra虚拟生命、科大讯飞金龟子等展品现身,让市民身临其境体验未来科技生活。   CEEC10层   CEEC聚焦消费电子,志在打造一个“365天全天候永不落幕”的五位一体的世界级消费电子展示交易中心。CEEC是融合科技、创新、时尚元素的多元化空间,以多种化身带领参观
[嵌入式]
美国与欧盟计划借助 AI 寻找半导体生产中“永久化学品”PFAS 替代品
4 月 7 日消息,据美国白宫官网,美国-欧盟贸易和科技委员会在近日的联合声明中表示计划借助 AI 寻找半导体生产中“永久化学品”PFAS 的替代品。 这份声明是在该委员会于 4 月 4~5 日举办的第六次部长级会议上公布的。 声明宣称: 我们计划继续努力寻找在芯片中使用全氟和多氟物质(PFAS)的替代品的研究合作机会。例如,我们计划探索使用 AI 能力和数字孪生来加速发现合适的材料,以取代半导体制造中的 PFAS。 PFAS 类有机物包含由完全氟化的碳原子组成的碳原子链。由于碳氟键的高强度,PFAS 具有化学惰性,难以同其他物质反应,故也被称为“永久化学品”。 PFAS 有着广泛用途,被半导体行业用于蚀刻冷却等方面。 目前在
[半导体设计/制造]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved