李彦宏掌舵的百度AI有了什么新花样?

发布者:SparkStar22最新更新时间:2018-07-07 来源: eefocus关键字:百度AI  人工智能  李彦宏 手机看文章 扫描二维码
随时随地手机看文章

北京国家会议中心,这是百度转型AI战略以来举办的第二次百度AI开发者大会,相比第一届,技术配方和味道愈发纯正,而且今年的重点不再是树旗造势,更多的是技术成果解读和商业化探讨。

 

在过去的一段时间内,很多人有这样的质疑?第一,陆奇亲自操刀帮百度理顺了AI航道后淡然离场,对百度的影响大不大?之前大刀阔斧设定好的目标路线还能否被继续保持?第二,百度总是说自己是AI公司,AI主要业务的真实情况怎么样?如何去做商业转化和技术变现?

 

因此,李彦宏特意用一场AI开发者大会交了一份长长的答卷,用答卷去证明陆奇离开,百度并无大碍,并且自己能够带领一众技术高管把AI战略进行的有声有色,无人驾驶车量产、AI开放平台和芯片、智能小程序上线······一步一个亮点,步步为营形成技术体系和商业生态的闭环。

 

AI全栈技术布局:多模态深度语义理解+“昆仑”芯片

百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰详解了百度大脑3.0,从芯片到深度学习框架,百度大脑形成了技术、平台和生态的AI全栈技术布局。

 

发布会上,李彦宏播放了一段电话录音,一位即将参加开发者大会的嘉宾与百度智能客服进行了几轮对话,一问一答非常自然,随后揭晓,录音中的这位客服并不是人,而是AI,它背后便是百度大脑的自然语言理解、语音识别与合成技术。

 

王海峰指出,百度AI能力的核心是百度大脑,而百度大脑3.0是百度AI能力的集大成者。8年前,基于多年的搜索技术积累,百度开始布局AI,2016年9月正式发布“百度大脑”,如今,百度大脑的能力从1.0进阶到3.0。百度大脑1.0完成基础能力搭建和核心技术初步开放,2.0形成了完整的技术体系,开放60多项AI核心能力,3.0的核心是“多模态深度语义理解”,同时开放110多项AI能力,覆盖算法层、感知层、认知层、平台层。

 

百度大脑3.0提出了“多模态深度语义理解”,“多模态深度语义理解”是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。王海峰表示,“多模态深度语义理解不仅能让机器听清、看清,更能理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。”

 

数据语义化技术可以将大千世界中多元、异构和多模态的三元空间大数据,形成包含千亿节点、万亿关系的庞大数据语义网络,从中总结规律、提炼知识、发现价值,助力经济和社会发展。比如在新能源充电桩智能运维中,结合百度的大数据、深度学习等技术进行设备监测、故障诊断等,可以显著提升效率,节约成本。而多元语义知识方面,百度已经构建了包含数亿实体、数千亿级事实的庞大知识图谱。除了基础的由实体、属性、关系构成的实体图谱,我们还针对不同的应用场景和知识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业知识图谱等多种图谱。所有这些知识,构成了百度大脑的基础。

 

视觉语义化可以让机器从看清到看懂视频,并提炼出结构化语义知识。视觉语义化技术应用于世界杯视频解析,能够全面识别视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件。基于这些语义化知识,既可以完成机器人自动解说,也可以进行精彩片段集锦、以及各种数据统计分析等。而在实际生活的超市购物场景中,百度的视觉语义化技术通过识别人物、动作、物品并关联时间序列,将数字化的视频转化为结构化的语义知识,既能实现顾客在无人超市购物的完整体验,还可以帮助商店经营者分析和优化商店经营。

 

语音语义一体化和自然语言理解技术能让机器准确识别并理解人说的话,实现更自然的人机对话。王海峰现场对着百度地图说出了一长串绕口令般的导航需求,百度地图语音智能助手完美识别并给出最佳路线,李彦宏开场播放的智能客服给参会者打电话的片段,其背后也是这些领先的AI技术在支撑。王海峰介绍,百度高噪声环境Hand-free语音识别准确率已提升了10个百分点,语音语义一体化技术使得远场语音识别准确率提升了10个百分点;在语音合成方面,WaveNet+拼接的情感语音合成技术,使得流畅度和自然度也大幅提升。

 

王海峰以对话理解和阅读理解为例,为大家介绍了领先的百度自然语言理解技术。百度的对话理解技术已经积累多年,通过研发最新的深层注意力匹配模型,比已知的最好结果又提升了4.1%。在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于6万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识。“通过持续获取和积累知识,百度大脑的理解能力不断升级,智能水平显著提升,进而能够更好地服务用户。”王海峰说到。

 

百度大脑3.0提出“多模态深度语义理解”,背后有一套百度自主研发的深度学习框架PaddlePaddle,目前也迭代到3.0版本,包括完整的核心框架以及AIStudio、AutoDL、EasyDL等可以让开发者便捷获取百度AI能力的平台。

 

PaddlePaddle3.0核心框架对服务器版本以及移动端版本进行了全面优化,可以灵活适用于广泛的开发需求。AutoDL能更高效自动搜索神经网络结构,开发者无需特殊硬件设备可以快速得到高质量模型;EasyDL可以帮助开发者零算法基础训练业务定制模型,操作可视化,无需懂深度学习;AI studio具有云端集成、简单易用、运行高效和资源免费的特点,是集成“数据、算法、算力”的PaddlePaddle实训平台,一站式满足使用者学习、技术进阶、学术研究需求。

 

百度大脑3.0首次将芯片纳入技术体系,它使百度大脑具备了软硬一体化能力,旨在带动百度大脑算力实现倍级增长。百度自主研发了一款云端全功能AI芯片“昆仑”在会上首次公开亮相。“AI芯片将与百度自主研发的PaddlePaddle深度学习框架深度结合,推动AI技术生态快速发展。”王海峰表示。

 

“昆仑”定位是云端全功能AI芯片,采用了14nm三星工艺,具备260Tops性能,512GB/s内存带宽,100+瓦特功耗设计,针对语音、NLP、图像等进行了专门优化,同等性能下成本降低10倍,支持多个深度学习框架。

 

与谷歌做TPU的选择一样,百度自己做AI芯片有一定必然性,从2011年起,为了深度学习运算的需要,百度开始基于FPGA研发AI加速器,同期开始使用GPU,在过去几年中,百度对FPGA和GPU都进行了大规模部署。AI应用的爆发,对算力的要求越来越高,基于传统芯片的AI运算加速,已经不能满足需求。在大规模AI运算的实践探索中,百度研发出了一款专门用于AI大规模运算的芯片“昆仑”,据说它的运算能力比最新基于FPGA的AI加速器,性能提升了近30倍。

 

王海峰表示,百度大脑每天调用次数超过4千亿次,调用的人中既有AI工程师,也有零“AI”基础的初入门者,还有来自各行各业希望用AI创新业务、为业务转型升级的企业。这些开发者和合作伙伴虽然身份不同、目标不同,但都能从百度找到了最适合的AI接入方式。

 

百度AI智能小程序,深耕移动端掘金

百度副总裁、百度APP&信息流业务体系总负责人沈抖发布百度智能小程序,一边是日益成熟的AI产业,一边是逐渐火爆的小程序热潮,智能小程序是百度AI在移动端深挖潜能的关键纽带,与搜索+信息流进一步串联起来。

 

据介绍,百度智能小程序将在今年12月全面开源,不仅可以全面接入百度大脑的AI能力,还要为用户和开发者打造一个开放、智能化的移动生态,目前包括携程、苏宁易购、唯品会、同程、春雨医生、爱奇艺、优信二手车、查违章等在内的近百家企业成为首批加入智能小程序生态的合作伙伴,并将陆续推出各自的智能小程序。

 

百度智能小程序的开放性体现在两个层面。首先,开发者只要简单修改几行代码,就可以将自己在其他平台开发的小程序接入百度智能小程序,百度智能小程序无缝运行在百度系App(百度App、百度贴吧、百度网盘等)以及外部合作App(哔哩哔哩、58同城等)上,实现一端开发,多端可运行。其次,百度还将开放全域千亿流量扶持开发者,帮助他们快速沉淀精准用户。值得注意的是,百度流量与其他平台不同的是,百度流量中天然存在大量与资讯、服务、工具等相关的需求,尤其是在百度信息流中,用户看到的内容都是根据兴趣匹配推荐的,这些内容可以激发用户各类需求,非常适合开发者去挖掘。

 

沈抖强调:“如今,AI已不再是‘锦上添花’,而是必备的技能。百度将开放AI能力,让开发者重回业务理解与创意的赛道,专注于自己的业务逻辑。”据悉,来自百度大脑3.0的AI能力将全部开放给智能小程序开发者,这些能力包括语音、视觉、自然语言处理、知识图谱、增强现实以及情景感知等类别,其中部分能力甚至已经封装好,开发者直接调用即可。

 

同时,得益于百度的AI技术,百度智能小程序可以基于大数据、意图识别、兴趣识别等技术精准匹配各类智能小程序用户,从而缩短用户转化途径,为开发者和合作伙伴进一步提升商业效益。官方举了几个案例,接入百度智能小程序后,“查违章智能小程序”全网的DAU在50天内增长了370%,火车票智能小程序订单转化率在20天内提升了44%,同时百度贴吧小程序上线以来,用户人均使用时长增加了30%以上。

 

DuerOS人机交互操作系统形成闭环,探索变现方式

百度智能生活事业群组(SLG)总经理景鲲发布DuerOS 3.0,一直想坐上新一代人机交互操作系统的宝座。

 

“操作系统核心三要素是什么?第一是交互的变革;第二是全新的应用生态;第三率先打通商业模式的闭环。”景鲲提出了操作系统三要素,DuerOS3.0正在完成这三要素的闭环。

 

DuerOS3.0的更新主要包括两大方面:核心技术能力的提升,场景与解决方案的拓展。核心能力方面,DuerOS3.0带来自然语言交互技术的全面升级,提供情感语音播报、声纹识别、儿童模式、极客模式、智能引导与纠错、视觉搜索能力、视频理解能力,完全向业界进行开放。

 

场景和解决方案方面,DuerOS3.0可以提供超过20个跨场景、跨设备的解决方案,包括有屏设备解决方案、蓝牙设备解决方案和行业解决方案等。景鲲现场展示了一块只有名片大小的模组方案,通过这个模组方案就可以将合作伙伴的屏幕设备打造成一个可以对话的有屏设备。同时DuerOS还联合创新设计集团洛可可,以及洛客共享设计平台为行业、场景提供一整套从技术到设计的有屏设备产品方案,每个合作伙伴基于此就能打造属于自己的“小度在家”,目前,在DuerOS上面有超过16000人的智能语音开发者在为DuerOS打造各种技能。

 

蓝牙设备解决方案可以植入到蓝牙耳机、蓝牙音箱里,就可以让数以千万的蓝牙设备瞬间变成可以对话的人工智能设备。行业解决方案正在逐步覆盖酒店和养老场所等场景,在现场展示的洲际酒店及度假村的智能酒店体验案例中,宾客可以通过语音控制客房设备、播放音乐、询问天气等,提升酒店行业常规的宾客下榻体验。

 

DuerOS3.0迭代的最大亮点是开始打通商业模式闭环生态,这意味着为DuerOS增添新技能的开发者,可以通过技能开发赚钱,DuerOS正在成为让开发者有收益的对话式AI平台。开发者可通过四种方式从DuerOS获取收益:技能内付费、付费技能、亿元开发者支持计划、DuerOS对话技能大赛。DuerOS还正式启动了商业分成模式,景鲲宣布在前6个月将会把技能收入100%回馈开发者。DuerOS亿元开发者支持计划和DuerOS对话技能大赛也在当天启动,鼓励开发者去打造更优质的技能。

 

景鲲在大会现场还公布了DuerOS的最新数据,截止2018年6月,DuerOS智能设备激活量已经超过9000万,月活跃设备超过2500万。DuerOS平台生态合作伙伴超过200家,搭载DuerOS落地的主控设备超过110多款,在DuerOS平台上的开发者群体已经超过16000人,平台能力和商业化落地得到了市场验证。

 

Apollo搞好车企关系,主打量产方案

Apollo开放平台迈入量产阶段,在去年11月份的百度世界大会上,李彦宏当时说过要在2018年7月份实现L4级自动驾驶汽车“阿波龙”的量产,为了证明自己所言非虚,大会上还远程连线了厦门的金龙客车生产车间,直播了第100辆自动驾驶巴士“阿波龙”在车间下线生产的场景,金龙客车董事长谢思瑜全程站台背书。

 

“阿波龙”的内部设计比较超前,全车没有方向盘,没有油门和刹车踏板,搭载了Apollo L4级自动驾驶解决方案的系统。李彦宏介绍说,这批“阿波龙”即将发往北京、雄安、深圳、福建平潭、湖北武汉等地开展商业化运营,并将联合金龙客车、软银集团旗下自动驾驶公司SB Drive将“阿波龙”销往日本,实现我国自动驾驶电动车的首次“出海”。

 

此外,李彦宏还补充发布一个量产“惊喜”——Apollo赋能新石器科技打造的无人作业车也已量产下线了。李彦宏表示:“自动驾驶汽车将从一发展到百、千、万,这样激动人心的未来,需要开发者们一起去创作、去定义。”开发者能借助Apollo在物流、工程、环卫、农业、公共交通、共享出行等9大作业场景中开发应用。

 

百度副总裁、智能驾驶事业群组(IDG)总经理李震宇在发布Apollo3.0的同时,百度与比亚迪宣布将共同打造开放车辆认证平台,实现Apollo智能驾驶软件平台和比亚迪汽车硬件开放平台的结合。为此,百度总裁张亚勤还与比亚迪董事长兼总裁王传福在大会上进行了探讨对话。

 

“Apollo3.0是Apollo开放的新起点。让每一位开发者平等便捷地获取智能驾驶能力,是Apollo从一而终的使命。”李震宇说到,目前Apollo已经开放了超过22万行代码,超过1万名开发者推荐使用Apollo的开放代码,生态合作伙伴规模达到116家。

 

面向量产,Apollo3.0发布了自主泊车(Valet Parking)、无人作业小车(MicroCar)、自动接驳巴士(MiniBus)三套自动驾驶解决方案,帮助开发者及合作伙伴三个月内打造出属于自己的“阿波龙”。基于Apollo自主泊车解决方案,百度已联合盼达用车实现了中国首次自动驾驶共享汽车示范运营,并联合现代汽车展开定点接驳的落地应用。此外,无人作业小车新石器AX1也已实现量产,在雄安、常州两地实地运营。自动接驳巴士“阿波龙”在四个城市、五大场景启动常态化运营,并获得国家客车质检中心重庆测试场安全认证。此外,Apollo3.0还带来了量产车联网系统解决方案——小度车载OS,并发布了车载语义开放平台。

 

安全性是对自动驾驶量产的真正考验。当天,百度Apollo还与国际知名自动驾驶公司Mobileye合作,融合了其核心的自动驾驶安全模型RSS。Apollo3.0带来了升级版的智能仿真系统:真实环境AR仿真,能提供虚拟交通流结合实景渲染的全栈式闭环仿真解决方案,帮助开发者进行“日行百万公里”的仿真测试。


关键字:百度AI  人工智能  李彦宏 引用地址:李彦宏掌舵的百度AI有了什么新花样?

上一篇:地铁试点刷脸安检,摄像头和扫码口打造乘地铁“快速通道
下一篇:可穿戴市场毫无水花,问题到底出在哪里?

推荐阅读最新更新时间:2024-05-03 03:05

联邦学习(Federated Learning)分布式训练,以共享模型打造效能卓越的AI智能
联邦学习(Federated Learning)分布式训练,以共享模型打造效能卓越的AI智能 联邦机器学习又名联邦学习,联合学习,联盟学习。联邦机器学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。 中国上海 – 2022年8月1日 全球领先的边缘计算解决方案提供商—凌华科技与致星科技(简称“星云Clustar”)达成合作,携手打造边缘联邦学习的一体机,颠覆传统的集中式机器学习训练。 此平台采用凌华科技的MECS-7211作为边缘计算服务器,与星云CLustar的FPGA隐私计算加速卡,为个资隐私解套,应用于密集型计算的加速场景,如隐私计算、机器学习、
[物联网]
联邦学习(Federated Learning)分布式训练,以共享模型打造效能卓越的<font color='red'>AI</font>智能
NVIDIA基于人工智能技术芯片功耗控制系统
3D图形显卡在1999年NVIDIA公司推出GeForce 256时开始了其首次变革,这种硬件光影转换技术,极大的提高了计算机的图像显示性能,对游戏领域产生了重要的革命意义,同时也带给了用户极高的画面真实感。 当前,图形处理器已经无处不在,GPU不再仅仅用于图形应用,而是被广泛用于密集计算操作的应用程序,包括人工智能、实时识别和自动驾驶等领域中。 就在2020年9月2日凌晨,NVIDIA发布了RTX30系列显卡,分别为RTX3070、RTX3080和RTX3090,据悉,3070的性能比2080更强,价格确更加便宜,3080的性能是2080的两倍,价格却和2080一样,而3090则支持8K 60帧光线追踪。 而随着人工智能芯片的兴
[手机便携]
NVIDIA基于<font color='red'>人工智能</font>技术芯片功耗控制系统
谁能成人工智能领域领军者?中国锐意进取 美国沉默
参考消息网2月18日报道 美媒称,中国于2017年7月公布了一项计划,希望成为人工智能领域的全球领军者,到2030年时创造一个价值1500亿美元(约合9500亿元人民币)的产业。 据美国《纽约时报》网站2月13日报道,对于美国从事人工智能的技术专家来说,这份英文版长达28页的文件,是对美国未来数十年中可能是最重要的技术研究领域内领导地位的直接挑战。它概述了中国政府一项积极进取、不遗余力的计划,把发展人工智能当作中国的阿波罗11号登月任务——这项计划同样会激发民族自豪感,并引发决定大局的技术突破。 新美国安全中心参与翻译这份宣言并关注中国人工智能发展的副研究员埃尔萨·卡尼亚说:“值得注意的是,人工智能已经成了中国领导层的重中之重,且
[手机便携]
盘点面向边缘和终端应用的AI芯片公司
翻译自——EEtimes 为了跟上前沿神经网络的要求,高科技公司正在努力寻找提高人工智能性能的最佳方式。与此同时,世界各地涌现出许多初创公司,它们对如何更好的地实现AI提出了新的想法。这一领域正在吸引大量风险资本的投资,这使得该领域不仅拥有大量现金,而且还拥有计算架构的新颖想法。 我们正在追踪来自美国、欧洲和亚洲的约60家人工智能芯片公司, 从重新研发可编程逻辑和多核设计,到开发自己全新架构的公司,再到使用神经形态(脑启发)架构和光学计算等未来技术的公司。 以下是10个我们认为有前途,或至少有一些有趣想法的案例。我们将它们按照其产品在网络中的目标位置分为:数据中心、端点或AIoT设备。 数据中心的人工智能 根据
[物联网]
盘点面向边缘和终端应用的<font color='red'>AI</font>芯片公司
为什么人工智能没有大数据就不能生存?
  随着技术的发展和进步,数据量呈指数级增长,这并不令人意外。如果说人们在2005年还可以勉强处理0.1ZB的数据的话,那么如今这个数字已超过了20ZB,甚至到2020年的数据量将达到47ZB。除了数量庞大之外,数据面临的问题还在于其大部分是非结构化的数据,而这些不完整或不准确的数据对于蓬勃发展的 人工智能 和人类来说没有任何好处。下面就随网络通信小编一起来了解一下相关内容吧。   人们如今只能处理10%的结构化数据,而剩下的都是大量未被标记的信息,机器不能以建设性的方式使用。例如,电子邮件就是非结构化的数据,而电子表格等内容被认为是被标记的结构化数据,并且可以被机器成功扫描。   这看起来似乎并不成问题,但如果人们期望 人工智
[网络通信]
押宝人工智能?联想其实更看重另一个市场
杨元庆 喝了两杯啤酒,停了一会儿,又倒满一杯。从游轮三层甲板望去,两岸大厦的光影流进黄浦江面,盛夏的夜风包裹着缓缓滑行的船。 “五年之后,联想会成为一家怎样的公司?”我问他。 他略迟疑了一下:“这是考我前后说的是不是一样呢。” 他认为在2017年7月20日的联想全球创新科技大会上,已经回答过这个问题,即联想会赌上身家性命去押注 AI ,通过“设备+云”与“基础设施+云”模式赋能产业和行业。 “总之啊,我们肯定是在智能范围内,不是智能的东西我不干。所谓智能,应该有计算模组、存储模组、网络模组等,我们能够连接、协同各个部分,未来的智能,一定是终端与云端相结合。” 当日上午的大会不仅是新产品发布,更像是联想展示其技术肌肉,以及对技术趋势
[嵌入式]
英特尔为2020东京奥运会提供AI技术
在5月23日举行的英特尔开发者大会上,作为奥林匹克全球“TOP 合作伙伴”和官方人工智能平台合作伙伴,英特尔宣布举行 英特尔奥林匹克人工智能挑战赛 ,在开发者社区征集创新想法,共同探讨如何利用人工智能助力全球最大的体育盛事。 “作为奥林匹克全球‘TOP 合作伙伴’和奥林匹克官方人工智能平台合作伙伴,英特尔非常荣幸可以向全世界的体育迷和选手们展示科技助力奥林匹克的魅力”,英特尔公司全球副总裁兼人工智能产品事业部总经理Naveen Rao表示,“今天我们向全世界的AI开发者发出邀请,鼓励大家通过英特尔奥林匹克人工智能挑战赛,提交创新灵感与想法,为2020东京奥运会的体育迷和选手们创造非凡的人工智能体验”。 规则:从今日开始为期
[半导体设计/制造]
本田自动驾驶居然配上“情感引擎”,特斯拉会不会慌了
特斯拉 ,可以靠边站了! 本田 今日宣布,明年将展示一款基于 人工智能 (AI)的 自动驾驶 电动汽车 ,它甚至还拥有自己的情感。   同时,本田还在公司网站上发布了这款概念车的首张设计草图。这款自动驾驶汽车名为“NeuV”,专门为通勤者而设计。     据本田称,这款汽车将配备“情感引擎”,为司机和汽车之间的对话提供可能。该情感引擎基于cocoro SB Corp公司研发的一套人工智能技术,能让机器生成自己的情感。   本田称:“该情感引擎能为人类与汽车之间的交互创造新的可能,从而为用户提供新价值。”通过这些技术,本田希望能重新定义未来的消费者出行体验。   在特斯拉仍在缓慢开垦电动汽车市场之际,传统汽车厂商也纷纷开始生产自
[嵌入式]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved