根据亿欧报告显示,2018年全年,近90%的人工智能公司处于亏损状态,而10%赚钱的企业基本是技术提供商。从谈概念、讲技术,到拼场景、抢落地,建立在大数据基础之上的人工智能,仍面临数据本身带来的挑战。
数据割裂致使落地难
“我们经常提及大数据,但事实上我们并不需要那么多的数据,AI未来一个趋势是小数据崛起。”在GMIS 2019全球数据智能峰会上,斯坦福大学教授、Landing.ai创始人、CEO吴恩达表示。
一个具体的案例是工厂手机屏幕划痕检测。目前不少是利用人眼来检测手机是否存在划痕,如果拥有100万个划痕手机,AI可以非常高效的识别手机划痕。但现实情况是没有任何工厂会有几百万不同划痕的手机,这个时候小样本学习(few shot learning),即利用较少的数据得出同样准确结论的人工智能,将有助于推动整个领域的发展。
小样本学习的迫切性更在于落地过程面临的数据孤岛、数据隐私保护导致的数据割裂问题,让AI技术很难充分发挥价值。
“和AI用于比赛需要上千万的图片训练不同,当AI深入行业我们看到数据往往是小数据和细碎的数据,也就是没有联通起来的数据,再先进的AI技术也很难用上。”国际人工智能学会理事长、香港科技大学教授、微众银行首席人工智能官杨强说道。
今年5月,国家互联网信息办公室发布了《数据安全管理办法(征求意见稿)》,提出在中国境内利用网络开展数据、存储、传输、处理、使用等活动,以及数据安全的保护和监督管理意见。
杨强认为“中国版GDPR”即将到来,数据隐私在走向严格化、全面化,这使得企业在实际应用中可以使用的数据维度和范围并不大。数据隐私保护的趋严,为人工智能技术升级提供了契机。
以保险行业利用AI进行个性化定价为例,背后需要业务数据和用户互联网行为数据融合,理想的状态是可以拿到非常丰富的用户画像,与用户的ID高度匹配,但实际情况迫于隐私、安全、法规等原因,企业可以应用的数据是非常有限的。
再例如在小微企业贷款应用方面,AI需要引入票据数据、资产数据、舆情数据等,但由于数据的割裂,实际应用中只能使用一些政府的数据,例如央行的征信报告,但这些报告只能覆盖不到10%的人群。这一问题在医疗领域更为明显,不同医院的医疗影像数据很难汇聚到一起,形成大数据来训练一个医疗模型。
“小数据”崛起
针对数据割裂带来的人工智能落地难问题,杨强提出了联邦学习。所谓联邦学习,是多个数据方之间组成一个联盟,共同参与到全局建模的建设中,各方之间在保护数据隐私和模型参数基础上,仅共享模型加密后的参数,让共享模型达到更优的效果。
据杨强介绍,联邦学习分为横向联邦和纵向联邦,横向联邦是指企业各方数据维度相同、ID维度不同,更多存在于消费者应用中;纵向联邦是指企业各方数据的ID维度相同(样本重叠)、数据维度不同,更多存在于B端应用。
例如针对保险行业的个性化保险定价问题,一家互联网企业和一家保险企业进行数据合作,这种合作数据的ID重合度相当大,数据特征维度大大增加,使模型的个性化定价效果显著提升,为保险企业带来8倍覆盖率提升和1.5倍利润率提升。
横向联邦学习方面,在手机行业,通过在本地建立加密上传的小模型,服务器端看不到内容却可以把模型汇聚起来,进行云端模型的更新,新的通用模型再释放给手机,帮助用户自动化进行图片标注。这样既保护了用户隐私,也可以进行模型学习和更新。
杨强认为联邦学习最大的优势是保证数据不出户,通过生态在不同行业选取合作伙伴,用群体智能不断提升模型效果。因此联邦学习一定是多方共同协作组成一个联盟,生态的建设十分重要。
面对AI落地难、盈利难问题,吴恩达则认为,在期待AI为企业带来红利之前,企业需要避免几个陷阱。首先AI技术会影响很多企业做业务的核心,所以选择项目是非常重要的,从小的项目开始,可以建立好的基础,同时帮团队获得动能。
其次团队建设不能仅依靠明星工程师,而是要建立一个完善的、跨学科、跨职能的团队。同时不要期待AI立刻产生作用,而是要多次尝试,对AI发展的回报曲线进行合理预算。不要使用传统的流程评估人工智能项目,应该为AI项目团队设立合适的KPI和目标。
“有关 AI 的应用越来越多了,但企业的 AI 转型并不是开发一个 APP 这么简单,不要指望AI解决所有的问题,也不要指望AI项目一次性就成功。”吴恩达表示。
上一篇:2019 Arm人工智能开发者全球峰会圆满举办
下一篇:Arm Pelion物联网平台落地,率先选择了中国联通
推荐阅读最新更新时间:2024-10-10 17:14
- 不止射频:Qorvo® 解锁下一代移动设备的无限未来
- 物联网助力电动车充电设施走向未来
- Nordic Semiconductor推出nRF54L15、nRF54L10 和 nRF54L05 下一代无线 SoC
- 射频 FDA 如何使用射频采样 ADC 来增强测试系统
- 基于OPENCV的相机捕捉视频进行人脸检测--米尔NXP i.MX93开发板
- Nordic Semiconductor nRF54H20 超低功耗 SoC 荣获 2024 年世界电子成就奖 (WEAA)
- 英国测试装配神经系统的无人机:无需经常落地进行检查
- 超宽带的力量:重塑汽车、移动设备和工业物联网体验
- 意法半导体发布面向表计及资产跟踪应用的高适应易连接双无线IoT模块
- 【涂鸦智能】Mao温湿度传感器
- LT3973IDD-3.3 5V、2MHz 降压转换器的典型应用
- 【鳖载着理发店】流水灯钥匙扣
- NCP1529MUTBGEVB,NCP1529 评估板,1A 高效降压转换器
- PAM8124EVB,基于PAM8124 15W高效D类音频功率放大器的评估板
- DC135A,具有 LTC1560-1CS8、5TH ORDER 500KHZ 或 1MHZ 椭圆低通滤波器的演示板
- EV-ADF4355-3SD1Z,评估 ADF4355-3 小数 N/整数 N PLL 频率合成器的评估板
- 无线物联网、低功耗 Bluetooth®、4½ 位、100kHz 真正 RMS 数字万用表
- ISOVOLT33-EVB、分立等电压隔离式 DC-DC 转换器参考设计套件
- MIKROE-3338,基于 MPRLS0025PA00001A 精确补偿绝对压力传感器的压力 8 点击板