腾讯广告,一个可能被低估的AI业务
李根 发自 腾讯滨海大厦
量子位 报道 | 公众号 QbitAI
“这样的比赛还可以 more and more.”
在答辩颁奖后,两位AI权威如此慨叹。
一位是伊利诺伊大学芝加哥分校杰出教授俞士纶(Philip S. Yu),另一位是亚利桑那州立大学计算机科学与工程教授刘欢(Huan Liu)。
他们评价,无论是机器学习还是数据挖掘,光从教材和学校解决问题,太过单薄,所以他们殷切希望国内产学研结合的大赛能多多益善。
而且腾讯愿意提供脱敏数据集,提供计算平台和丰厚奖励。
不论是经过脱敏处理的真实业务数据,还是接地气的真实应用场景,都可以让更多人才学以致用,甚至能让那些名校之外的学生,也有机会用实践成绩来证明自己——这一价值,俨然早已远远超出了比赛本身。
让他们如此激动的是“2019腾讯广告算法大赛”。
三年磨剑:业务数据,真实场景
腾讯广告算法大赛,已是连续第三年举办。
今年的赛题是“广告曝光预估”,一项腾讯广告在真实业务场景中面向广告主提供的重要服务。
所谓曝光预估,是在广告主创建新广告和修改广告设置时,为广告主提供未来的广告曝光效果参考。
通过预估参考,广告主可以根据曝光预估结果提前调整出价、定向、时段等设置,结合自身的投放预期选择最适合自己的设置,而不是投放几天之后再去修改,能避免盲目的优化尝试,有效缩短广告的优化周期,降低试错成本,使广告效果尽快达到广告主的预期范围。
但打造这样一个算法模型,并不轻而易举。
从腾讯广告的实际场景来说,效果广告主要是展示类广告,背后的算法引擎,本质是一个推荐框架。
技术角度而言,它首先将广告设置的人群定向、投放时段、选择的流量版位、竞价方式、出价等广告业务语言来转化为描述广告覆盖用户人群的范围大小以及竞争环境激烈程度、自身竞争力相对水平等可量化的数值指标。
通过对历史中各类广告在竞价系统中的曝光历史进行训练,腾讯广告需要学习出竞争环境的变化趋势以及广告竞争力水平和最终曝光效果的隐藏联系,达到预估广告未来曝光的目标。
而且这也是产学研结合的最佳演武场。
当前大部分机器学习或人工智能的问题,目标方向都是“预估”。
本质上都是通过对已知的历史记录中提取和预估目标相关的特征表达,并训练出能拟合出最接近预估值的模型。
具体训练过程即通过损失函数的计算和迭代优化方案,在有限的解空间中搜索误差最小的最优解的过程。
也是对目标编码、特征统计、数据挖掘、历史平移,模型选择等一系列基本功的考验。
因何而来,往何处而去
腾讯广告副总裁罗征说,本次大赛既是通过业务场景创造产学研交流机会,也能通过比赛引起更多人才关注,同时也是企业社会责任的一部分。
可能易于被忽略的是,腾讯广告的数据处理量和对业务场景的多元应用需求,都位于业界前列。
一方面是腾讯庞大的体量和社交媒体地位下,广告数据非常庞大。加之服务的业务和应用场景很多元, 广告主对广告效果也有不同的需求,这就对数据挖掘、特征学习和模型算法等机器学习应用带来极大的挑战。
罗征也说,很多高校学生知道搜索和推荐系统需要机器学习的加持才能锦上添花。
但可能不知道广告和营销业务,同样是机器学习应用的重要战场。
首先,腾讯广告业务面对的数据量非常庞大,本身就为机器学习提供了得天独厚的数据基础。
其次,广告业务的评估目标,非常清晰,结果反馈一目了然,能更快帮助机器学习进行模型优化和迭代。
最后,技术的不断精进对于业务价值的体现也显而易见。算法越好,模型越强,对于客户(广告主)和用户的体验,都是双提升。
当然,技术为业务所带来的价值,也是腾讯广告可以将算法大赛持续举办下去的驱动力之一。
实际上,本次大赛前后历时3个月,共有海内外10,571人参加——如果从数据挖掘领域来看,已是全球参赛人数最多的比赛之一了。·
而腾讯广告除了提供资源——提供真实业务场景下经过脱敏处理后的数据集,与腾讯云合作提供智能钛机器学习平台,并且拿出真金白银奖励优胜者。
所以搭台举办算法大赛,并不比写代码调模型简单。
但罗征认为这一赛事值得做,而且想基于大赛提供更友好的算法交流环境,比如将赛题数据集面向学术研究开源。
这位腾讯广告副总裁博士学成于MIT计算机系,在2012年加盟腾讯前,曾在谷歌公司任职八年,负责AdSense广告系统、谷歌字典等项目的研发管理工作。因此,他深知产学研结合对于产业和人才推动的重要意义。
而且从腾讯广告角度,通过算法大赛,也是吸引更多优秀人才,以及向客户展示业务技术实力的方式之一。
但无论如何,这样源自产业,学界受益,产学研都得到推动的比赛,已经展现出越来越多的持续良性循环。
△ 伊利诺伊大学芝加哥分校杰出教授
俞士纶(Philip S. Yu)
从美国远道而来的大赛评委嘉宾:伊利诺伊大学芝加哥分校杰出教授俞士纶(Philip S. Yu)和亚利桑那州立大学计算机科学与工程教授刘欢(Huan Liu),都为此感慨中国AI面临的历史机遇。
一方面,越来越多的中国公司愿意反哺学界,出钱出资源举办这样的大赛,可以让更多人才得到产学一体的锻炼机会,学以致用。
纵观全球AI发展,神经网络早在80年代就已发明,但只有ImageNet等数据集和比赛的出现,才真正意义把深度学习推向了最前线。
而中国公司经过互联网和移动互联网时代发展,现在有能力和实力可以做更多事情,龙头公司如腾讯愿意做这样的事情,还能起到带头作用,利于整个业界。
另一方面,这也潜藏着中国人才的机遇。“中国人才聪明又勤奋,但之前理论功夫扎实,而缺乏这样的工业锻炼,在全球化竞争中吃亏在所难免。”刘欢教授就在分享中感慨,求学海外和发展过程中,他有幸遇到俞士纶教授指点和提携,才不断在业界站稳脚跟。
△ 亚利桑那州立大学计算机科学与工程教授
刘欢(Huan Liu)
但现在如腾讯广告算法大赛,本身就在创造一个人才交流和互助的平台,工业界或更大平台里需要的合作能力、领导能力,都可以在其中得到锻炼。
所以大环境不断利好,没有理由不相信,这一代中国AI人才成长可以更快、更强、更全面。
AI萌新,生逢其时
这种更快更强更全面的AI养成环境,本次参赛选手也感受颇深。
本次“终极之战”的答辩现场,共有10支从复赛脱颖而出的队伍上台经受最后检验。
与往年不同的是,今年除新增了外部评委外,还进一步提供现场打分环节,评委对选手的现场风采、代码质量及比赛策略进行现场亮分,为选手们提供公平、透明的竞技平台。
不过这复赛10强,身份背景也颇有意思。
并非所有人都来自高校,也并非所有队伍都是计算机背景。
比如参赛队伍ddw,三位队员都是厦门大学经济学院统计系的学生,他们首次参加AI相关竞赛,虽然缺乏代码经验的他们也在比赛中吃了不少亏,但还是凭借对问题的准确理解,从解决问题出发,找到优化之路,最终获得第五名的好成绩。
还有电信子公司甜橙金融的DataAI团队,也花费了业余时间参赛。他们的团队组成也是十分有趣,甜橙金融的老板傅剑文带着他的员工章建森及陈心童组成队伍,并且在决赛获得第四的好成绩。队员们在甜橙内部主要负责风控算法,今年看到“预估”类话题,决定来一试身手,还自谦说“希望认识更多大佬”。
虽是谦虚,但交流和结识朋友确实绝非先例。
在整个过程中,很多团队并非从一开始就因为认识而组队,不少人则是“不打不相识”,因为参赛而结缘,进一步在赛事交流群内找到志同道合的队友一起作战。
所以也能看到不少跨校,甚至跨国的组合。
本次拿下第七名的“人工智障”团队,核心三位成员分别来自法国巴黎、苏州大学和电子科技大学。
在巴黎工作的陆劼介绍说,看到大赛介绍后,希望在工作之余试一试,先是报名参加了比赛,再在群内找到了两位志同道合的同伴,携手合作一路闯入决赛。
由于天各一方,他们在决赛答辩前都保持远程线上交流,本次他也是专程从巴黎赶赴深圳,和他的好队友进行“网友面基”。
最后他们的方案斩获决赛第七,大赛给他们留下的是一段跨国跨校协作的回忆和友谊。
此外,腾讯广告算法大赛也让一些对AI和机器学习等感兴趣的同学,验证了研究兴趣,找到了持续钻研的信心。
2019腾讯广告算法大赛和答辩单项奖的双料No.1,是来自哈尔滨工业大学二年级硕士生刘育源、中山大学微软亚洲研究院联合培养博士生郭达雅及武汉大学二年级硕士生王贺组建的三人团队——“鱼遇雨欲语与余”。该队伍从复赛第一周就取得了十分亮眼的成绩。这支配合高能的队伍,终于在终极舞台得到最高嘉奖。
而且这支团队,也在解决问题中“不知不觉”探索了AI学术前沿。他们在算法模型打磨中,用了各种维度的数据,最终在结果上比其他队伍更强。
而根据俞士纶教授的评价,他们已经在有意无意使用“广度学习”的方法。
这波AI浪潮复兴以来,深度学习人尽皆知,但其实在另一层面,广度学习也正在带来新的可能,它们一齐把AI发展带向新高度。
所以产学研一体,有时听起来像是高屋建瓴的指导方针,但在腾讯广告算法大赛上,选手们所展现出来的成果也证明了产学融合的必要性。
这让主办方和参赛选手都收获更多成就感。
腾讯广告の技术缩影
其中罗征,自然是对腾讯广告算法大赛最富期待的那个人。
他说,腾讯广告技术团队,应该是鹅厂内部对机器学习和算力要求最高的团队之一。
而且腾讯广告虽然是重要的业务团队,但也满怀技术探索之心。
他们每年拿来做算法大赛挑战的赛题,不仅在实际业务中具有重要地位,而且自身所探索的算法在行业内也属于业界前沿——算是程序员们不断自我挑战的方式之一。
罗征透露,内部还会发起一些有趣的研究,比如让AI系统去评价一条广告,或是如何评判一个广告创意的“美感”,再或是从视觉化上做一些相应的算法探索。
窥一斑而见全豹。无论是算法大赛举办,还是内部兴趣研究,都是腾讯广告技术积累和信仰的缩影。
罗征认为,AI等新技术带来了机遇,让广告等数据量丰富的领域可以做得更好更有意思,他们也希望能够打磨出更高水准的技术,一方面是让广告主体验更流畅,广告能效更高,另一方面也让用户体验更人性。
不过鹅厂风格低调,如果没有此次的腾讯广告算法大赛,可能更多人还一直在低估如此重要的AI战场。
腾讯20周年前夕迎来了“930”组织架构变革,腾讯广告业务被进一步整合,并且强调技术在业务和产品中更重要的作用。
而在今年5月的腾讯智慧营销峰会上,腾讯总裁刘炽平把腾讯广告的战略升级形容为“广告+”,其中共要实现四个“+”,让营销服务无论对广告主,还是对消费者,都可以提供更好的价值。而其中第一个“+”,就是要“广告+技术”,通过AI等技术,帮客户实现有效投放,减少浪费,同时有更高的用户体验。
而且广告业务,还在巨头腾讯的营收中越来越重要。
在腾讯2019 Q1的财报中,网络广告业务的收入同比增长25%至人民币133.77亿元。社交及其他广告收入增长34%至人民币98.98亿元,并且从增长趋势来看,还会不断稳固向前。
所以,如果提到腾讯和其技术应用,未来能联想到的,恐怕不仅仅只有各大AI实验室了。腾讯广告,一个可能被低估了的AI业务,正在越来越瞩目。