离开谷歌,深耕AI 18年的行业老兵张本宇想用AI赋能传统行业
文 | 李诗
来自雷锋网(leiphone-sz)的报道
近来,吴恩达、林元庆等AI界大牛纷纷辞职创业,想要以AI赋能传统行业,受到极大的关注。他们这些有着领先的AI技术水平、丰富行业经验的大牛投身创业的思考和选择,对创业者和行业人士都有着极大的价值。
雷锋网了解到,云脑科技CEO张本宇也是一位重量级的创业者。在2015年,张本宇就率先创办了云脑科技,致力于在AI与传统行业之间建立桥梁。由于其平日较为低调,很少详细说明其创业的动机和他对行业的思考,此次,雷锋网在张本宇从美国回来的间隙,特意约其见面,深入了解了他选择AI+传统领域创业的原因,云脑科技目前的新技术和新进展等,期望促进行业交流。
张本宇,深耕人工智能领域19年,申请及授予150项美国专利,在国际一流期刊及会议上发表的45篇论文已被引用超过6000次。创新工场AI工程院副院长王咏刚将其评价为“人工智能华人科学家中排名前10 位大牛之一”。
人工智能19年老兵的历程
谈起“人工智能华人科学家中排名前10位大牛”这个称号,张本宇显得十分不好意思。他说,毕竟自己进入AI早,也发表了很多论文,所以有些优势。对于这个称号不必太认真。
和一些踏着AI风口入场的人不同,张本宇是AI科班出身,在AI领域一待就是19年。
张本宇在少年时就迷上了人工智能。张本宇第一次接触人工智能,来源于一款打着“人工生命”旗号的小游戏,通过编写程序,可以让一只小鸟沿着一定规则向前飞行,这个有意思的小游戏使得人工智能在张本宇心里扎下根。1995年,张本宇通过高考,进入了北京大学计算机专业。随后,1999年,他在北大攻读了人工智能硕士,踏上了AI的征程。
大学期间,张本宇曾在互联网领域的小黄埔“ChinaRen”社区工作,这个社区培养了新浪、搜狐互联网门户的那批人,例如后来的王小川。读研期间,张本宇首次创业,与好友一起打造了一款融入AI技术的语音聊天室产品。这次创业的经历,也为他现在的创业埋下了一颗种子。
张本宇回忆道,在读书的时候,人工智能还处在低谷时期,即使是在北大,张本宇也只能学到一些很老的方法。2002年,张本宇从北大毕业,去了微软亚洲研究院(MSRA)。“2000年前后国内做计算机相关的研究最好的就是MSRA,当时对研究感兴趣的人基本都在那边。” 在微软亚洲研究院期间,针对“如何让机器学习人工智能来帮助解决搜索”、“如何让机器通过代码处理大量的数据”这两个问题,张本宇花费了长达六年时间钻研国际最先进的论点,积累了深厚的学术知识。
2008年,张本宇期望能将学术付诸实践。张本宇先是在Google工作,从事搜索广告优化。2010年,Facebook社交帝国初具雏形,其大量可用于AI研究的社交数据吸引了张本宇。据称,他曾经带领团队开发了Facebook中占据利润来源90%以上的信息流广告业务。在2013年,移动互联网迅速崛起,Google成立新项目Google Now,致力于在手机中加入真正的智能,张本宇又被挖回Google Now项目。在吴恩达看来,AI诞生于数据,张本宇的工作经历几乎就是追着数据在跑,哪里的数据多,数据有价值,他就去哪里。
相对于计算机视觉等AI方向,张本宇所在的数据挖掘、语言处理领域成熟得要早一些。在Google做搜索、在Facebook做信息流和推荐,都与互联网和用户接触紧密,张本宇的研究和工作也一直围绕着如何用AI为消费者创造价值,这些需要研究用户行为数据、有时间先后关系的序列数据(sequence Data)、文本数据等。这些经历为他日后的创业奠定了技术和商业的基础。
2015年,他离开谷歌,毅然选择回国创业。
“2015年,AI已经成熟,可以走出互联网去落地更多的应用场景,或者说AI已经能够跳出这些少数巨头。”张本宇回忆到,其实在研究生期间创业后,他一直都有创业的想法,每次换工作的时候都是有创业的机会,但是此前AI还不成熟,如果出来创业或许只能做一家以数据分析为核心的咨询公司。
对于张本宇来说,2015年是很好的创业时机。首先,深度学习已经具备向互联网之外渗透的能力;其次,国内大数据基础设施的建立已经有了几年,许多行业已经是属于有数据的阶段,同时大数据也有了一定的计算基础平台;最后,AI算法本身已经发展到了一定的阶段。
这时候,张本宇觉得,是时候了。于是,他和联合创始人龙志勇一起创办了致力于将AI与传统行业连接的 “云脑科技”。
AI中间件:连接AI技术与传统行业
张本宇希望把AI从互联网带出来,去升级传统行业,那他必然会面对的第一个问题就是:从互联网的数据中生长出来的人工智能,与传统行业有极大的断层。
目前,我们已经熟知了百度的智能广告平台、今日头条的精准推荐,这些都完全基于互联网上的用户数据。传统行业虽然也有数据,但是大多数都分散在不同的时间和场景中,难以利用。张本宇发现,不同的行业在利用AI时有一些共性的问题: “数据如何选择和导入?”、模型和技术如何组合?”和“输出如何集成到业务?”。
在看到这些问题以及共性后,云脑科技定位为——打造人工智能与行业的桥梁。借用软件领域的术语,云脑科技将这个桥梁称为“中间件”。在与不同的传统企业的合作中,云脑科技主要负责AI数据处理、建模策略、业务集成,并将其打造成可以组合的行业AI中间件嵌入到提供给终端客户的PaaS/SaaS平台或者服务中。
目前,云脑科技已经推出了四款AI(X)产品,覆盖通信行业、金融科技、人才教育、能源制造四个领域。为了更好地理解云脑科技的业务模式,张本宇详细介绍了云脑科技与银联合作的案例。银联有大量的用户行为数据都是极难处理的Sequence Data,正好是张本宇最擅长的领域。云脑科技基于银联的消费数据,自动学习并动态更新用户全景个性化智能模型。利用这一模型,可以根据银联已有的消费用户群,自动发现相似的新用户,从而以更低的成本,更好的转化率来获取高价值顾客。当时云脑科技与传统的协同过滤的算法进行过对比,人工智能的推荐方式带来的到店率提高了5-10倍。目前,在云脑科技与银联合作提供的“智慧触达Farcaster”平台上,已有汽车、房地产、化妆品等行业客户。
为了深入不同的行业,云脑科技内部有来自各个传统行业的专家,与AI技术专家一起为传统行业找到解决他们的痛点的方案。
AI技术优势:保护隐私、模型可解释
云脑科技作为一家人工智能行业平台公司,在深度学习、增强学习、NLP、知识图谱等技术上都已经有大规模项目成功实践经验。但是,张本宇这个人工智能老兵出征创业后,并不打算一直依赖于带出来的“存货”,云脑科技还在不断探索新的专利技术。在此次的深度访谈中,张本宇还介绍了两大新技术。
当然,这些新的专利技术也是围绕着同一个核心:如何让AI更好地与传统行业结合。
张本宇谈到,AI与传统行业结合需要攻克两大难点:数据隐私保护与深度模型可解释性。
云脑科技的数据隐私保护专利被称为——BrainSync专利技术。数据的取得来源分为终端的隐私数据与云端的公开数据。传统方法是终端上的数据先上传至云端,随后利用云端统一到的所有数据,训练出一个模型。因为能够获取到大量的有效数据,训练出的模型才会比较精准。但在这种条件下,人们终端设备的信息隐私得不到保障。
云脑利用独家的BrainSync专利技术统一“小脑”模型成为一个“大脑”。由于终端模型中是无法提取到原数据的,用户的隐私既能得到保障,训练到的模型“大脑”又不失精准。可以说,BrainSync解决了数据隐私与模型精准此消彼长的矛盾。
第二个技术是深度模型可解释性。虽然深度学习模型一般被当做黑箱来使用,但是很多场景下要求对AI决策的可解释性。利用AI给传统行业做决策时,很多用户都希望能知道AI为什么能给出这个答案,做出这个选择。就像是美国的法律要求自动驾驶系统能够为自己的操作决策给出合理的解释,例如当时为什么没能避开行人。还有一个更为极端的例子:如果AI决定要割去病人的一颗肾,但并不能够给予出任何理由,它得出的结论便不能被信服、不能被采用。
云脑科技针对这类需求,在模型上的设计进行了改进,在保留了模型表达能力的基础上,增加了可解释性。张本宇以云脑科技在招聘上的合作举了一个例子。一个JD的一条要求是: “喜欢追求新事物”,而一份求职者的简历描述为:“我知道虽然我的接受能力是一般的,但更重要的是,我喜欢学习新的东西,那样使我快乐”。云脑科技将简历中的这句话按照不同的单元形成不同的字段语义——“虽然接受能力一般” “接受能力一般但喜欢” “一般但喜欢学习新”“喜欢学习新的东西”,这些语义分别与“喜欢追求新事物”的卷积相撞,“喜欢学习新的东西”这一语义成为最佳匹配。类似这样,JD上下文的每一句话都能够与求职者简历上下文的每一句话进行精准分析,并得出最终的匹配值。这样,云脑可以帮助HR推荐到匹配值最大的简历。这就意味着,在招聘行业中,云脑科技的产品不仅能够帮助HR找到最符合的应聘者、帮助应聘者找到最符合的HR,同时还能够给予双方一份详细的建议理由。
寻求新一轮融资
云脑科技目前在中国和美国均设有团队。张本宇的美国团队负责核心算法研发,联合创始人龙志勇负责的中国团队则直接和行业客户对接。
雷锋网与张本宇的这次深入访谈也是恰巧抓住了他回国开会的间隙。雷锋网也了解到,云脑科技目前的业务体量已经达到千万量级,他们正在寻求新一轮的融资。
在此前,2015年,云脑科技的技术研发团队在硅谷成立时,获得了峰瑞资本领投的千万级天使轮融资,2017年完成由翊翎资本、美国中经合集团等共同投资的数千万元人民币A轮融资。
对于下一轮的融资,张本宇表现得更加自信,他希望能够寻求与自己的理念一致的投资者,能够在AI上有所坚持。
雷锋网诚招编辑、运营、兼职、外翻等岗位
详情点击招聘启事
◆ ◆ ◆
推荐阅读
关注雷锋网(leiphone-sz)回复 2 加读者群交个朋友