做企业,他是教授创业成功的代表。2001年与合伙人创办的科技公司Data Domain,创造了可删除重复数据的存储器产品线,两年后替代了50%以上的数据中心的磁带库产品,在同类产品中一直保持60%以上的市场占有率,78%以上的毛利率。2007年Data Domain在纳斯达克上市,2009年被最大的数据存储公司EMC以24亿美金收购。
他就是普林斯顿大学计算机科学系教授李凯。尽管在学商两界都取得了很多人难以企及的成功,但也和同时代的人一样经历过淬炼人生的坎坷,本应美好的青年时代在文革的动荡中渡过,16岁分配到长春第二有色金属冶炼厂当工人,依靠自学争取到上大学的机会,后考入中科院就读研究生,成为文革后第一批赴美自费留学生,32岁时,获得耶鲁大学博士学位,之后于普林斯顿大学任教。
创业成功之后,李凯又重新回到实验室,投入多个前沿科技项目。他与李飞飞教授(现斯坦福大学人工智能中心主任)发起的ImageNet项目,建立起了比以前大三个数量级的可共享视觉数据库,为全球的科研者提供了迄今最大的机器学习及视觉识别的知识库,颠覆了传统的视觉识别算法,推动了卷积神经网络(深度学习)的发展,成为当前最有效的机器学习的方法。ImageNet团队每年的大规模视觉识别挑战赛现被学术界和工业界最有价值的竞赛。
在网易未来科技峰会前夕,李凯接受了采访。有着在美国从事科研30多年的经验,又对中国的科技进展有着敏锐的观察,李凯从一个全新的视角分享了如何才能使科研成果取得商业成功、以及如何才能做出真正有价值的科研成果。
“最重要的是市场机会”
按照惯常的逻辑,Data Domain的成功应该是一个先有核心技术,然后将其技术商业化的故事,但李凯告诉媒体,事实并非如此。
“最重要的是市场机会。”在2001年学术假期的夏天,他看到录音带和录像带都在被基于磁盘的产品所代替,数据中心用于数据备份的磁带库也应该被基于磁盘的产品代替,这其中蕴育着巨大的市场机会。洞察到这一变化,李凯决意停薪留职,开始了创业之路。“我是在了解到应该创造的产品后,才开始开发需要的核心技术。”李凯认为,这跟国内科技公司创业的普遍路径并不相同。
Data Domain是在“911”事件一个月后启动的,但是对于创业者来说抓住时机非常重要。当时股市大跌,投资机构压力很大,Data Domain为了得到投资机构的支持,牺牲了大量股权,但没错过市场机会,最终成为了行业的独角兽。
有了市场机会之后,最重要的成功因素还是人,李凯总结,Data Domain之所以成功最关键的是——“聚集了最有才能的一批人,”包括合伙人、工程师、管理人员以及风险投资公司。
成功的第二个关键因素是对市场上的客户有很好的了解。根据市场需求设计出好的产品线,每季度,每年都要不断地推出新功能或产品,最终才能够成为市场的领先者。
第三则是核心技术要充分利用工业界的主流技术趋势,才有持久性的竞争。Data Domain就利用了计算机主机芯片多核的趋势不断地改进产品性能,利用云存储的趋势提供远地防灾数据备份服务。数据增长的趋势大约每5年增长10倍,而互联网带宽的增长趋势远小于少于数据增长率,只有大约每10年增长10倍。为了解决大数据传输带宽的问题,远地数据备份需要新的数据压缩算法从10—30倍提升到50-100倍。
第四个关键因素是要建立新的细分市场,成为市场的领导者。Data Domain在2007年建立了重复数据消除存储市场,一直保持60%以上的市场占有率。
“把数据变成知识是最重要的趋势”
Data Domain创办之后,李凯2004年左右回到了普林斯顿大学。虽然在公司做创新工作很有意义,但李凯发现自己还是对培养学生更感兴趣。他认为“学校创造的主要产品是学生,科研是培养学生的过程。”他愿意培养有科研能力的学生,“跟学生一起做科研项目,产生一些科研成果,推动科学和技术发展。”
李凯认为,未来在计算机领域,目前能看得到的有三大趋势:
第一,很多服务都挪到云端。其中包括计算能力、数据共享、企业管理、商业服务、银行、社交等。
第二,把数据变成知识。对于大数据的挑战在于,如何加速科学知识的发现和发展。数据增长速度很快,每15年增长1000倍,如何能让科学知识的发现和发展也15年增长1000倍是最大的挑战。现在很多科研工实践比如机器学习,创造知识库、支持深度学习的硬件等,都是为了这个挑战。
第三,大量的软件和硬件设计开源。由于源代码可以共享,推动了整个工业界发展。比如Linux和安卓都是开源的软件,是很多做系统和做手机及平板电脑的公司很快做出高质量的产品。
李凯教授目前的科研项目主要是和把数据变成知识的趋势有关:
第一,是关于创造知识库。也就是前述ImageNet的项目。在有ImageNet之前,计算机图像识别领域,更多人是投入到对算法的研究当中,知识库的构建是个短板。李凯打了个比方,就像只有小学一年级的课本,学习方法再好,学出来也还是小学一年级的毕业生。“算法需要有比较大的数据知识库才能起作用。深度学习的算法上世纪80年代就提出了,直到2012年才开始闪光,就是因为以前知识库太小,有效的算法发挥不出来。”李凯告诉网易科技,知识库大了之后,反而发现很多算法效率低。ImageNet这个项目,对计算机图像识别的研究起到了颠覆性的推动作用。
第二,是关于脑神经科学的项目。这个项目是和普林斯顿大学脑神经科学的科学家合作,研究大脑工作的原理,搞清楚大脑的不同部位之间是如何通讯的。研究的结果可以用来训练人集中注意力,或者帮助诊断脑震荡等,价值巨大。未来,对大脑工作原理的理解、对人工智能的发展至关重要。
第三,帮助医院做数据分析,用大数据帮助精准医疗,从而对疾病做出预测。李凯举了个例子,比如癌症患者,能否在被感染的初期就通过血液的化验等识别出来,对类似的患者,从机器学习的办法推断出来,从而及时加以干预,将对医疗有巨大的帮助。
上一篇:出门享受总统待遇,无人机为你撑伞
下一篇:会扔垃圾会洗碗,这款机器人堪比保姆
推荐阅读最新更新时间:2024-05-03 00:30