4月9日,商汤科技SenseTime完成6亿美元C轮融资,由阿里巴巴集团领投,新加坡主权基金淡马锡、苏宁等投资机构和战略伙伴跟投。新一轮投资方将为商汤提供更丰富的应用场景及更强的海外布局能力,加速AI技术落地和生态构建。在强敌环伺的人工智能领域,初创企业的窗口期只有三五年。商汤成立3年多,已在加速向一家AI平台型公司进化。
作者 | 孙静 严冬雪 四月
编辑 | 赵艳秋
来源|AI财经社(ID:aicjnews)
中国新经济领域最有腔调的深度媒体
业界都看不懂商汤模式。
成立3年多,这家人工智能初创企业烧了很多钱,做了只有谷歌这类巨头才会做的底层技术;铺了大摊子,宣称要将人工智能技术应用于上百个行业;而在国内业务还没有完全稳固时,又把触角伸向了海外;甚至企业本身还在造血时,已经开始资本运作,对外输血。
但它又足够吸引眼球。一家创业公司,垄断了150多位人工智能深度学习方向的博士,拿下了国内外400多家行业头部客户,连续3年间业务年化增长超过400%,估值更是超过45亿美元,成为全球估值最高的人工智能创业公司,并一再创下全球人工智能领域融资记录。
而在商汤成立前后,国内计算机视觉领域已暗流涌动。2011年,清华毕业生印奇和同学创立旷视;2012年,麻省理工学院博士后研究员朱珑归国创办依图;2015年,中科院走出的周曦在重庆成立云从。至2017年,商汤、旷视、云从、依图,由一众初创公司中脱颖而出,成为以计算机视觉为核心的人工智能领域下的独角兽。
记录这些公司的成长路径,如同剖析正在裂变中的商业样本。以商汤为例,创立前后的这些年,它大体干了几件事:从零开始,打基础,研发底层技术;从零到一,做项目,将人工智能技术落地;从一到一百,在行业中形成成熟产品。现在,它开始搭平台做生态。
从这一裂变过程中我们可以窥见,商汤是如何在行业窗口期,用高速迭代的人工智能技术,从多个维度去撬动行业市场,同时又以“逃逸速度”避开巨头射程,快速发展构筑起自己潜力巨大的商业领地。
看懂商汤
有一天,地平线机器人创始人余凯忍不住问商汤科技CEO徐立:你们确实投资这么大建设自己的超算中心?
超算中心特别烧钱。商汤研究员闫俊杰博士曾做过估算,按下那个标有“run”字样的按钮,一次数据训练迭代整体花费至少50万元。“ 我们有150多个博士天天在算法平台上按‘run’。”徐立笑称,这还不算每年追加的数亿元GPU集群采购预算。
不仅仅如此。在深度学习层面,国内绝大多数AI公司仰赖谷歌、脸书等人工智能开源框架Tenserflow和Torch。但商汤却砸钱自己搭底层框架。就好比一家软件公司宣布,要在Windows之外单独开发一套操作系统,这个想法有些匪夷所思。
商汤早期投资人、IDG资本合伙人牛奎光是最先感知到商汤志向的投资人。他记得,徐立用“猫脑”与“猴脑”作类比,对他解释商汤要做的事。目前这波崛起的人工智能,可以类比为“利用数据打造大脑”。如果说当下人工智能技术水平处于“猫脑”阶段,大部分公司正在做的就是“如何运用猫脑更完美地抓老鼠”;而商汤的兴奋点则是打造平台,把“猫脑”训练成“猴脑”,从本质上提升“大脑”的能力。大脑升级后,机器可以更快学习掌握更复杂技能。
商汤科技CEO徐立说,当下人工智能技术水平处于“猫脑”阶段,商汤在做的是把“猫脑”训练成“猴脑”,提升“大脑”的能力。摄影/王海森
徐立会不厌其烦地强调,“我们是中国拥有原创技术的人工智能平台公司,不是一家人脸识别公司。”他们的目标远大,因此需要做的事更多。
牛奎光还记得这家企业最初给他的独特印象。2014年,他看到一篇香港中文大学汤晓鸥教授团队的论文:应用他们开发的DeepID算法,面对两万张人脸的数据集,计算机的识别准确率首次超过人眼。这是个重要信号——意味着计算机视觉技术有可能商业化落地。他还发现,2011年至2013年期间,全球计算机视觉ICCV/CVPR顶级会议中,深度学习领域有29篇顶会论文,汤晓鸥团队占了14篇。牛奎光立即飞到香港,拜访汤教授。
在港中文多媒体实验室里,他看到五六个计算机识别技术的Demo,研究方向有意识地与实际应用结合,比如一个Demo是把图片变成印象派画风,这就是现在流行的美图功能之一。研究团队还反复强调原创,“我们是底层算法突破的源头”。这些均给牛奎光留下了深刻的印象。
2014年,IDG资本掷出数千万美元,助推研究团队走出实验室,到现实商业中寻找AI改变世界的钥匙。牛奎光当时承担了不小的风险,毕竟在2014年,AI产业还是冷门,谁也说不准,技术能否顺利转化为商业价值。
走出实验室,新一代技术公司该怎么走,是创始团队要思考的问题。在人工智能领域,曾有过前车之鉴。
比如语音识别领域——技术早已过了技术先发者的窗口期,各家再PK谁的准确率高出1%,没有实质意义。自从BAT集体意识到,智能语音是下一代人机交互的入口,必须抢占的市场后,动用资金、数据尤其是大平台优势,就可以分分钟碾压创业公司。语音识别领域再难出现独角兽或千亿市值的新巨头企业。
技术创业公司只有利用技术先发的窗口期,走入行业,或跟硬件结合、或跟数据结合、或跟流量结合形成产品甚至平台性服务,建立起壁垒,才有机会收割红利。
而且,这一切的前提是够快。美国硅谷技术创新同样遵循“逃逸速度”原理——在天体物理学中,逃逸速度是物体摆脱引力束缚、飞向宇宙空间所需的最小速度。“如果技术创新程度和未来发展程度,能达到一个‘逃逸速度’,你就能抓住时间窗口,形成一个很大的平台。”徐立语速、思维都极快,像极了这家公司的发展节奏。
打造这种“逃逸速度”,与商汤的早期储备紧密相关。联合创始人徐冰用“不计成本”形容当年的投入。融资到位后,他们在两个地方烧了很多钱:一是“人才垄断”,2014年至2016年,商汤用打包方案找来这个领域所有能找到的顶尖科学家,储备了大量深度学习领域人才,包括即将毕业的应届生,形成强大的人才梯队;二是搭建硬件计算平台,从英伟达买入6000多块GPU,自建超算中心,打造超强生产工具。
徐立认为,虽然硬件领域的摩尔定律在某种意义上已经失效,但大数据、算法却进入了一个新摩尔定律时代,而超算中心就是维持算法能以“摩尔定律”速度迭代必不可少的底层基础设施。
商汤的两笔投入,起初是极为冒险的行为,曾一度让公司面临资金链断裂的风险。但随着商业化的深入,优势也凸显出来。比如先于别人看到人工智能在某个行业突破工业红线的时间点,先于他人投入资源与某个行业头部公司合作搞产业落地;先于他人做出开源系统如谷歌Tensorflow当时无法支持的功能。
徐立举了一个例子,智能手机上有处创新功能“双摄像头实时拍照虚化”,商汤是国内唯一利用端到端深度学习技术提供技术的企业。因为该技术牵涉到一些新设计的网络,是现有开源框架并不支持的。
“我们进入很多领域时,开始好像有竞争,但是随着需求深化,技术要求提高,做着做着就变成了蓝海。”徐立说。
除了技术的独特性,技术落地,尤其是规模商业化,是所有AI公司面临的最大考验。
联合创始人杨帆分析说:商汤的策略是“1+1+X”,同时进行多元化布局,而非只赌注某个细分领域。这不仅有利于算法的全面迭代,还便于卡位竞争。毕竟目前安防、金融、移动互联网、手机、零售、自动驾驶都是竞争焦点,旷视、云从、依图虽各有业务侧重,但上述条线是商业落地的理想场景。
进入垂直领域,商汤的打法是先找头部公司,摸索AI技术落地,从项目到产品;然后再垂直打通某个行业生态,做平台化。“以安防领域为例,当我们把前端摄像头、后端云平台甚至芯片整个链条都打通,那就能做到最大的行业技术平台。”
当积累多个行业后,行业间的交叉反应就显现了,也有了做一个大平台的可能性。
IDG资本合伙人牛奎光在2014年投资商汤时,AI行业还是冷门。图片来源于网络
AI财经社问徐立,是否担心这种战略会成为行业公敌?“金庸迷”徐立谈起了武林:江湖上有很多门派重在练招式,你练刀、他练棍,互相不兼容。突然之间,有一个叫九阳神功的内功心法,专注于内功修炼后,刀、枪、棍、棒各种招式都能增强。
“商汤就是把九阳神功做成底层技术,重新定义刀、棍的练法,提供给行业,然后耍刀的继续练刀,耍棍的继续练棍,但都有更多进步。”徐立解释,这样就形成了一个强壁垒,同时为行业提供了武功,而非树敌。商汤定位是赋能百业。
这种定位,好比汽车界的博世和芯片界的英特尔和高通。
但九阳神功没那么好练。有段时间,在知乎上,有前员工评价商汤研究人员太多了,不是做商业公司的节奏,技术到产品的转化不够及时。
创业初期商汤经历过各种困难,后来在牛奎光牵线下,商汤获得浦发硅谷银行的一笔数千万元的贷款;任泉旗下StarVC“雪中送炭”地投了A+轮。靠这两笔救急钱,商汤筹建工程化部队,打市场。
直到2016年底,人工智能概念持续升温,市场涌现大量人工智能技术需求,商汤技术落地才在多个行业爆发。
落地之难
在规模商业化面前,技术优势并非一把万能钥匙。在人工智能新领域中,初创企业在商业化早期都走过弯路。
商汤联合创始人、001号员工,清华毕业生徐持衡回忆,2014年,刚从实验室走出来的商汤,先做了一款“软件开发包”当做产品方案推广。但当他们接触到中国移动、银联和借贷宝时发现,“对方提出的需求原来不完全与技术强相关,是技术衍生出来的一个应用方式或功能点。”
在走向市场过程中,从技术思维转变为产品思维,是商汤团队的挑战。
与借贷宝的合作,是商汤思维转变的一大开端。一开始,这家互联网金融公司对采用人脸识别技术进行注册和身份认证的功能非常满意。但半个多月后发现,有黑客通过非法获取的身份证数据及照片,攻击系统获得线上推广活动补贴。
攻击方式千变万化,有将照片做成Gif动画来混淆人脸;有将照片眼睛部位掏洞,做成一张眼珠会动的“人皮面具”。
但商汤技术团队能快速更新算法,两三天内就灭掉新攻击方式。攻防战打了将近两个月后,商汤几乎把市面上所有攻击方式都防御住了。
商汤联合创始人、负责工程团队的杨帆在这个过程中总结出两点经验:一是要有服务客户的心态,跟客户一起进行产品的快速迭代;二是一定要保持强有力的人工智能原创研发能力。
在过去电脑病毒的防御时代,每出现一种新的攻击手段,可能需要数月时间来解决。但得益于人工智能算法的快速迭代优势,如果引擎足够强大,只要有数据,再配上强大的超算能力,可能一晚上就能解决问题。这种速度,跟基于专家知识的算法设计完全不在一个量级。
2016年上半年,商汤想将这种线上人脸识别注册和身份认证方案,推广到整个行业市场。当时,其他竞争对手都拿不出一个足够好的防攻击方案。在早期跟借贷宝的合作互动中,商汤累积了关键技术和数据。得益于此,两年后商汤占据了70%的市场。
绑定头部客户在行业落地中创新,已是商汤的一个成熟打法。2017年,商汤与深圳公安局启动了城市规模化安防应用,将城市中几千甚至上万个摄像头的视频放在一起,在必要时查找某个特定人员在过去3个月中的城市轨迹数据。
与中国移动、银联和借贷宝的合作,是商汤从技术思维转变为产品思维的开端。图为商汤与中国移动合作的采用人脸识别注册和身份认证的设备。摄影/王海森
过去,行业只能做到对1个或10多个摄像头的视频查询。它对技术的挑战是全方位的。深圳公安局将未来三五年的需求与商汤技术进行结合。当这个产品打磨到一定程度后,就可以进行标准化,推广到全国其他大型城市。
商业规模化的摸索还在继续。在传统软件行业,目前已形成三大游戏规则:卖产品、卖服务、同时出售产品与服务。但在新生的人工智能领域,还呈现着一种混沌状态。
“从某种意义上来讲,我们提供的东西是无形的,它本身是一种全新的技术实现方式,并非具象的产品。”为商汤组建商务团队的副总裁柳钢解释。
是提供一项通用技术,还是打造一个能够囊括不同组件的产品,或是衔接不同算法不同行业的底层平台?在早期,团队也曾进行头脑风暴,但没有得出标准答案。
商汤尝试用另外一条路径来统一思想——赋能百业。一边紧贴行业需求往前走,一边摸索。
但对一家成立不到四年的创业公司而言,最先遇到的一个尴尬现实是:在它试图进入的各大行业中,有些早有传统巨头前辈盘踞。
比如手机行业,传统视觉公司已与手机厂商建立了成熟的合作关系。后入局者需要拿出点不一样的东西来。
小米手机的需求之一是宝宝相册——手机壁纸切换时,自动从相册里挑出自家宝宝的所有照片,轮流替换。这是人脸聚类。与人脸识别的“一对一比对”不同,人脸聚类要在上千张照片中汇聚出同一个人的相片。理解需求后,研究端、工程端一起开发,最后拿出了小米愿意买单的产品。
从人脸聚类开始,商汤已与OPPO签订全方位战略合作,打造以商汤科技SenseAR平台为引擎的OPPOAR开发者平台,推动AR在手机端的应用和普及。
除了这几个成规模的行业之外,商汤还在拓展新行业,比如智慧医疗、机器人、遥感、金融大数据分析等领域。
初创企业怎么能顾及这么多行业?带领商务团队的副总裁柳钢说,先要做好优先排序。
他还认为,“T”字形框架更适合自家公司:比如说在安防行业,做完一个项目,再做下一个项目时,需从同类业务提取出共性模式,积累出一套囊括这个行业70%~80%的共性方案,这能大幅提升效率。这就是“T”字的那一横,打造水平产品矩阵。
甚至不同行业之间,也能提炼出技术通用性。一个有趣的例子是,在安防市场“抓坏人”的技术,同样能用来“抓好人”,比如说新零售。2017年8月,苏宁第一家无人店“苏宁体育Biu”开业。
火热的无人零售店,关键技术之一是人脸识别。图为苏宁无人店“苏宁体育Biu”。摄影/王海森
顾客从入店到结账付款,仅需最初的一个“刷脸”步骤。“你会发现,这里面很多关键技术,跟我们已具备的安防识别技术有很大的通用性。”
在“T”字的那一横之上,围绕各垂直细分领域,“要往前再多走半步”。这就是行业的纵深理解。比如在互联网行业中,人脸识别技术之上,加上增强现实技术。
有时候,这多走的半步不光是技术,还可能是商业。
在直播平台,广告商资源已放到商汤平台上。商汤、直播平台和第三方广告供应商能搭建起一个生态,在直播过程中更好地植入广告。再比如,网吧或酒店,刷脸身份认证前后需要几秒钟,把广告资源投入到线下,在这个刷脸机上投放出来,又会生产出额外价值。
在这种思路之下,商汤尝试在网吧免费推广身份核验机,后续广告费分成,也能更快地打开一个市场。
“当做得行业越多,行业之间形成交叉成熟效应,机会就越多。”商汤联合创始人杨帆说,这种考量下,如果进军一个新行业市场,不会带来太多额外成本,也不会导致资源过度分散。
商汤同时还在使用和完善自动化工具链。“高生产力工具代表着创新速度和能力,实现有限人员带来足够大的增长。”
但市场前景仍有瓶颈。人工智能在各个行业落地是一个不断探索的课题,这是一个迭代和渐进的过程。普华永道会计师事务所对AI视觉识别类技术公司的落地市场有一个大致估算,他们认为安防的盘子最大。从2016年到2020年这5年,将保持90%的年复合增速。但在其他行业,还很难再现一个全面开花的盛况。
在这种背景下,商汤已把眼光投向海外,摸索更广泛的边际。
海外开局之战
2015年一个学术年会上,汤晓鸥和徐立遇到了劳世竑。劳世竑也是计算机视觉的一位重量级专家,上世纪80年代公派到日本留学,时任日本欧姆龙人脸视觉组技术负责人。
上一篇:Intel独显将瞄准游戏:首发MCM封装
下一篇:三星首次公开投资区块链,布局早在三年前
推荐阅读最新更新时间:2023-10-13 10:28
- 热门资源推荐
- 热门放大器推荐
- 欧洲三大芯片巨头,重新审视供应链
- 一场IC设计业盛宴!10场论坛 200位演讲嘉宾,300+展商亮相2万平米专业展会!
- 富昌电子于杭州举办技术日活动,聚焦新能源“芯”机遇
- 消息称铠侠最快明天获上市批准,市值有望达 7500 亿日元
- 美国政府敲定对格芯 15 亿美元《CHIPS》法案补贴,支持后者提升在美产能
- SK 海力士宣布量产全球最高的 321 层 1Tb TLC 4D NAND 闪存,计划 2025 上半年对外出货
- 三星电子 NRD-K 半导体研发综合体进机,将导入 ASML High NA EUV 光刻设备
- 芯片大混战将启:高通、联发科涉足笔记本,AMD 被曝入局手机
- Exynos 2600 芯片成关键,消息称三星将打响 2nm 芯片反击战