狄更斯在对资本主义高速发展的描绘中,有一句经典语录:这是最好的时代,也是最坏的时代。
一个新事物的高速发展所带来的社会变革,几乎是“危”、“机”并存。云知声CTO梁家恩认为,作为近年来最有关注度的话题——人工智能,也正处于“最好的时代,也是最坏的时代”。
在云知声首届AI技术开放日上海站的分享中,梁家恩抛出这个观点,并进行了解释:“为什么是最好的时代?产业机会已经摆在眼前了。为什么说是最坏的时代?假如还停留在技术AI的时代,那这个时代会进入第三次泡沫和寒冬。”
此次的AI浪潮并非首例,这也让很多从业者更加“小心翼翼”。“过去AI经历了三起两落,这些都是在学术AI里发生的,其实真正的深度学习带来的产业AI才开始。”他表示,产业AI所面临的挑战和问题远远比学术AI多,“学术解决的是求真的问题,而从产业角度来说是要改变这个世界。”
简单来说,梁家恩认为目前已经处于产业AI的时代,单纯的炫技和刷榜已经不是这个时代所需。“未来应该是走向万物智联的时代,而其中最大的捷径则是解决产业问题和创造用户价值。”他认为,那些厚积的AI实力有了喷发的机会,理论热潮已经褪去,裸泳的人工智能企业将无处可藏,真正秀“肌肉”的时候到了。
那么如何真正的解决产业问题并且创造用户价值?梁家恩分享了云知声对于该问题的解读以及经验。
首先,产品要能够用到产业具体场景重的基础是,产品足够“硬核”且“适合”。所以在技术能力和产品体系等方面,需要有完备的能力。云知声在2012年完成了语音云、深度学习及超算平台的三驾马车构建。在2014年,云知声提出了“专注物联网人工智能服务”的定位,以及面向物联网的“云端芯”概念和产品体系构想,并且在医疗、教育等多个领域的行业应用方面进行了实践。目前,云知声已经构建起了包括异构超算平台、AI芯片、语音图像交互算法等一系列AI体系。
梁家恩喜欢用两个关键词来概括云知声的AI哲学。第一个词是“全栈”。“光有技术不行,我们需要把技术创新和产业闭环打通,这样才能带来产业的变革。”他说。第二个词是“硬核”。他表示,全栈可以从两个维度来解读:一是贯通产业价值闭环,即从零到一和从一到十的过程;二是从技术体系来看,云知声最终想打造的是多模态拟人化系统。尽管云知声是依靠语音技术起家的公司,不过,目前,其全栈闭环已经打通,包括感知、认知以及AIoT芯片。
此外,梁家恩透露了一组数据:在产品落地方面,云知声在家居方面已经有超过200万的出货量,车载方面有1800万的车载终端,儿童玩具机器人超过400万台,医疗方面有超过600家的三甲意愿,有2.7亿日调用量。
当然,比较有趣的一点是,在市场上,强调“全栈式”AI的企业不只云知声一家。近来年来,随着企业对场景的理解逐渐加深,以及资本对全能型企业的青睐,不论是跑在人工智能赛道前面的,还是一些新兴的初创企业,都把自己的业务往全栈式模式发展。不过,一个算法应用公司要摇身一变成为集算法、芯片、开放平台及硬件产品为一体的全能型,并非是易事。那么,“全栈式”是否会变为一个噱头?
梁家恩说:“每个浪潮来时都有泡沫。”他表示,一些公司可能并没有想明白芯片落地到底有多大的作用。但是云知声很早就已经想清楚并做了验证。“所以认识不同,大家做芯片的想法和套路就不一样。”他认为,在技术型创业路径上,想靠投机取巧是没那么简单的。“这不是玩模式和应用的,从技术层面来讲,想法很重要,但是要把产业变化变成现实才是竞争力。”他补充道。
什么样的团队适合做“全栈式”?梁家恩认为关键是要有决心,此外还需要够多的资源和扎实的技术功底,并且对产业有足够深的判断能力。”用学术做AI是不行的。而且,决心不强,你肯定也不会愿意突破。”他说。
当然,除去一些“比较迷茫”的参与者,在全能型选手中,也不乏众多实力派,云知声的优势是什么?梁家恩表示,云知声主要有两大方面的优势:一是在语音交互里整个技术体系里,其有一套完整体系的想法,在规划方面有较大优势;二是目前市场上较多的类似企业都是集中在图像领域,而云知声过去最大的应用积累是语言交互的点比较多。与图像应用相比,通过语音整合多模态的能力更强。从图像延伸到语音会更困难,因为语言的处理以及知识图谱的构建复杂度会高很多。