速感科技陈震带来了题为“这款智能超市购物车,可能要颠覆你三观了”的演讲,以下为演讲实录(未经本人核实):
陈震:谢谢陈总的介绍,非常感谢有这么一个机会跟智能空间相关的一些在座前辈还有老师一起做交流,我本人是1993年清华大学的硕士,毕业于计算机系,主要做人机交互方向。之前我们今年创业项目其实更偏重于技术,讲的更多的可能和咱们的地理位置信息和地图信息,和地图可视化的相关性可能不是很大,更偏重于我们现在更流行的一些像人工智能,像计算机视觉的相关算法。我创业也是一个机缘巧合的机会,2014年我和我的两位合伙人参加挑战杯,拿到金奖,有机会凭借挑战杯的项目成立了公司一直到今天。
我先讲一下我们从2014年一直到现在做了哪些事情。我们本身的定位是专门为企业和开发者提供计算机视觉相关的一些解决方案。主要集成现在很火的TLD的相关跟随技术等。我们的目标也是通过和目前顶级的一些科技公司的合作,帮助公司打通商用服务型机器人的关键技术解决方案,并且在今后形成一个关键的计算机视觉和机器人视觉的平台。
给大家讲的主要是计算机主视觉,计算机主视觉算法在地图里面包括空间测量、vSLAM、路径规划、图像识别,我们可以看到里面包括图像识别最近有一些代表性的公司,人脸识别也有一些公司,这些公司通过人脸识别的方式进行数据积累,通过CNN神经网络的学习,帮助在安防、人脸识别的一些具体行业进行了细分市场的垂直切入。我们可以看到计算机的主视觉算法的其他分支,包括vSLAM算法有哪些应用呢?去年谷歌的一家增强虚拟现实公司的核心技术就是基于vSLAM算法和vSLAM本身进行相关的AR和VR的一个尝试。后面我会主要讲vSLAM是哪几个单词的英文缩写。
包括移动机器人其实有包括几个更主要的算法,在路径规划下面的机器人的自主导航、自主返航和实施情况下的避障,都是机器人在移动过程中需要考虑的关键问题。在空间测量当中,机器人一旦涉及到空间位置导航,以及空间的自主移动必然涉及到空间计算以及空间测量。所以,我们在整个机器人的主视觉算法里面,或者地图里面,关键技术在vSLAM方向和路径规划和图像识别技术上有我们自己的IP专利。
第一,我们讲一下vSLAM算法,vSLAM全称叫室内同时定位和构图算法,这个算法是1988年的时候由MIT的几位教授提出来的,这个算法提出的初衷是帮助机器人来解决室内同时定位和构图的相关问题。我们知道一个室内地图的构建需要良好的位置,一个位置和一个构图又需要良好的地图帮助他进行位置的拼接,所以本身就是鸡生蛋和蛋生鸡的问题,在这样的问题下机器人需要进行自主的探索和自主对位置地图进行构成和生成,所以我们需要用一些关键技术解决这样的问题。
之前我们这边也有介绍过,在荷兰一家创业公司,包括国内最近做的很多的像廉价低成本的激光雷达,用激光雷达实现二维地图vSLAM构建是目前机器人自主导航的一个基本或者一个通用的解决方案。除此之外是立体相机,主要类似于人眼的技术实现里面的深度提取,并从深度提取中达到三维地图。我们结合目前三维和二维地图在轻量级的地图板上完成了vSLAM的实现,这是整个的一个vSLAM的技术框架,2014年当初我们项目拿到风投做创业主要也是因为这样的一个算法框架。在这样的一个框架下,我们可以进行关键帧的体系,通过每帧完成三维地图的构建。
有一些展示案例,可以看到三维地图是什么样子,服务于机器人的地图更为简单或者更为粗暴一些。我们看到我们交付给机器人的地图更像是一些三维空间的点云信息,以及二维空间的点阵信息。在一个空间里面直接用手持的方式完成地图采集,只要在传感器扫描范围之内的地图都可以实时生成出来。
拿到这样的地图有什么作用?用这样的地图交付给机器人,让机器人在空间内自由的行走。这一块涉及到就是自主导航和避障,主要是用到两套,一个是二维的激光雷达,我们用RGBD传感器实现空间的避障,局部范围内也用了UWB的方案,基于信号基站的方案实现了定位和自主返航。
这个里面就是目前在机器人学里面比较通用的一些算法,包括A*算法和D*算法。只要在地图里面构建过的位置和空间位置,只要随意的去指任何位置,可以通过实时情况到达自己想要去的位置。
第三块是我们从去年开始做的另外一个视觉上面的尝试,这个视觉尝试是用基于TLD的跟随算法帮助机器人实现动态物体的跟随,这样一个动态物体的跟随,这个上面是整个算法的技术实现原理,分为Detector、Matcher等,这个在安防领域做的贡献其实可以通过对人的行为识别等对一个人进行全局的跟踪和察看。讲跟随到底在什么地方有些应用,其实这个月有一件事情,大疆发明了最新一代的机器人,只要让无人机飞起来,就可以进行航拍。在我们算法里面,也最近拿出一套飞行器的开发平台,主要的跟随算法和目前主流的TLD算法以及大疆里面用到的算法有一个公开的对比,这是一个对比的测试结果。在这个测试级我们选取了六个公开的测试级,对动态物体进行捕捉和跟踪,最后一个衡量的关键准确率基本上非常高,可以达到90%以上。
机器视觉的跟随在RGBD里面可以通过特征识别识别一个人的任何一个部位信息,通过任何一个部位信息直接锁定到这个人,而且不会在任何相似情况下出现任何干扰。这些都是我们在公司的实际情况下做的一些测试。最后是我们给开发者做的一套开发套件,这样一套开发套件,其实我们知道对于现在的商用服务型机器人,尤其机器人的应用案例目前是刚刚起步的阶段,今天机器人在中国的发展其实更像2010年左右智能家居在中国的发展一样,所以这个行业可能还有两到三年,或者三到五年的成熟期,所以在这个成熟期和发展期我们需要开发更多开发者,让开发者跟我们一同实现机器人的开发。去年10到11月份我们一共上线了两版机器人的应用开发的操作系统,目前这套操作系统大概有3000名应用开发者在我们上面进行开发,开发者的应用系统可以实现上面提到的八个功能,语音视频通信、移动控制、自主导航、语音交互、跟随、三维重构、特殊位置的察看和室内定位。只要交付这样一套系统给开发者,开发者可能需要两到三个月的时间完成系统的搭建,现在从下载到使用大概只有需要两个小时就可以完成这套系统的搭建。
这是我们系统的架构,把API直接开发给开发者使用,后面是关于我们系统直接做调试和使用的DEMO,在公司官网上都可以看到,这套DEMO从组装到实现两三个小时就可以完成,以前实现这套机器人核心的样机的测试和开发大概需要两到三个月。
第五,就是我们在2014年之后,作为一家创业公司我们更多可能倾向于和一些科技公司的合作,所以我们会选择大家知道的像英特尔、微软、暴风这样的公司,我们一共做了很多方案,这些公司当做整个机器人的一个技术储备。目前我们也是英特尔开放平台的一员,英特尔专门为我们提供了整个嵌入式的技术芯片,在技术芯片上实现了我们的功能。大概技术分享就是这些。如果大家有兴趣,可以来我们公司,还有更好玩的硬件,包括室内感知的无人机,包括我们为武汉专门定制的仓储式的底盘,无人机平台可以帮助开发者在室内进行快速的地图构建,并且描绘出飞行轨迹,这些全部都是应用了我们目前的视觉算法。所以,我也欢迎各位可以来我们公司看看我们在硬件上面做的一些新的尝试,谢谢!
上一篇:头盔、手机盒子、一体机,VR三种形态谁最强?
下一篇:这么多所谓专家都来给谷歌机器人支招
推荐阅读最新更新时间:2024-05-03 00:17