扫地机器人为何“离家出走”:差个自动驾驶算法

发布者:bemaii最新更新时间:2020-11-03 来源: eefocus关键字:AI  智能  自动驾驶  扫地机器人 手机看文章 扫描二维码
随时随地手机看文章

这家公司,竟然将自动驾驶算法用在了他们的扫地机器人上。

 

 

大材小用?

 

还真没有,虽然道路交通很复杂,但家里也一样。

 

不仅要在靠近柜脚床脚时减速,还要在“看见”障碍物(掉在地上的袜子、缠绕的数据线)时来个急刹车。

 

 

还得肩负起逗猫遛狗的责任,给上班的你直播宠物的“作案现场”。

 

 

问题来了,机器人想要避开物体(如数据线、猫狗),用目标检测算法不就行了?

 

但目标检测算法只能识别已知物体,无法识别、测量未知物体的距离。

 

想让机器避障,除了检测特殊目标,还需要自动驾驶技术中的一项核心算法三维感知,即判断障碍物距离和三维尺寸(体积大小)的能力。

 

人眼会下意识地判断物体与自己的距离。

 

机器要想“学会”这种能力,同样需要先拥有“眼睛”。

 

 

自动驾驶避障核心:双目视觉算法

深度感知用到的测距方法有很多,包括红外、超声波、激光、3D 结构光、3D ToF、单目视觉、双目视觉等。

 

 

那么,为什么要选择双目视觉算法?

简单来说,就是让机器像人一样,用两只眼睛看世界,产生“深度”感。不然,机器人看着你和身后的花瓶,会认为是你正顶着一个花瓶,而不会产生“深度”感。

 

△错位图

 

如果只有单目(只用一只眼睛,利用时间和判定框大小变化去测量距离)的话,机器也有办法判断距离,但就与人一样,没办法判断得那么精确。

 

例如,左右手各举一支笔,在闭上一只眼睛后,试着将笔尖对笔尖——是不是容易对不上?因为距离感变差了,所以笔尖总是容易互相错过。

 

 

那么,激光雷达呢?

这的确是一个好东西,如果多个雷达全方位感知,机器就拥有了“神之视角”,每个角落都能看得清清楚楚。

 

然而,它造价太昂贵。如果在机器人身上装上可以无死角扫视房间的雷达数量,它就变成了“行走的小金库”,价格让人无法直视。

 

此外,如红外、超声波等算法,避障精度不如双目准确;至于 3D ToF、结构光等算法,不仅成本高,需要额外配摄像头做目标检测,而且没有区分物体的能力,只能通过大小判断障碍物。(例如,薄薄的袜子可能就被误吸了)

 

这也是为什么,双目视觉算法在无人车与无人机领域“备受欢迎”。

 

而现在,双目视觉算法也被用在了扫地机器人上。

 

3cm 以上:结合 LDS,障碍物全识别

机器的“眼睛”,通俗点来说就是各种大大小小的传感器。(激光雷达、相机后面的传感器)

 

传感器通常的工作原理,是机器(在角α顶点处)发射红外线、超声波、激光,通过“眼睛”(下图角β的顶点)接收到后,再根据反射回来的角度、相位或时间,来判断距离(d)。

 

△考验高中数学知识的时候到了

 

而双目视觉的根本原理,就像是将这个三角形变成了 3D 版:

 

 

它的原理就两步:①确定视差,即将两个相机拍下来的照片进行对比,找出两张照片中相同的点间像素差,②基于视差,通过已知的双目空间几何关系,计算立体空间中各点的距离。

 

但相比人脑的高精度计算,想要实现计算机的双目识别,并不只有解三角形这么简单。

 

一个重要的原因,就是在步骤②这一块,计算机本身并不知道摄像机拍的两张照片哪里是一样的。

 

△在计算机眼里,这些小黄鸭就是一堆数据

 

这就导致双目视觉算法的开发变得非常困难,但带来的收益也很高。

 

不过,双目视觉算法仍然有缺点,它受光线影响依旧很大。

 

所以在光线不足时,就用算法去主动“补上光线”。

 

以石头 T7 Pro 扫地机器人的算法为例,双目视觉模块分为视觉控制和深度估计两部分,一个智能补光,一个估计深度。(甚至专门做个红外拍出的相片,搞成数据集,训练补光识别效果)

 

但自动驾驶算法,也绝不仅仅只靠“两只眼睛”。

 

与人类不同,无论是自动驾驶汽车、无人机、还是扫地机器人,都可以说是“全身遍布”着眼睛。

 

 

其中就包括 LDS(激光雷达)。

 

当双目视觉算法遇上激光雷达(能搞定所在高度的平面避障),在二者的结合之下,机器人不仅能完美避开 3cm 以上的障碍物,还能通过它们“找准自身定位”。

 

此外,激光雷达也会用在 SLAM 的建图和定位上。

 

3cm 以下:目标检测算法的最强“辅助”

不过,在实际应用中,单靠双目视觉算法和激光雷达,还远远不够。

 

小于 3×5 厘米的物体,会比较麻烦,既要区分出要清扫的部分(纸屑、地毯)、又要避开一些容易缠住的障碍(数据线)。

 

这种情况下,双目视觉算法就成了最好的“辅助”:协助目标识别算法,将需要避开的物体检测出来,准确地区分垃圾与障碍物。

 

目标检测模型上,T7 Pro 自研的神经网络借鉴了 SSD,YOLO,及 CenterNet 等多种新型模型,目前还在不断地迭代。

 

算法上,石头采用了“一分为二”的待遇:高于 3 厘米的物体,绕障碍物边沿避障和清扫;

 

小于 3 厘米的物体,按种类进行清扫(纸屑、地毯)或避障(宠物便便、数据线)。

 

数据集上,石头也“别有用心”:选出了一些特殊的物体,进行“有差别对待”。

 

例如,大家都有所担心的动物便便,石头 T7 Pro 的算法中直接加入了便便的识别(同情做数据集的一秒钟),在接触之前,远远地就避开它。

 

哪怕不在家,扫地机器人也不会把宠物便便拖得满地都是。

 

 

虽然算法目前已经迭代到了能够识别 9 种物体的“体量”(还在增加 ing),但不是所有的物体都像宠物便便这样,会受到“远远避开”的待遇。

 

9 类常见障碍物:底座类(吧台椅、风扇、手持底座、平底座、灯底座)、体重秤、线团、插线板、鞋子、粑粑、织物(如袜子)、易卡家具( 如 U 型椅)、簸箕

 

例如鞋子、风扇这种相对较为安全的物体,离得近一点再避障也没什么问题(推开一点不重要,扫干净就行)。

 

以及,这部分算法还有个小彩蛋。

 

在你上班的时候,这个扫地机器人就能化身小管家,“监督”宠物:是不是又把食盆打翻了?

 

不过,视频只有直播,没有云存储,也就是说,其他人甚至没办法窃取你家的数据,所以,不用担心扫地机器人会“变身间谍”。

 

继续“拆解”后的发现

从深度感知部分来看,扫地机器人深度感知的原理,与无人驾驶算法有着相似之处:

 

如下图,算法包含三大部分,第一部分是传感器数据的获取,第二部分是信息的提取,第三部分是独特导航算法的融合(后融合)。

 

 

但这并不意味着,扫地机器人的算法与无人驾驶汽车的算法一样。

 

在实际应用上,扫地机器人需要“近距离避障”(晚点刹车,扫得更干净),自动驾驶汽车则相反,需要以“安全”为主(尽早刹车)。

 

所以,虽然二者的避障核心都是自动驾驶中的双目视觉算法,但数据处理方式不同。

 

从根本上来说,它们都是智能机器人,为了让生活变得更方便而存在。

 

“智能,让人们更聚焦于生活”

石头科技 CTO、本硕毕业于浙大的吴震,在接受量子位采访时表示,基于用户场景持续迭代,扫地机器人才能更好地适应千家万户的多样性。

 

△石头科技 CTO 吴震

 

例如,内测的时候,先对身边的人“下手”:

 

在我们第一代产品内测时,我们发现有一位同事家里,一件老家具很容易卡住机器人。

 

后来我们就给这位同事买了一件相似的新家具,然后把这件老家具搬到实验室,作为我们标准测试项目。

 

而扫地机器人被发明出来的初衷,本质上与无人驾驶汽车一样,目的是将人类从劳动(驾车、琐碎的家务等)中解放出来,聚焦于生活。

 

吴震相信,伴随着计算机视觉的发展,智能机器人的视觉算法也会变得越来越完善。

 

“扫地机器人,在我们看来是机器人技术在家庭环境下的第一个应用,但不会是最后一个。它不是终点,而是开始、是未来。”

 

 

期待这些未来的智能机器人,能(让我们变得更懒)更加解放我们的双手。


关键字:AI  智能  自动驾驶  扫地机器人 引用地址:扫地机器人为何“离家出走”:差个自动驾驶算法

上一篇:能力深耕,开放赋能--构建智慧家庭生态系统
下一篇:传音控股股价暴涨市值破千亿:前三季净利润近20亿元!

推荐阅读最新更新时间:2024-11-17 11:41

LED技术节能智能化趋势及面临挑战
   LED 照明 具有节能、 环保 、长寿、抗震、体积小、响应速度快等优点。目前, LED应用 领域主要包括背光、一般照明和车用照明三大市场。随着 LED灯 价格下降,舒适性和安全性成为 半导体照明 的 技术 方向。另外,半导体照明将开启照明智能化时代。智能照明具有灯光亮度调节、色温调节、灯光软启动、定时控制、场景设置等功能,并达到个性化、舒适性、二次节能、安全高效的要求。   一、机遇和挑战   LED照明具有很多突出的优点:节能——直流驱动,电光功率转换接近100%,相同照明效果比传统光源节能80%以上;寿命长——使用寿命可达6万~10万小时,比传统光源寿命长10倍以上;色彩变化多——利用红、绿、蓝三基色原理,在计算机技
[电源管理]
模仿苍蝇听觉系统的智能免电池助听器
从一只苍蝇听觉而来的灵感,启发研究人员们开发出一款全新的低功耗麦克风组件,可望为打造新一代的智能型免电池助听器而铺路。 美国德州大学(UT)奥斯汀分校库克瑞尔工程学院(Cockerell School of Engineering)的研究人员们利用一种黄色的寄生型苍蝇(Ormia ochracea)所具有的特殊听觉结构,开发出一种全新的助听器,它能够只强调配戴者想听到的声音。 这种寄生蝇拥有独特的声音处理机制能够在2度范围内确定声音的方向,因而准确地定位出一只鸣叫中的蟋蟀位置。 由于声音的速度限制以及人类两耳之间存在距离,一般来说,人类和其他哺乳动物能够定位出声音的来源,主导这项研究的Cockerell工程学院电子与计算机工
[电源管理]
模仿苍蝇听觉系统的<font color='red'>智能</font>免电池助听器
多屏世界与自动驾驶背后的IC升级
车内屏的“内卷”,已经从越大,越宽,变成越多。从中控屏到副驾屏,现在重新回归的后排屏。 然而,屏的应用并不仅仅是让人在车上听音乐、看视频、玩游戏。如果从驾驶者角度来看,它还有驾驶安全层面上的作用,比如现在已经成为很多驾驶者依赖的360度环视,对于停车来说真的方便很多,还有流媒体后视镜,以及电子外后视镜等等,相应的就是越来越多的车载摄像头的应用。 对于消费者来说,只要使用时不出问题,比如没有画面,或者卡顿等等就行。但是对于背后的电子元件供应商来说,就不仅仅是保证不出问题就可以了。他们要从成本、能耗、重量、集成化等多方面因素进行考虑,还要满足当下汽车智能化发展的需求和面向自动驾驶发展的需求,这也推进着电子元件供应商在技术与产品
[汽车电子]
多屏世界与<font color='red'>自动驾驶</font>背后的IC升级
人民日报:中美都踏入AI无人区 中国有望后来居上
  党的十九大报告提出,加强应用基础研究,拓展实施国家重大科技项目,突出关键共性技术、前沿引领技术、现代工程技术、颠覆性技术创新。其中“颠覆性技术”备受关注。什么是颠覆性技术?我国有哪些颠覆性技术创新在世界上位居前列?它们对我国和世界的经济社会发展将产生什么影响?我们该如何应对这些技术革新带来的巨大变化?我们从今天起推出系列报道,带您走近颠覆性技术。下面就随网络通信小编一起来了解一下相关内容吧。   ——编 者   不久前,科大讯飞研发的人工智能机器人——讯飞智医助手以高分通过了2017临床执业医师综合笔试评测。联想起此前完胜世界围棋冠军的阿尔法狗,这一切都引发了公众对人工智能(英文简称 AI )技术的热烈猜想:人工智能会不会“
[网络通信]
基于雷达技术的智能浴室
当你走进浴室,您最喜欢的音乐电台已经播放,并且智能镜子已与智能手机同步,显示您的每日安排,当前天气状况和交通信息。当您靠近镜子,镜前灯会自动变亮。 智能设备如今无处不在,并且已进入到了浴室。“智能浴室”可以将水龙头,淋浴器,卫生间,照明设备和镜子变得更智能,同时也会节约用水和能源消耗。 智能浴室中可以使用哪些传感器呢? 由于明显的安全性和隐私性原因,浴室无法使用摄像头技术。所以,大多数智能浴室都选择了语音识别,智能手机连接控制和运动传感器。 无源红外技术是许多运动感应应用中的流行选择,但是在智能浴室中,必须在检测到人时立即打开电器和固定装置,但被动红外传感器不合适,因为需要大量移动才能触发它们。 相比之下,雷达技术足够灵敏,可以检
[传感器]
基于雷达技术的<font color='red'>智能</font>浴室
一种智能电梯语音系统的设计
1 引言 随着城市文明化和现代化建设步伐的加快,对建筑物中电梯的服务要求也越来越高,人们越来越追求智能化、人性化的乘梯环境。在电梯语音服务方面,目前主要是传统的人工服务,即通过电梯管理员告知乘客所要到达的楼层以及其他相关的服务信息。本文以单片微机和ISD语音芯片为核心,设计了一种电梯语音服务系统,实现了电梯语音服务的智能化和自动化,以适应各种对服务要求比较高的电梯中。 2 器件功能介绍 Winbond公司的ISD系列语音芯片采用了“直接模拟量存储”(DAST)专利技术,信号无需经过D/A,A/D转换,数字压缩和语音合成等复杂的数字信号处理过程,减少了失真,使其声音存贮效果较以前产品有大幅提高,实际试听主观评价可以
[单片机]
一种<font color='red'>智能</font>电梯语音系统的设计
国内智能机格局:四大厂商 三大市场
    近两年,智能手机市场风生水起,智能手机占手机整体市场的份额急剧飙升。随着人们对移动网际网路应用的广泛关注,越来越多的用户有了智能手机消费需求,价格高高在上的智能手机也逐步进入物美价廉的平民时代,而千元智能手机正在成为智能手机市场的中坚力量。   目前国内的智能手机市场已经初步形成“三个市场,四大厂商”格局。所谓“三个市场”,是指中国电信CDMA 市场、中国联通WCDMA市场以及中国移动TD-SCDMA市场。“四大厂商”是指酷派、华为、中兴、联想4家国内企业。   据艾媒咨询机构最新发布的《2011年中国Android智能手机用户调查研究报告》数据显示,在2011年国内智能手机用户使用的品牌中,华为、中兴、酷派3个国内手机品牌
[手机便携]
TCL新专利获批准,发力屏下摄像头智能手机研发?
据荷兰科技博客letsgodigital报道,TCL于2019年12月向国家知识产权局申请了一项智能手机外观专利,并于6月12日向外界公布。 图源:letsgodigital 专利图片显示,该款设备采用全面屏设计,四周边框极窄,且屏幕上方没有打孔,或将引入屏下摄像头。而其背面则似乎搭载了两颗主摄像头,并在周围配备了四个LED闪光灯。整体外观与TCL 10系列十分相似。 6月8日,维信诺发布了全球首个达到量产应用级别的屏下摄像解决方案InV see™。该方案通过开发应用新透明OLED器件、新型驱动电路和像素结构、导入高透明新材料,达到了显示效果和屏幕透明度最佳平衡,呈现出更为优质的显示和拍照效果,从而实现“真·全面屏”。 小米、
[手机便携]
TCL新专利获批准,发力屏下摄像头<font color='red'>智能</font>手机研发?
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved