【大话视频】图像识别?已经OUT啦,视频内容识别现已震撼来袭!
▲点击上方蓝字,关注“大联大”微信
大大上个月曾在推文中描述了央视3.15晚会曝光的人脸识别漏洞问题。实际上人脸识别仅处于图像识别运用的初级阶段,想要探索更高层次的内容,还得聊聊视频识别。毕竟由图像识别上升到视频识别,在技术上的跨越是巨大的,而且绝对不止一个LEVEL哦。
本期大大将带领大家了解和梳理世界范围内科技公司对于AI视频智能识别的技术探索,并展望一下视频智能识别技术的未来应用场景~
▌视频识别:AI图像识别的PLUS版
从技术的角度而言,视频识别主要包括前端视频信息的采集及传输、中间的视频检测和后端的分析处理三个环节。这三个环节中最没有技术含量的就是“前端视频信息的采集”,清晰而稳定的视频采集固然重要,但在如今各种高清摄像头普及的背景下,高质量的视频采集完全不能构成挑战。
智能视频识别的真正挑战是第三个环节——视频的分析处理,请各位看官注意是“视频”的分析处理,而不是静态的图片,后者属于人脸识别的难度层级。基于AI的智能视频分析的技术难点,从通俗的角度来看,总结如下:
区分人、动物、车辆等各种物体,并进行侦测和跟踪。
可以有效的屏蔽水面的阳光反射、雨雪天气等对捕捉系统目标物的影响。
能够分辨人体大小的入侵者,将小动物及禽鸟等忽略。
可以区分人的滑倒、跑动等异常行为。
多个感兴趣区域及多个移动方向的同时计数可在一个摄像机上得以实现。
以上罗列的技术要求仅仅是智能视频识别的部分技术指标,未来更为实用化的智能视频识别将整合手机视频、GPS、门禁系统等素材,融入更多的生活应用场景,而且AI系统会拥有更高的识别可靠性,更宽泛的应用边界,这些层级和应用场景的技术指标就不是本文目前可以预见和探讨的了。
▌群雄逐鹿:视频智能识别的春秋争霸
按照行业地位,大大首先带领各位观众膜拜一下微软在视频识别领域技术发展的简单脉络。2015年微软人工智能机器人小冰率先发布了图像识别技能,在准确的图像识别基础上,结合人工智能机器人自身的观点,对图片进行人性化的评论。2016年6月微软再次对小冰的视觉感官进行升级,完成了对视频内容的识别和评论。从静态图片到动态视频,人工智能机器人小冰率先实现了对人类视觉感官的模拟。由此可见,微软立志于抢占以视频智能识别切入AI融入未来生活的关键入口。
以Google的技术感知能力,当然也不能忽视视频智能识别的发展。2016年,Google人工智能的两位软件工程师在博客上公布了一些研究成果,其中很重要的一个突破是,能够初步辨识出动态视频的内容,其最终目标不仅要分辨出图像中的物体或人,还要判断他们在干什么。
美国社交平台巨头Facebook也不甘示弱,在2016年的全球开发者大会上,扎克伯格也透露将会把人工智能(AI)巧妙的运用在视频播放中,根据视频中人物的服饰、身材、发型等识别并标记人物,方便用户日后检索。
▌视频场景之战:社会生活方式的重构
AI发展的动力在于帮助人类从低效率的重复劳动中解放出来,或者帮助我们处理很多依靠自身力量无法解决的问题。无所不在的视频智能识别正是这样的一种关键应用,将彻底改变我们的生活方式。例如:警察可以通过全国的交通及安防摄像头追踪疑犯的动向,甚至根据特定走失人群(如老年人、儿童)的照片,帮助警察在上亿的视频监控素材中“检索”出目标人群,锁定走失人群的详细地点,时空坐标可以精确到分钟和米,届时困扰国人的儿童拐卖犯罪现象或许能得到最大限度的遏制。
城市的智能交通系统也是视频智能识别的用武之地,快速的车牌号监测和驾驶人的视频识别技术将被广泛应用,从而使交通流量管理、交通肇事和危险驾驶方面的工作效率得到数量级的提升。
▌大大点评
作为人脸识别升级版的视频智能识别,将会是AI融入人类生活的关键门槛,毕竟从人类的感官而言,眼睛获取的视频图像是我们感知世界的“关键要素”。未来的AI要介入人类的生活,必然需要提升视频感知能力,不仅要判断自身的环境、判断周围要素的“意图”,更要进一步作出相应的智能判断。大大相信在世界各大IT巨头的共同努力之下,我们将会在不远的将来迎来更加智能、安全的视频识别应用。