机器视觉增速显著,如何寻找落地应用场景?

发布者:BoldDreamer最新更新时间:2019-08-29 来源: eefocus关键字:机器视觉  3D  图漾  AI 手机看文章 扫描二维码
随时随地手机看文章

机器视觉近年来增速显著,2015年全球机器视觉市场规模约42亿美元,增长10.5%。我国在2015年市场规模约3.5亿美元,但增速为全球首位,约22.2%。2016-2020年,机器视觉继续维持约20%的增长率,远高于全球的8.4%平均水平。这其中,半导体、电子制造约占机器视觉比重46.4%,汽车、制药占比分别为10.9%、9.7%。


经与业内多方交流所了解,机器视觉当前市场规模约几百亿,但是,应该使用也确实用到了机器视觉的,仅占全行业应用的5%,市场空间巨大。机器视觉发展的当务之急,是找到更多可以落地应用的场景,进一步推动普及化。而这需要产业链之间的协作,真正切中行业痛点并将具体需求场景化,同时,还需要高性价比的技术和方案。


图漾

如何扫平3D机器视觉大规模普及的障碍?
3D机器视觉如何大规模普及?上海图漾信息科技有限公司CEO费浙平认为当前最关键的是硬件问题,只有解决根本的硬件问题,未来软件的商业机会才是真实的。


3D机器视觉普及的关键障碍当前主要在于硬件方面,包括以下三点:
第一,硬件核心规格,包括光学方面的精度、分辨率、量程,以及电学方面的速度、接口、传输等;第二,硬件物理指标,包括尺寸、功耗、结构等,以及工况条件的适应性、稳定性。第三,是系统实施成本,包括相机价格、上位机成本、软件成本,以及使用和维护成本。


传统的机器视觉稳定发展多年,目前处于硬件和软件的发展基本匹配的阶段。目前95%以上的需求可以通过硬件+算法的方式解决,只有在外观检测、瑕疵检测等场景中,由于存在一定的随机性,才需要用到深度学习。虽然未来最终会走向深度学习,但现在基础的硬件要做到领先于软件一个C位。


机器视觉属于成熟行业,但这些年在发展规模、发展速度方面落后于大家预期。费浙平认为主要原因在于:一是用户对象属于传统行业,行业本身的景气指数以及改造周期等,都有一定的影响;另外,对于传统行业,技术升级、降本增效、精细化管理等等,这些都是行业的痒点而非痛点。


那么,行业的痛点是什么?


费浙平认为,从硬件价格和系统成本来看,必须突破传统上所谓二年投入回收周期计算这一困局,由少量非用不可的节点,逐渐形成大规模的普及应用,这更多地集中于机器换人的场景。
二年回收成本这个普识已经无法撬动行业需求,一年之内的时间周期才会真正令中小企业愿意买单。技术价值最大化应该通过大面积提升行业的生产力水平和经济效益获得,必须通过给客户带来价值而盈利,这是一个较为艰难的过程,也需要慢慢地推进。


从机器视觉发展的客观现状来讲,需求其实并不缺,但是能够真正落地的好产品,且真正发挥出经济效益的,只占所有需求的10%。如何打破这个“紧箍咒”?推动更多的落地应用?


“解决核心零部件的极致性价比,做到系统成熟稳定可靠,是最为迫在眉睫的事情。目前,微观的高精度相机只占机器视觉应用的5%左右,只要将性价比做到极致,就能满足工业机器视觉中90%以上的应用需求。”费浙平表示,“这一方面体现在产品的适用性、标准化程度上;另外体现在机器所能带来的降本增效,这还需要对视觉应用真正的刚性需求逐渐显现出来,例如当人力成本成为一个主要问题时,就会转而呈现出对机器的需求。”


如何做到极致性价比?在谈话中,费浙平传达中一种朴素的实用主义思想,能用2D视觉解决的就没必要用3D。对于工业相机来说,大的成本单元是图像传感器芯片、镜头、计算单元、CPU或GPU等等,图漾通过将光学、电子和软件进行联合优化,并且把核心算法实现了高效的FPGA硬化,从而把高昂的算力成本降低了几十倍。


物流行业是图漾目前最大的目标市场,当前主要针对体积测量这一新的蓝海。由于决定物流毛利关键的运输成本由体积决定,因此体积测量需求非常强。


直指需求核心,用好的产品和服务过硬地匹配它,就能够牢牢抓住市场,率先建起竞争的“护城河”——这是图漾在选择落地场景方面的一大特点。


商业模式上,图漾是直接面向系统集成商和设备商的to B模式。费浙平进一步解释,希望通过产业链共同来提升系统价值,对于图漾自身,标准化的核心零部件价格可以相对透明化,而发明创造、专家知识、技术服务等由客户和合作伙伴创造价值的环节,必须要有合理的回报。图漾希望通过高度标准化的硬件,加以不断集成的算法资源,降低客户的使用门槛,从而进一步扩大应用覆盖面。


总体而言,机器视觉生态系统目前较为成熟,从供应链角度看与消费市场相比并无特别之处,发展比较完善。但有一点显著不同在于,工业应用不同行业甚至同一行业不同的客户现场,软件算法非常多样化。这对于开发者的能力挑战较大,主要包括开源算法的能力、从业人员的水平和数量等等,直接影响了应用的覆盖面。这也验证了开头所说的,机器视觉越发展,每一个落地应用中软件的比重将会越来越大。而图漾致力于将硬件标准化,同时集成可以标准化的这部分软件,降低系统集成商和设备供应商的门槛,从而推进快速普及化。


海 康

AI如何赋能智能制造?

AI如何赋能智能制造?海康机器人技术有限公司华北区域总经理蔡化认为主要包括三个关键环节:首先是强大的感知能力,需要通过机器视觉来进行感知;其次是被感知、采集的数据通过平台化的管理,实现一站式的服务;第三就是场景化的AI。


真正实现智能需要庞大的系统工程,海康于2017年推出AI Cloud平台来深度融合智能制造需求。该平台分三层,第一层是基础设施层,更强调前端的多维感知、采集。第二层是资源层,也叫边缘层,前端的一部分数据感知完成后,对其进行边缘化管理,并将把前端的非结构化数据存到中间层,变成半结构化数据;最上层是服务层,也是整个平台的中心,它体现了算法的训练和应用服务,和业务层相对应。因此整个平台的基本架构强调云边结合。


从实现形态来看,通过前端采集的多维感知系统,对数据进行汇聚、存储、处理,再通过边缘计算,降低中心的压力。这其中有三个趋势值得注意:


第一个显著趋势是前端的智能化程度不断提升,通过边缘计算缓解中心的压力。前端已经不仅仅局限于数据的采集,并且会进行部分结构化处理的工作。现在工业应用中已经有较多的智能相机、智能传感器等,进行了部分边缘计算的工作。它们比较适合的应用有:判断对错/有无,或是对感知尺寸的测量等等,进行第一步的读取或识别。目前,在前端进行深度学习是现在很多企业都在尝试的方式,即把前端的算法,放入到可实现的嵌入式设备中进行读取/识别,从而降低中心压力。


第二个趋势是人机协同以及数据的流动。这两年AGV在工厂中被大量运用,这是一个典型的人机协同的使用场景。首先,机器并不是全部替代人工,一些机械的、重复性较高的工作通过机器来实现,完成人和机器的和谐相处。过去在工厂中搬运仅仅是货物在流动,数据并没有流动起来。而通过机器来实现后,实现了货物和数据同在时流动,便于云中心进行指挥调度。


第三个趋势是所有数据入云后,都是要被用来进行管理和挖掘的。“数据本身不存在任何价值,数据碰撞后产生的价值才是最大的”。蔡化认为,最终的碰撞和挖掘一定来源于业务端。仍以AGV的应用为例,通过数据的流动找到规律,发现机器的运行轨迹、运转次数等等,挖掘出提升业务工序效率的关键,从而全面提升整个工厂的效率。


哪些工业应用场景前景巨大?


蔡化认为首先是物流,包括传统的快递、电商物流、生产内容物流、合同物流等等。这其中随着市场的发展变化,蕴藏着很多新机会。


以线下零售的仓储改变为例,大型商超企业在对抗线上购物的过程中,逐渐向以社区、家庭为单位的便利店转移。这一过程中,最大的变化不是前端的货物销售,而是货物的流转发生了变化,订单越来越散、货物入库后需要进行拆零,这时仓库所能提升的内容就变得更为重要,需要自动化的过程来实现。


对于快递物流而言,基本是无人仓的逻辑。例如几百台机器人在一个几千平米的平台上进行不间断的搬运和跑动,进行入库、分拣等工作,这更多体现了调度算法的优越性。


其次是3C制造业,典型的就是手机制造,包括PCB、听筒、话筒、按键、屏幕、模组、电池等),需要进行大量的生产和智能检测。生产的自动化程度已经非常高了,一是提升了效率,二是提升了良品率。


中国之所以在上述方面发展较快,蔡化表示,首先因为不缺场景,有太多的应用场景可进行学习、练习甚至不断试错,这提供了很好的成长土壤。海康希望通过AI赋能智能制造,逐步将深度学习等人工智能技术物联网技术落地应用于智能制造领域,从完成多维感知、数据采集和处理的机器视觉系统,到实现智慧内物流的移动机器人系统,持续推动机器智能化、服务智能化、生产智能化。


关键字:机器视觉  3D  图漾  AI 引用地址:机器视觉增速显著,如何寻找落地应用场景?

上一篇:阿里人工智能荆棘之路:坐在金山上啃馒头的感觉?
下一篇:人工智能以革命的形式横扫科技圈,还存在哪些隐患?

推荐阅读最新更新时间:2024-10-29 11:13

日本借深度神经网络破译人类思维 人工智能走近大脑
外媒称,日本研究人员已经成功借助人工智能破译了人类的思维和想象,从而在理解人类思想及其背后的大脑机制领域获得了重大突破。下面就随医疗电子小编一起来了解一下相关内容吧。 据阿根廷 21 世纪趋势网站 近日报道,破解人类思维的内容是科学界长久以来的愿望。事实上,此前的种种研究也已经实现了破译人类所见、回忆、想象和梦境的内容。 日本借深度神经网络破译人类思维 人工智能走近大脑 例如另一个日本科学家团队早在 2008 年就成功地在电脑屏幕上直接重现了从人类大脑活动中获取的图像。 但包括这一研究在内的其他以往研究都遭遇了难以逾越的障碍,因为每个个体的大脑内容都具有其独特性,因此思维模式的目录创建很难实现。 报道称,此外,这些模式还
[医疗电子]
日本借深度神经网络破译人类思维 <font color='red'>人工智能</font>走近大脑
OpenAI 派生公司发布人工智能模型:机器人学习任务迈出重要一步
2024年3月13日 — 在一项重大突破中,OpenAI的派生公司Covariant宣布成功建立了一种新的人工智能模型,使 机器人 能够像人类一样学习执行各种任务。这一发展标志着机器人技术迈向了更为灵活和自主的方向。 在2021年夏天,OpenAI关闭了其机器人团队,并指出由于缺乏训练数据,机器人的进展受到了阻碍。然而,Covariant的三名早期研究科学家在其成立于2017年的初创公司中找到了解决方案。他们利用了来自世界各地仓库的拣货机器人车队多年的数据以及来自互联网的文字和视频,创建了一个名为RFM-1的新模型。这一模型结合了大型语言模型的推理能力和高级机器人的身体灵活性。 RFM-1的功能令人瞩目。用户可以使用文本、图像、视
[机器人]
英特尔联手微软,在前端设备进行人工智能推理
近日,微软在Windows开发者日上发布了Windows * ML,Windows ML可以让开发人员在Windows操作系统中执行机器学习工作。Windows ML 可以针对任意给定人工智能工作负载实现高效硬件利用,并在不同硬件类型中实施智能的工作分配 ——包括英特尔的视觉处理单元(Intel Vision Processing Units—VPU)。英特尔VPU是一款专为加速边际人工智能工作负载而设计的芯片,开发人员利用VPU可以在Windows客户端上构建和部署下一代深度神经网络应用。 英特尔Movidius™ Myriad™ X VPU是业界首款带有专用神经计算引擎的系统级芯片,可在前端应用中进行深度学习推理的硬件加速
[家用电子]
成功利用机器视觉检测泡罩的步骤
技术在成本,质量上的优势能取代人的视觉任务,它速度快,能重复,测量精确。这里是成功利用机器视觉完成任务的步骤。 技术在成本,质量上的优势能取代人的视觉任务,它速度快,能重复,测量精确。这里是成功利用机器视觉完成任务的步骤。 什么任务? 机器视觉有三个一般的能力: 1. 特定区域或搜寻你感兴趣的目标的位置。当机器视觉用于指导机器人分派任务和跟踪移动的物体。 2. 判别能告诉你从一些可能的物体中找出特殊的物体。位置和判别常常组合到一个任务里,因为在找一个物体之前你不得不找到它并判别它。光学字符识别和二维码被用在识别一个物体,然后读出来。 3. 检测对象的正确的尺寸,适合的质量标准,一些缺陷等。 明知这些条款将帮助你明确你
[测试测量]
成功利用<font color='red'>机器视觉</font>检测泡罩的步骤
快充+人工智能,这就是华为荣耀年度神机的杀招?
在2016年国产手机大战即将拉上帷幕之际, 荣耀 用连续两天的神秘海报,再度燃起了战火。12月6日、7日,荣耀总裁赵明和荣耀手机的官方微博相继发布“致未来”海报,宣告在周年庆前一天(12月16日)将举行新品手机发布会。   自今年多个手机厂商相继发布 概念机 后,坊间关于荣耀将推出新品概念机的传言就尘嚣日上。然而此番荣耀的预告却惜字如金,功能卖点藏得严实,仅仅透露两点:1、发布的是新品手机,并非此前坊间猜测的未来概念机;2、新品手机的名字是荣耀Magic手机,从名字的立意来猜测,荣耀该款新机拥有一种神奇的魔力,对用户来说是体验崭新的、与众不同的。     离谜底揭开还有一周时间,行业大V和花粉们已经展开了Magic大猜想:年度
[嵌入式]
NVIDIA AI Enterprise 3.0 推出全新工具,助力企业驶上 AI 快车道并加速取得成功
NVIDIA AI Enterprise 3.0 推出全新工具,助力企业驶上 AI 快车道并加速取得成功 该软件套件提供用于呼叫中心的智能虚拟助手、音频转录、网络安全数字指纹的AI工作流,并支持 50 多个 NVIDIA AI 框架和预训练模型。 从快速波动的市场需求到人员短缺,再到供应链环境的复杂性,企业在过去几年经历了无数挑战。许多希望在 2023 年取得 “开门红” 的企业,正准备采用 AI 和加速计算来推动业务增长并节约成本。 为支持这些早期采用者,以及刚开始应用 AI 的企业,NVIDIA 发布了 NVIDIA AI Enterprise 软件套件的新版本,为全球企业多个行业和特定领域的各项工作负载提供
[工业控制]
NVIDIA <font color='red'>AI</font> Enterprise 3.0 推出全新工具,助力企业驶上 <font color='red'>AI</font> 快车道并加速取得成功
Microchip MTCH6303的认识_MGC3030 3D手势控制方案
Microchip公司的MTCH6303是一款创新型容性触摸控制器,提供多触点坐标和多指手势。MTCH6303以最少的主机要求为嵌入式设计带来了现代用户接口(UI)元件,例如捏拉缩放、多指显示滚动和滑动屏幕。 MTCH6303的高级信号处理提供了噪声消除技术,能够预测性跟踪10根手指。它还整合了MicrochipMTCH652高压线路驱动器,实现了出色的信噪比(SNR),从而在嘈杂的环境中实现出色的触摸性能。这些功能对于高要求环境(例如工业控制、具有安全控制面板的家庭和办公自动化、恒温器、打印机与照明控制)和各种消费类应用(包括训练设备和音频系统)至关重要。 MTCH6303的主要特性 多点触摸,多达10点触摸 5点触
[汽车电子]
台湾“工研院”新技术:2D与3D同屏幕显示
  台湾“工研院”今天抢先发表区域化2D/3D切换显示技术,目前已有2至3家台湾厂商接触争取合作。   “工研院”电子与光电研究所立体显示系统部经理陈俊融表示,目前2D/3D切换技术仅应用于小尺寸的手机,且都是全面式切换,无法同时显示2D与3D影像于同一屏幕。   陈俊融指出,“工研院”整合光、电及材料等技术,开发出区域化2D/3D切换显示技术,让2D与3D影像得以在同一屏幕同时显示;适合于网络、游戏、商品广告及影片等立体多媒体影像呈现。   陈俊融说,目前已有2至3家台湾业者与“工研院”接触,争取合作机会。   除了区域化 2D/3D切换技术外,“工研院”今天同时发表多彩多智发光二极管(LED)剧院投射灯;电光所
[家用电子]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved