视觉系统离消费市场有多远?

2020-10-09 14:17:32 责任编辑: 东莞瑞智 0

    作为人工智能的两个分支,计算机视觉与视觉系统在近年都取得了长足的进步。前者自2010年至今,伴随着深度学习再度流行并用于目标识不,在人脸识不等方面类似超过了人类;而后者在工业运用方面,也有许多突破性的运用。


    然而,在消费级市场方面,计算机视觉与视觉系统的进展并不大。许多人关于计算机视觉与视觉系统在消费级市场能有多大实质性地运用,存在深深地担忧。


    计算机视觉与视觉系统


    首先,我们有必要理清晰视觉系统与计算机视觉之间的关系。从学科分类上,二者都被觉得是人工智能下属科目,只是计算机视觉偏软件,利用算法对图像进行识不分析,而视觉系统软硬件都主要包括(收集设备,灯源,镜头,控制,机构,算法等),指的是系统,更偏实际运用。简单的讲,我们能够觉得计算机视觉是研究“让机器设备如何看”的科学,而视觉系统是研究“看了之后如何用”的科学。

视觉系统


    视觉系统离消费市场有多远?


    计算机视觉与视觉系统的咨询题是,前者太学术,后者太工业,因而一直至今在消费级市场缺乏好的商品。视觉系统的很多关键技术和基本原理多年前就较为成熟了,近年来的进展要紧集中在工程化,比如GPU和视觉计算加速器的浮现解决了计算量咨询题。但与此同时,要想把视觉技术完成真实商品落地,中间还有许多其它咨询题,他们也在摸索中。


    视觉技术在消费级市场最早的尝试是微软的Kinect。2010年,微软联合深度摄像头技术方案带来方PrimeSense正式对外推出Kinect,利用骨骼捕捉技术,Kinect能够捕捉游戏玩家的骨骼动作,从而让游戏玩家能够不接触屏幕即可玩游戏。在Kinect之后,华硕、Intel、谷歌和苹果也相继在深度摄像头的运用场景上跟进,一切都看上去往好的方向进展。


    但深度摄像头作为独立商品,市场化难度系数颇大。例如Intel在13年在开发设计者会议上宣布,将推出自身的微型深度感知模块,华硕、戴尔、惠普、联想等多家PC生产厂家都将从2014年下半年开始在商品线中部署这款深度感知模块。而两年多过去了,曾经预言的一体式深度摄像头的商品迟迟未见。


    那么,处在计算机视觉和视觉系统交叉部分的深度摄像头,应该如何打开消费级市场?


    深度摄像的瓶颈


    深度摄像头也称RGBD摄像头。我们常用的摄像头是RGB摄像头,单一个摄像头便能感知彩色可见光信息内容(Red、Green、Blue),而RGBD摄像头是在我们常见的RGB摄像头基础上,提升了深度信息内容。深度摄像头猎取图像方式分为主动式猎取和被动式猎取。二者的要紧区不集中在观测传感器是不是主动向环境发出探测光。如大疆精灵4上的双目视觉就是被动式猎取深度图像,其技术特点是摄像头不主动向环境中发射能量,而利用两个之上摄像头计算特征点的坐标差得出感知环境中目前有能力得到信息内容,这一方式与人类双眼得到时差的方式最为相近,但最大的弊端在于限于目前的技术,目前的识不精密度还不高,过于依靠光线,而且无法处理特征不明显的场景,因而强光暗光都会造成深度计算的失效。


    主动式猎取所采纳的方式则是从蝙蝠等生物上查找灵感,利用主动发射探测光利用计算猎取深度图像。这当中又分为三类:“RF-modulatedlightsourceswithphasedetector”、“Rangegatedimagers”、“DirectTime-of-Flightimagers”,如Kinect一代所采纳的PrimeSense就属于第二类,伴随着苹果购买PrimeSense,微软也在Kinect二代中改为微软自有技术,通常觉得二代采纳的是直截了当TOF的技术。


    以Kinect的深度摄像头为例子,它包括了一个红外投射器、一个RGB摄影头和一个红外感应器,由于深度摄像头自带灯源,而且是不可见的红外光,对我们的生活无任何妨碍。大概深度摄像头猎取景深信息内容就类似完美了,但也有他的弊端。由因而主动方式,两个同波段红外光会浮现干涉,造成两台一样的深度摄像头没有方法一起使用,而且受发射输出功率的妨碍,检验距离也会受到非常大妨碍。


    市面上常见的深度摄像头,Kinect距离最远,但也必须最达到到12W的用电供给,拖一根配电线很是累赘。同时,深度摄像头还难以运用于户外,由于太阳中也有红外成分,会对主动红外光部分造成干扰。红外光关于玻璃情景,也无计可施,浮现无法探测距离的情况。


    困难中的尝试


    Kinect一代售罄一空之后,对Kinect二代的关联更加严厉,这更加抑制了销售量;LeapMotion两年前由于销售情况不如预期,不得不解雇了10%的职员,切入虚拟现实;苹果购买了Primesense之后也不明白在盘算什么小九九,有分析称苹果打算放到iPhone上,这般我们拍照时就能拍出三维效果的了;另一边Intel则将目标对准了机器设备人无人机,比如小米的机器设备人SegwayRobot和昊翔的无人机TyphooonH。机器设备人和无人机正是这两年的大热商品,看上去Intel很有可能会成为赢家,但由于SegwayRobot和TyphooonH都还未正式发售,因而效果如何还有待检验。也便是讲,在消费级市场还没有一个特不成功的案例。


    而在国产,Intel的RealSense出来之后,给了国产一些创从业者的信心,因而催生了一批有关的创业企业,但目前成规模的运用也寥寥无几。


    奥比中光是其中最早完成量产的,其深度摄像头与Kinect一样,要紧运用在一些电视游戏上;与奥比中光有直截了当竞争的是华捷艾米,只只是在商品量产上,华捷艾米的进度慢了一步;图漾的商品则正在预备量产时期中,瞄准的方向基础上些行业领域运用,大概对消费运用还在观望时期;格灵深瞳正在做运用在全自动驾驶汽车子上的深度摄像头;速感看好机器设备人。


    机器设备人是目前受欢迎的运用行业,目前机器设备人的路径规划大多使用雷达,雷达尽管只能建立平面的深度图像,但市场上类似有公开商品,而且雷达的导航所用到的SLAM方案类似较为成熟,而视觉导航的SLAM方案则还很少见,iRobot是较早开始在其扫地机器设备人上使用SLAM方案,只是也不到1年时刻,因而想要在机器设备人上使用视觉避障与导航,看上去还必须一段时刻。‍