你好,欢迎来到川北在线
微信
腾讯微博
新浪微博
一文了解能大幅提高虚拟现实沉浸感的手势识别技术
时间:2017-05-04 10:25   来源:VR观察   责任编辑:毛青青

  手势识别是近年来大热的人机交互方式。由于功能炫酷、操作方便,智能家居、智能穿戴设备、智能汽车以及VR/AR等领域都增加了手势识别控制功能。

  手势识别的发展历程

  最初的手势识别主要是利用穿戴设备,直接检测手、胳膊各关节的角度和空间位置。这些设备多是通过有线技术将计算机系统与用户相互连接,使用户的手势信息完整无误地传送至识别系统中,其典型设备如数据手套等。这些设备虽可提供良好的检测效果,但将其应用在常用领域则价格昂贵。

  其后,光学标记方法取代了数据手套将光学标记戴在人手上,通过红外线可将人手位置和手指的变化传送到系统屏幕上,该方法也可提供良好的效果,但仍需较为复杂的设备。

  外部设备的介入虽使得手势识别的准确度和稳定性得以提高,但却掩盖了手势自然的表达方式为此,基于视觉的手势识别方式应运而生。视觉手势识别是指对视频采集设备拍摄到的包含手势的图像序列,通过计算机视觉技术进行处理,进而对手势加以识别。

  基于视觉的手势识别分类

  基于视觉的手势识别技术的发展是一个从二维到三维的过程。早期的手势识别是基于二维彩色图像的识别技术,就是指通过普通摄像头拍出嘲后,得到二维的静态图像,然后再通过计算机图形算法进行图像中内容的识别。随着摄像头和传感器技术的发展,可以捕捉到手势的深度信息,三维的手势识别技术就可以识别各种手型、手势和动作。

   二维手型识别

  二维手型识别,也称静态二维手势识别,识别的是手势中最简单的一类。只能识别出几个静态的手势动作,比如握拳或者五指张开。

  这种技术只能识别手势的“状态”,而不能感知手势的“持续变化”。说到底是一种模式匹配技术,通过计算机视觉算法分析图像,和预设的图像模式进行比对,从而理解这种手势的含义。因此,二维手型识别技术只可以识别预设好的状态,拓展性差,控制感很弱,用户只能实现最基础的人机交互功能。

  其代表公司是被Google收购的Flutter。使用他家的软件之后,用户可以用几个手型来控制播放器。

  Flutter软件的工作机制

   二维手势识别

  二维手势识别,仍不含深度信息,停留在二维的层面上。这种技术比起二维手型识别来说稍复杂一些,不仅可以识别手型,还可以识别一些简单的二维手势动作,比如对着摄像头挥挥手。

  二维手势识别拥有了动态的特征,可以追踪手势的运动,进而识别将手势和手部运动结合在一起的复杂动作。这种技术虽然在硬件要求上和二维手型识别并无区别,但是得益于更加先进的计算机视觉算法,可以获得更加丰富的人机交互内容。在使用体验上也提高了一个档次,从纯粹的状态控制,变成了比较丰富的平面控制。

  其代表公司是来自以色列的PointGrab,EyeSight和ExtremeReality。

  PointGrab公司手势识别软件的智能家居

   三维手势识别

  相比较二维手势识别,三维手势识别增加了一个Z轴的信息,它可以识别各种手型、手势和动作。这种包含一定深度信息的手势识别,需要特别的硬件来实现。常见的有通过传感器和光学摄像头来完成。

  目前主要有3种硬件实现方式,加上先进的计算机视觉软件算法就可以实现三维手势识别了。

   结构光(Structure Light)

  这种技术的基本原理是,通过激光的折射以及算法计算出物体的位置和深度信息,进而复原整个三维空间。不过由于依赖折射光的落点位移来计算位置,这种技术不能计算出精确的深度信息,对识别的距离也有严格的要求。

  结构光测量原理

  以PrimeSense的Kinect一代的结构光技术为例,在太近的距离上,折射导致的位移尚不明显,使用该技术就不能太精确的计算出深度信息,所以1米到4米是其最佳应用范围。

   光飞时间(Time of Flight)

  光飞时间的原理在于:加载一个发光元件,通过CMOS传感器来捕捉计算光子的飞行时间,根据光子飞行时间推算出光子飞行的距离,也就得到了物体的深度信息。就计算上而言,光飞时间是三维手势识别中最简单的,不需要任何计算机视觉方面的计算。

  光飞时间测距方法

  SoftKinetic公司为Intel提供带手势识别功能的三维摄像头。同时,这一硬件技术也是微软新一代Kinect所使用的。

  Intel实感摄像头可识别三维手势

   多角成像(Multi-camera)

  该技术使用两个或者两个以上的摄像头同时采集图像,通过比对这些不同摄像头在同一时刻获得的图像的差别,使用算法来计算深度信息,从而多角三维成像。

  基于双摄像头的手势识别

  多角成像是三维手势识别技术中硬件要求最低,但也是最难实现的。多角成像不需要任何额外的特殊设备,完全依赖于计算机视觉算法来匹配两张图片里的相同目标。相比于结构光或者光飞时间这两种技术成本高、功耗大的缺点,多角成像能提供“价廉物美”的三维手势识别效果。

  该技术的代表产品是Leap Motion公司的同名产品和Usens公司的Fingo。

  手势识别作为人机交互的重要组成部分起着至关重要的作用。目前手势识别仍有一系列问题,如受复杂环境因素制约等,亟待解决。相信随着计算视觉技术的全面发展,手势识别必然向更自然和灵活的方向发展,未来的人机交互也将更加自然、更加融合。

   投稿邮箱:chuanbeiol@163.com   详情请访问川北在线:http://www.guangyuanol.cn/

川北在线-川北全搜索版权与免责声明
①凡注明"来源:XXX(非在线)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,本网不承担此类稿件侵权行为的连带责任。
②本站所载之信息仅为网民提供参考之用,不构成任何投资建议,文章观点不代表本站立场,其真实性由作者或稿源方负责,本站信息接受广大网民的监督、投诉、批评。
③本站转载纯粹出于为网民传递更多信息之目的,本站不原创、不存储视频,所有视频均分享自其他视频分享网站,如涉及到您的版权问题,请与本网联系,我站将及时进行删除处理。



图库
合作媒体
IT袋 绿植迷 金宠物 领啦网
法律顾问:ITLAW-庄毅雄律师