虚拟现实最核心技术——手势识别的投资机会

VR(虚拟现实)之火毋庸讳言,但是相对于VR投资的火热来说,VR设备的普及还明显不够,这其中有价格因素的原因也有内容不够丰富的原因,但是最主要的原因还是用户体验,而对用户体验影响颇大的因素则是人机交互方式。

在消费电子领域向来是一代交互一代产品iPhone的出现淘汰了按键手机,亚马逊近期语音助手Echo的火爆也给智能家居领域带来了前所未有的冲击。如果说触摸屏是手机最理想的人机交互方式,语音语义识别是智能家居最好的人机交互方式,那么手势识别无疑是VR设备最好的交互方式。

因为手势识别能让你的身体跟虚拟世界中的各种场景互动,这样能有效降低晕动症的发生,并大大提高沉浸感。对于沉浸感至上的虚拟现实而言,手的天然性保障了不被打扰的用户体验、精细便捷的操作、较低的成本,更是未来大规模普及的重要前提。

在目前的消费级VR设备中,除了三大设备外(HTC vive、Oculus rift、PS VR),大部分的VR设备不具备配套的手势识别,因此,优势明显的手势识别技术有可能将成为VR产业的分水岭。

什么是手势识别?

手势识别是基于计算机视觉、使用光学跟踪而运作。手势识别通常使用红外线LED外加两个摄像头,利用红外线遇障碍物反射光线和双目立体成像原理,对手势的图像同时进行采集,通过算法处理进行校准匹配、3D建模,从而生成相关的三维手部信息。再通过手部特征点的位置、姿态变化等信息进行手部运动的计算,获得手部坐标和向量,进而对手势进行跟踪。

f269177ef4aee4b101e878376a3182f1

目前手势识别大概可以分为两个等级:二维手势识别、三维手势识别。

二维手势识别可以识别一些简单的二维手势动作我们可以用(X坐标,Y坐标)来表示坐标系,拥有了动态的特征,可以追踪手势的运动,进而识别将手势和手部运动结合在一起的复杂动作。这样一来,我们就把手势识别的范围真正拓展到二维平面了。我们不仅可以通过手势来控制计算机播放/暂停,我们还可以实现前进/后退/向上翻页/向下滚动这些需求二维坐标变更信息的复杂操作了。其代表公司是来自以色列的PointGrab,EyeSight和ExtremeReality。

三维手势识别需要的输入是包含有深度的信息,我们可以用(X坐标,Y坐标,Z坐标)来表示坐标系,可以识别各种手型、手势和动作。相比于二维手势识别技术,三维手势识别技术要复杂很多,目前主要由3种硬件方式实现:立体视觉、结构光模式以及渡越时间。

立体视觉

9bf293a91c3b19f07c9628ff4ec0f611

立体视觉系统可能是最为人所熟知的三维采集系统。该系统使用2个摄像机获得左右立体影像,该影像有些轻微偏移,与人眼同序。计算机通过比较这两个影像,就可获得对应于影像中物体位移的不同影像。该不同影像或地图可以是彩色的,也可以为灰阶,具体取决于特定系统的需求。就好像是人类用双眼、昆虫用多目复眼来观察世界,通过比对这些不同摄像头在同一时刻获得的图像的差别,使用算法来计算深度信息,从而多角三维成像。代表产品是Leap Motion公司的同名产品和Usens公司的Fingo。

结构光方式

结构光方式可用来测量或扫描三维对象。在该类系统中,可在整个对象上照射结构光模式,光模式可使用激光照明干扰创建,也可使用投影影像创建。使用类似于立体视觉系统的摄像机,有助于结构光模式系统获得对象的三维坐标。此外,单个二维摄像机系统也可用来测量任何单条的移位,然后通过软件分析获得坐标。无论使用什么系统,都可使用坐标来创建对象外形的数字三维图形。代表应用产品就是PrimeSense公司为大名鼎鼎的微软家XBOX 360所做的Kinect一代了。

渡越时间

渡越时间传感器是一种相对较新的深度信息系统。渡越时间系统是一种光雷达 (LIDAR) 系统,这种技术的基本原理是加载一个发光元件,发光元件发出的光子在碰到物体表面后会反射回来。使用一个特别的CMOS传感器来捕捉这些由发光元件发出、又从物体表面反射回来的光子,就能得到光子的飞行时间。根据光子飞行时间进而可以推算出光子飞行的距离,也就得到了物体的深度信息。代表应用为SoftKinetic为Intel提供带手势识别功能的三维摄像头。

三种技术的优缺点:   

94e31d1c7d3b5cad7c62c7168b4d6933

文章下二维码15

责任编辑:
分享到QQ 分享到微信

0 条评论

头像发表我的观点

取消

  • 昵称 *
  • 邮箱 *
  • 网址

登录

忘记密码 ?

切换登录

注册