kinect体感,微软解密Kinect体感游戏技术

kinect体感,微软解密Kinect体感游戏技术 去年,微软推出了体感游戏设备Kinect。它建立在此前Xbox游戏平台的基础上。和之前大红大紫的Wii相比,Kinect的玩家不需要任何握住的东西,也不需要任何按钮,就可以让屏幕中的人物按照自己需要的方式来运动了。至今,Kinect已售出了1000万台。如今,开发这套系统的科学家就业内猜测纷纷的背后技术发表了一份论文,详细解密了Kinect所使用的技术。最近的《新科学家》杂志网站对此进行了报道。
借助Kinect游戏设备,游戏玩家空手就可以进行操纵。在屏幕的一侧,装有三部摄像传感器,可以快速准确地在深度成像上预知人体关节的三维位置,然后在屏幕上再现动作。另外,四台麦克风可以传达系统识别语音命令,帮助玩家在更大的范围内运动。最近微软剑桥研究中心和“Xbox孵化所”的科研人员在计算机视觉及模式识别国际会议上公开了相关技术。
开发人员邀请了15名志愿者在摄像机前进行运动,系统的成像会对人体进行分类,将人体特征分为几组变量。这些变量是人们日常生活中常见的,比如“基本特点”对对象的性别、年龄、身高、胖瘦程度等进行辨别;“姿势”对人体的主要姿态进行辨别。其他还有诸如“旋转三维”、“头发和衣服”、“体重和高度变量”等多个类别组。Kinect每次可以追踪两个人的动态,每个人可以追踪到高达20组的细节。
Kinect在成像时可以同时通过三种方式来实现:彩色影像、3D深度影像和声音讯号。成像的最开始,计算机会首先获得一个绿色背景下的模糊的人体影像。每一个人体部分,在任何姿势的时候,都有大量的变量。连上摄像机以后,摄像机会对人体所有部分成像,每个像素都进入了“骨骼追踪算法”系统之中。Kinect还带有一个红外感应装置,因此,这个人影每一个骨骼节点的深度是可知的,就可以形成深度影像。
随后,计算机会对每一个像素进行分析评估,比如判断它是在人体的哪个部位。再接下来,每一个像素的特征变量都会在一个叫做“随机决定库”里进行搜索,看这个有着特定性质的像素是否符合一个特定的身体部位。
在这个过程中,游戏系统会收集到大量的运动捕捉数据———在最初的研究中,像哪怕跳舞、踢球或跑步这样的运动,都会产生50万的数据帧。研究者后来将数据帧数量限制在10万左右。
当设备辨别出人体部位之后,这个系统就开始计算每个人体节点的三维位置所在,Xbox系统每秒钟要做出200次的算法,比之前的人体识别技术快上10倍。这样,玩家的运动也可以被识别得更快。
数据库并不能代表所有的人体行为,而只是常见的一些行为,因此,在系统中,Kinect带上了机器学习技术,对于不常见的一些行为可以学习并放入图像资料库中。接下来Kinect要做的,就是增加机器识别的准确性,这可能需要更大的数据库,以及更快的运算速度。
编译/新京报记者金煜
Tags:  kinect体感

延伸阅读

最新评论

发表评论