据外媒报道,卡内基梅隆大学机器人学院(CMU RI)的科学家正在研究一种可以解读人类肢体语言的计算机系统,其识别范围甚至可以缩小到手指。这个新进程可以实时运行,为人们和机器交互开辟更自然的方式。

科学家研发出可以解读人类肢体语言的新系统 范围缩小到手指-玩懂手机网 - 玩懂手机第一手的手机资讯网(www.wdshouji.com)

目前,人们与计算机交互主要限于打字、鼠标点击和触摸屏等。虽然智能语音交互技术也被添加到该列表中,但却很难让电脑识别人们的肢体语言。这些通常非常微妙,并且包括可以被物体或其他人遮挡的个体手指的位置的细节。除此之外,虽然大型数据库存在注释的面部表情和身体位置,但并没有任何手势和姿势。

科学家研发出可以解读人类肢体语言的新系统 范围缩小到手指-玩懂手机网 - 玩懂手机第一手的手机资讯网(www.wdshouji.com)

卡内基·梅隆机器人副教授Yaser Sheikh领导的团队找出了一些解决这个问题的方法。第一种方法是是通过让研究生站在摄像机前面,摆出数千种不同的姿势和手势,为计算机提供更多的数据。

第二种方法是颠倒了计算机解读姿势的通常顺序。计算机不是通过整体,而是通过手指、手臂,腿部和脸部等单独部位的动作或表情来进行解读。

第三种方法是在CMU的全景工作室的两层屋顶上装了500台摄像机,每拍摄一个动作都可以呈现出几百张图像。这使得计算机可以从数百个不同的角度来研究姿势。

博士生Hanbyul Joo表示:“单次拍摄可以让您看到一个人手部的500张图像,并自动注释手的位置。手由于太小无法被大多数设备注释,但是对于这项研究,我们只使用了31台高清摄像机,但仍然能够构建一个庞大的数据集。”

该团队正在努力如何从2D模型转换至3D模型以获得更好的识别效果。