重大突破！家庭机器人将梦想成真

重大突破！家庭机器人将梦想成真

发布时间：2017-05-03 来源：金属加工

要想让机器人做家务，首先它得具有区分咖啡桌和婴儿床的能力。这看似简单，但现在大部分的机器人都做不到。

由斯坦福大学、普林斯顿大学和慕尼黑理工大学的研究人员捕捉的庞大的3D图像数据库也许能解决上述难题。

这个叫做ScanNet的数据库包含数千个生活场景，并对数以百万计的物件加以注释，如咖啡桌、沙发、台灯、电视等。过去五年里，计算机视觉技术突飞猛进，这一部分要归功于斯坦福大学另一个研究团队发布的2D图像数据库ImageNet。该数据库包含一系列带有标注的图像，比3D图像数据库更为简单。相比之下，ScanNet能提供更多的数据。

“ImageNet包含十分重要的注释数据，掀起了AI技术革命。”Matthias Neissner教授如是说道。Matthias Neissner是慕尼黑理工大学的教授，也是开发此套数据集的研究人员。

研究人员希望，ScanNet能让机器更深入地了解身边的现实世界，并投入到现实的应用中去。“最明显的例子就是，你的家庭机器人得知道身边在发生什么。”Neissner说。

Neissner当时正在斯坦福大学做客座副教授，他认为，研究人员应采用深度学习算法来使计算机更深刻地理解3D场景。该技术也曾在ImageNet数据库中有所应用。Neissner与他在斯坦福大学的学生Angela Dai、普林斯顿大学教授Thomas Funkhouser和其他一些学生共同开发出了ScanNet数据库。

近期在网上发布的一篇论文中，研究人员描述了他们捕捉图像的方法。他们使用与微软Kinect相似的3D摄像机扫描了1513个场景，以此建立起数据库。此设备采用一个传统摄像机和一个红外景深传感器，在设备前方形成一个3D图像场景。然后研究人员让志愿者在iPad上的亚马逊Mechanical Turk众包平台为每个图像加注释。为提高整体精准度，一组人员还为图像上色加注，另一组人员则通过3D建模还原扫描到的场景。

布朗大学助理教授Stefanie Tellex正在从事提高家庭机器人认知水平的研究，她指出，ScanNet比之前的任何数据库都要庞大。“3D信息对于机器人对环境的认知与互动至关重要，而当前这方面的信息还匮乏得很。”

Neissner说，ScanNet背后的团队尝试过深度学习算法，发现使用该方法的机器人只需参照物件的深度信息或形状，就能准确地认出很多物件。这意味着3D数据会让机器人更深刻地认识现实世界。他还说，采用3D信息能让机器人更好地模仿动物的认知方式。

Siddhartha Srinivasa是来自卡耐基梅隆大学机器人研究所的教授。他称，新的数据库是让机器认知家庭内部环境的“良好开端”。“ImageNet之所以备受欢迎，一方面是因为它具有庞大的数据量，另一方面是因为其图像注释能够直接投入到诸多应用中去，尤其是可以应用到实验室中。”他说，除了机器人学和建筑学外，3D数据库的应用范围很窄，但相关的应用很快就会出现。

Srinivasa还说，其他团队正采用合成场景或虚拟场景来训练机器视觉系统。“虽然模拟真实生活场景是不切实际的，但就像电影中的计算机成像技术(CGI， Computer-generated Imagery)一样，模拟场景深度是完全可能的。”（本文由林美炳编译，来源：technologyreview）

通知