现在,计算机可以驾驶汽车,在象棋和围棋之类的棋盘游戏中击败世界冠军,甚至可以撰写散文。人工智能的革命很大程度上源于一种特殊类型的人工神经网络的力量,其设计灵感来自哺乳动物视觉皮层中神经元的连接层。事实证明,这些“卷积神经网络”(CNN)擅长于学习二维数据中的模式,尤其是在计算机视觉任务中,例如识别数字图像中的手写单词和对象。
但是,如果将其应用于没有内置平面几何形状的数据集(例如3D计算机动画中使用的不规则形状的模型或自动驾驶汽车生成的点云来绘制周围环境),则这种强大的机器学习架构将无法正常工作好。2016年前后,出现了一种称为几何深度学习的新学科,其目标是将CNN摆脱平地。
现在,研究人员已经提供了一个新的理论框架,用于构建可以学习任何几何表面上的图案的神经网络。由Taco Cohen,Maurice Weiler,Berkay Kicanaoglu和Max Welling在阿姆斯特丹大学和高通AI研究中心开发的这些“等规卷积神经网络”或规范CNN不仅可以检测2D像素阵列中的图案,而且还可以检测图案在球体和不对称弯曲的物体上。韦林说:“这个框架是对曲面上的深度学习问题的绝对确定的答案。”
在模拟的全球气候数据(自然地映射到一个球体)的学习模式中,标准的CNN已经大大超过了其前辈。该算法还可能被证明对改善无人机和无人驾驶汽车的视觉效果是有用的,该无人机和无人驾驶汽车可以看到3D物体,并且可以检测从心脏,大脑或其他器官的不规则曲面收集的数据中的模式。
研究人员为使深度学习能够在平地之外工作的解决方案也与物理学有着深厚的联系。像阿尔伯特·爱因斯坦的广义相对论和粒子物理学的标准模型那样,描述世界的物理理论具有一种称为“量规等方差”的性质。这意味着世界上的数量及其关系不依赖于任意参照系(或“量规”);无论观察者是移动还是静止不动,无论标尺上的数字有多远,它们都保持一致。在那些不同的量表上进行的测量必须能够以相互之间保持不变的方式相互转换。
例如,假设测量一个足球场的长度(以码为单位),然后再次以米为单位进行测量。这些数字将改变,但以可预测的方式。同样,两位摄影师从两个不同的有利位置拍摄物体的照片会产生不同的图像,但是这些图像可以彼此关联。量表的等方差可确保物理学家的现实模型保持一致,无论他们的观点或测量单位如何。规范CNN对数据做出了相同的假设。
纽约大学的物理学家凯尔·克兰默(Kyle Cranmer)说:“(来自物理学的)同样的想法是没有特殊的方向,他们希望将其引入神经网络。”他将机器学习应用于粒子物理学数据。“他们想出了办法。”