清华翟荟：人工智能可以揭开量子物理学的奥秘吗？

浏览 1463 · 点赞 0 · 评论 0 · 4年前 (2021-06-04)

编者按：物理学作为一个基础科学，与人们的生活息息相关。揭示物质世界微观粒子运动规律的量子物理，更能够让人类进一步认识和理解世界的本质。如果把能够深度挖掘数据规律的人工智能技术应用到量子物理领域，将会产生怎样的火花？近日，清华大学高等研究院翟荟教授受邀来到微软亚洲研究院，分享了量子物理研究与人工智能方法相结合的前沿探索。本文为大家整理了翟教授演讲的精彩内容。

翟荟

清华大学高等研究院教授

1998年进入清华大学物理系基础科学班，2002年本科毕业，2005年1月在清华大学高等研究中心获物理学博士学位。2005-2007年美国俄亥俄州立大学博士后，2007-2009年美国加州大学伯克利分校和洛伦兹伯克利国家实验室博士后。2009年起任清华大学高等研究院研究员，2012年获得长聘，2015年任高等研究院教授。2016年被评为教育部长江学者特评教授，2019年获得中国物理学会饶毓泰奖。发表 SCI 论文百余篇 SCI 总引用约5000余次，Google Scholar 总引用8200余次。

物理学是传统的实验科学，主要研究目标是从实验数据中挖掘自然界的规律。这些实验数据可能来自物理实验室，也有可能来自日常观察。实验数据往往只是现象，那要如何透过现象来看本质？答案是利用大脑提取规律的能力。

例如，早在几百年前，天文学家第谷对天体的运动做了很多观测，积累了大量的天体运动数据。随后，他的学生开普勒用自己的大脑，从这些数据中发现了开普勒三定律，并为之后物理学家们发现牛顿力学奠定了基础；通过吸收光谱的数据，“看出”光的吸收能量满足1/n^2的离散化规律，从而启发了量子力学的诞生。

机器学习作为对数据进行分析处理的一项技术，从挖掘信息和提取规律的角度来看，它和物理学有很大的相似之处。我们主要研究了物理学和机器学习之间的三个联系：

第一，将机器学习方法应用到量子物理及其他物理学分支；

第二，借用物理学概念和描述解释机器学习的方法和原理；

第三，面向未来，将机器学习方法应用到未来的量子计算机上。

应用机器学习，解决物理问题

当我们谈论机器学习的时候，经常提到 AlphaGo 和图像识别。AlphaGo 的本质其实是优化问题，即在一个多参数空间里，通过优化参数找到一个最优解。这其实可以对应物理学研究中实验参数的控制问题，通常实验室中需要调节的参数很多，传统的物理实验还需要“手工”调节，非常耗费精力。而且物理实验的结果通常以图片形式展示，例如天体照片，光谱信号图等。如何从这些图片中挖掘出信息和特征，恰好可以借助采用了机器学习的图像识别技术。

因此，从数据挖掘的角度来看，机器学习和物理问题非常匹配。但从大数据的角度来看，由于物理问题中的数据量偏少，机器学习在处理物理问题时还存在着挑战。所以，我认为接下来两个领域交叉研究的核心可能是：在数据量不多的情况下，如何将机器学习方法成功地应用到物理学中。

机器学习在物理问题的一个应用是控制参数优化，主要价值是提供更加经济有效地收集训练数据的思路。在实验参数控制问题中，数学描述是优化可量化的控制参数，能够帮助实验系统达到控制目标。实验控制参数与实验目标之间的映射函数非常复杂，为了找到复杂映射函数的极值点，我们用神经网络来拟合此复杂函数，但是由于数据点不足，很难在全空间将此函数精确拟合。但是我们关心的并不是全空间的函数，只需要找到其极值点即可。因此，利用 Active Learning 的思想，根据神经网络的预测结果收集包含更多函数极值点附近信息的训练数据，然后将这些数据输入神经网络进行训练，再不断调整神经网络对函数极值点附近的预测，从而提高准确率。

我们将此方法应用到冷原子系统的蒸发冷却实验中，其实验原理是：通过调节实验系统中的光强，实现对热原子的降温，达到量子简并或制备玻色-爱因斯坦凝聚体（BEC）。在与山西大学研究小组的合作中，我们只收集了一两百组数据，就能够在玻色子中通过蒸发冷却实现 BEC 的制备。该方法不仅可以应用在物理实验系统中，还可以普适地应用到各种控制问题，通过很少的数据集优化控制参数。

利用机器学习扩充物理问题的数据量也是一个重要的应用方向。对于一个物理系统，由于已知其大致物理性质，因此可以通过已知理论模拟产生大量数据，从而用于数据识别模型的训练。但物理理论与实际系统存在差别，例如实际中会存在各种噪音、样品杂质、系统不稳定等因素，这就导致理论与实验不是完全吻合。这时，数据识别模型的训练原则是，不仅要准确识别数据，还要求模型对实际数据的识别尽可能有较高的置信度，不要“模棱两可”。

根据此原则，在模拟数据中训练好的识别模型在对真实的实验数据预测中，也能产生很好的结果。我们将此方法引用到了扫描隧道显微镜（STM）实验图片中，希望分析材料中的杂质位置（STM 是在物理实验中分析材料最基础、最常用的实验方法之一）。如图2所示，利用我们提出的机器学习方法，在很少的 STM 数据图片中，我们也能够高准确率预测到杂质位置。

（左图）实验与理论数据结合的神经网络模型；（右图）不同数据和结构的预测准确率

利用物理概念，理解机器学习

和社会学问题截然不同，物理学背后有一个可以量化的规律，并可以用确定的数学公式描述出来。我们能够用机器学习分析物理数据、发现物理规律，那么如何用物理学中的概念解释机器学习的结果呢？

一个方面，我们用神经网络对量子系统中的拓扑数进行学习，通过对一维拓扑量绕数（Winding number）和二维拓扑数（Chern number）的学习，神经网络能够对训练集以外的拓扑量进行准确预测。通过分析神经网络的数学计算，我们发现它确实学会了用数学公式计算拓扑数。

训练绕数的神经网络结构

卷积神经网络和全连接神经网络预测结果

另一方面，利用循环神经网络（RNN）对量子波函数的演化进行学习，在对波函数的演化有很准确的预测以后，我们通过自动编码器对隐层的信息进行高度概括和提取，发现RNN对波函数的演化类似于量子力学中的薛定谔方程。这和人们基于逻辑总结的物理知识是一致的。由此，我们实现了利用物理知识对机器学习进行分析和解读。

RNN-AE架构学习薛定谔方程

基于量子计算，发展机器学习

量子计算是一个新兴发展的领域，近两年受到了广泛关注。由于量子力学保证，波函数的演化是一个幺正演化，属于线性变换，而经典神经网络是非线性函数，属于非线性变换。因此，在量子神经网络中，波函数的信息是没有损失的，系统总的熵是守恒的。

所以我们可以从信息扩散的角度出发，研究在量子神经网络学习的过程中信息的扩散方式。由此理解量子神经网络的动态学习过程，并且帮助我们设计量子神经网络的结构。

量子神经网络基本结构与信息扩散

这里我们介绍了机器学习与量子物理在三个方面的结合：借助机器学习对数据处理的优势用于发现背后的量子物理规律，可以帮助我们发现新的物理规律；对于特定量子物理问题进行研究，改进机器学习中的算法，能够在小数据量的情况下帮助我们更高效地达到目标，节约资源，突破传统方法的极限；基于量子计算的框架对机器学习算法的研究，可以为未来在量子计算机上实现机器学习起到一定的推动，促进量子机器学习的发展。相信 AI 与量子物理的叠加，会“颠覆”两个领域乃至相关科学领域的发展。

原文链接：http://www.toutiao.com/a6969891420505195040