2024年诺贝尔物理学奖爆冷颁给两位机器学习科学家。机器学习为何值得诺贝尔物理学奖?
10月8日,复旦大学计算机科学技术学院教授、博导、上海市数据科学重点实验室主任肖仰华在接受澎湃科技采访时表示,“神经网络的两种基本实现机制之所以受到物理奖的青睐,是因为这两个模型的设计受到了物理学方法的启发,都和统计物理中的伊辛模型(Ising Model,一类描述物质相变的随机过程模型)有着高度关系,完全可以从统计物理学角度重新解读两个网络模型。”
“AI值得诺奖,或者说不把诺奖发给AI,诺奖可能就不会那么重要,毕竟AI在改变而且深刻改变世界,包括科学研究范式。”上海交通大学物理与天文学院、自然科学研究院教授洪亮告诉澎湃科技。
瑞典皇家科学院8日宣布,将2024年诺贝尔物理学奖授予美国普林斯顿大学的约翰·霍普菲尔德和加拿大多伦多大学的杰弗里·欣顿。视觉中国 图
“AI值得诺奖”
普林斯顿大学的约翰·J·霍普菲尔德(John J. Hopfield)和加拿大多伦多大学的杰弗里·E·辛顿因“通过人工神经网络实现机器学习的基础性发现和发明”,获得2024年诺贝尔物理学奖。获奖者将共享1100万瑞典克朗(约合745万元人民币)奖金。
今年的两位诺贝尔物理学奖得主约翰·霍普菲尔德和杰弗里·辛顿从20世纪80年代开始就在人工神经网络方面开展了重要工作。他们使用了物理学的工具来开发方法,这些方法是当今强大的机器学习的基础。肖仰华介绍,两位诺奖得主的成果是两种神经网络的基础架构,各有其特性。霍普菲尔德网络可用于数据的存储和重现,辛顿发明的玻尔兹曼机常用作特征提取、降维处理。
洪亮介绍,霍普菲尔德借鉴物理学中自旋系统和能量态分布概念,将复杂的神经网络问题转化为能量最小化问题,1982年发明了霍普菲尔德网络。这是一种递归神经网络,具有对称连接和能量函数,用于存储和检索模式。大脑就像一个巨大的记忆库,能够通过一点线索回想起完整的记忆。霍普菲尔德网络就是模拟这种记忆过程的神经网络模型。
1985年,辛顿等人提出了玻尔兹曼机,这是对霍普菲尔德网络的扩展。玻尔兹曼机引入了随机性,神经元状态以一定概率更新,遵循玻尔兹曼分布。两者同样使用能量函数,但通过模拟退火等方法,玻尔兹曼机能够跳出局部最小值,找到全局最优解。
洪亮表示,机器学习获得诺贝尔物理学奖的直接原因是,约翰·霍普菲尔德发明了帮助寻找缺少图像的有记忆能力的网络——霍普菲尔德网络,而辛顿基于霍普菲尔德网络发明了玻尔兹曼机。但更深层次原因在于,“AI值得诺奖,或者说不把诺奖发给AI,诺奖可能就不会那么重要,毕竟AI在改变而且深刻改变世界,包括科学研究范式。”
跨学科研究彰显潜力
正如诺奖官方评价称,物理学为机器学习的发展提供了工具,物理学作为一个研究领域如何也从人工神经网络中受益将是有趣的。长期以来,机器学习一直被用于以前诺贝尔物理学奖中熟悉的领域,包括用机器学习筛选和处理发现希格斯粒子所需的大量数据、寻找系外行星。
近年来,人工智能技术也开始用于计算和预测分子和材料的性质,比如计算蛋白质分子的结构,或者计算出可用于更高效的太阳能电池的材料。
“诺贝尔物理学奖授予机器学习,跨学科研究彰显出巨大潜力。”肖仰华表示,跨学科研究或将取得创新性成果,从而受到世界级奖项的认可。物理学甚至传统自然学科经过几百年的发展沉淀了大量理论和方法,对于人工智能这样的新兴学科有着巨大启发和参考意义。“在人工智能及其他新兴学科的漫长发展道路中,以更加开放的跨学科视野,融合传统自然学科的理论和方法,发展新兴学科,解决新兴学科遇到的问题,这是做出创新性成果的重要思路。”
此次诺贝尔物理学奖花落机器学习,也引起了计算机领域的震动和兴奋,看到了利用物理等相关方法开展计算机研究的可能性和前景。这是物理奖历史上第一次授予计算机领域的科学家。在为数不多的获得诺贝尔奖的计算机专家中,中国科学院外籍院士、1975年图灵奖得主司马贺(Herbert A. Simon)曾在1978年获得诺贝尔经济学奖。
值得注意的是,辛顿因在深度学习方面的贡献与约书亚·本希奥和杨立昆一同被授予了2018年的图灵奖,而约翰·霍普菲尔德还不曾获得计算机领域的这一最高奖。肖仰华表示,这也表明,在不同学科视角下,对科学贡献的看法是不同的。
澎湃新闻记者 张静
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)