人工智能对科学发现范式的创新 | 社会科学报


来源: 作者: 发布时间: 2024-12-23 浏览:3

深度


近年来,随着人工智能越来越多地融入科学发现之中,科学人工智能逐渐引起人们关注。人工智能与生物智能的差异可能使得科学发现的范式更加新颖。



原文 :《人工智能对科学发现范式的创新》

作者 | 苏州大学政治与公共管理学院教授    李继堂

图片 | 网络


人工智能(AI)的发展正在以深度学习的神经网络的复兴达到顶峰,特别是生成式AI中的大语言模型(如ChatGPT)和扩散模型(如Sora)。事实上,AI不断增强的计算能力加上大规模数据集,使得深度学习方法正在成为各种领域的主导方法,包括在广泛的空间和时间尺度上,通过对自然现象的理解来推进自然科学,从而产生了一个新的研究方向,被称为科学人工智能(AI for Science)。


在ChatGPT和Sora引起轰动之前,科学人工智能早已在科学界引人注目,科学家们甚至认为这是一次新的科学发现的范式革命。第一个科学发现范式以天文学家第谷为代表,科学的基础纯粹是经验性的观察;第二个科学发现范式以牛顿的《自然哲学的数学原理》为代表,对科学现象的理论探索主要以自然界的数学定律为基础;第三个科学发现范式以麦克斯韦方程和薛定谔方程为代表,对科学的理解和发现主要以实验观察和理论计算为基础;第四个科学发现范式就是以科学人工智能为代表,对科学的发现主要以数据密集型科学的方法和技术为基础。如果说前面三个科学发现的范式是以人类智能(自然智能)为主的话,第四个科学发现的范式则是以AI为主,特别是以机器学习中的深度学习为核心。而AI跟生物智能的差异可能使得第四个科学发现的范式更加新颖。


生物智能与人工智能的差异


人工神经网络是什么呢?这项技术最初受到人类大脑结构的启发。在人工神经网络中,大脑的神经元被表征为具有不同数值的节点,这些节点通过可以类比为突触的连接来相互影响,其连接的强度可以增强或减弱。重要的是人工神经网络可以被训练,例如发展一些数值高的节点之间的强连接,而这样的连接可以越来越多,以至于某方面的功能可以很快超过人脑神经网络。


哈佛大学著名物理学家马修·施瓦茨专门撰文《人工智能对人类来说是可解释的吗?》,考察的问题是:在AI对科学贡献越来越大的情况下,科学家们越来越想知道AI是如何得出它们的结论的。施瓦茨专门讨论“理解AI意味着什么”“人类能否真正理解AI,甚或有没有这样的必要”。在他看来,这些问题背后都是人类中心主义在作祟。试图用人类的方式理解AI,跟科学史上的教训没有什么不同,比如,天文学教会我们,我们并不处在宇宙的中心;地质学教会我们,地球并不是只有六千年的历史;超弦理论教会我们,宇宙并不是万有理论的唯一解。同样,AI可能再次粉碎人类的自恋情结。


问题的关键是,可能人类真的无法理解AI所能够理解的概念和思维方式,AI很可能会超出我们的视野,其进行科学发现的新范式跟前三个范式具有明显的不可通约性。传统认为,如果说你理解了一个科学概念,除非你能够把它向小孩解释清楚。可是,人类跟AI认知能力之间的差距可能大于诺贝尔奖获得者跟小孩之间的差距。正如施瓦茨所说的,“我们如何把知识传递给一个感知世界方式跟我们完全不同的智能体?”就像我们不能够指望教会一只猫微积分一样。反过来,AI也可能拥有超出人类习惯的理解力。



对称性研究中的科学人工智能


近代科学革命是从天文学革命开始的,但是哥白尼(《天球运行论》,1543年)提出日心说后,基本上没有人相信,最主要的原因是,日心说认为地球除了绕日公转外,每天二十四小时还要自转,地面上的人也会和地球以每小时好几百公里的速度一起转动,我们却观察不到。直到七十年后,伽利略(《关于托勒密和哥白尼两大世界体系的对话》,1632年)才对所谓“伽利略相对性原理”进行了较好的论证,认为地球在运动,只是我们观察不到而已。伽利略生动的描述如下:“把你和一些朋友关在一条大船甲板下的主舱里……船停着不动时,你留神观察,小虫都以等速向舱内各方面飞行,鱼向各个方向随便游动,水滴滴进下面的罐子中。你把任何东西扔给你的朋友时,只要距离相等,向这一方向不必比另一方向更用力,你双脚齐跳,无论向哪个方向跳过的距离都相等……再使船以任何速度前进,只要运动是匀速的,也不忽左忽右地摆动。你将发现,所有上述现象丝毫没有变化,你也无法从其中任何一个现象来确定,船是在运动还是停着不动。”


船舱内所有上述现象及其运动规律,在船静止时和匀速运动时是完全一样的,这就是伽利略相对性原理。用物理学语言表述为:从一个参照系到另一个相对匀速运动的参照系,力学规律保持不变。稍作推广:从一个参照系到另一个相对匀速运动的参照系,物理学规律保持不变,就是爱因斯坦狭义相对性原理。再进一步推广:从一个参照系到另一个相对变速运动的参照系,物理学规律保持不变,就是爱因斯坦广义相对性原理。后来,外尔提出的规范不变性原理把广义相对论的局域对称性推广到电磁理论领域,进一步发展成杨-米尔斯理论中的局域规范对称性原理后,就成为弱电理论和量子色动力学的核心。加上量子力学和粒子物理中各种守恒量相对应的对称性,以至于著名物理学家安德森曾说:“说物理学是关于对称性的研究,只是稍微夸大了一点点。”由此可见对称性原理在物理学中的基础地位。然而,科学人工智能的发展可能会改变上述思维方式。


显然,人类对对称性理解是跟人的观察经验紧密相关的,从伽利略相对性原理的对称性到相对论的对称性都跟时空相关,是一种外部对称,通过第一个科学发现范式和第二个科学发现范式,就能够发现这些对称性及其对应的科学定律。局域规范对称性及其对应的科学定律,也可以通过第三个科学发现范式来发现。从某种意义上讲,并不是说没有这些对称性,相应的物理定律就无效,只是说其不容易推导出来,它们本身还是客观存在的。只是人类的思维习惯和科学视角,通过经验(观察和实验)和数学容易把对称性和相应的物理学定律联系起来。换成AI,它们理解事物的方式跟人类不一样,它们能够直接处理大量的密集型数据,它们可能不一定通过对称性去发现物理学定律,它们可以直接通过数据之间的关系发现物理学定律,甚至得出远远超出前三个科学发现范式所能够发现的物理学定律,就像AlphaGo用不同于人类棋谱的招式打败棋王一样。



量子力学中的科学人工智能


量子力学是当代物理学的最主要支柱之一,不仅很好描述了原子和亚原子粒子的规律,而且是当代技术的基础。事实上,科学家早就知道计算在加速自然科学发现方面的重要性,著名量子物理学家狄拉克有句名言:“大部分物理和整个化学的数学理论所需要的基本物理规律,已经完全知道,而困难仅仅在于这些规律的确切应用,导致方程太过复杂而解不了。”薛定谔方程提供了量子系统行为的精确描述,但由于其指数级增长的复杂度,解这样的方程只能在非常小的系统中实现。而深度学习方法可以加速这些方程的解的计算。


当代粒子物理,由于其计算量的庞大,特别需要AI新技术对其实验进行设计,作出粒子物理标准模型和超出标准模型的理论的预测,并且对其进行比较。目前,优化、模式识别(如对撞机事件)、数值整合、生成模型、外推、插值、回归和替代模型的机器学习方法已经发挥大作用,但是在这些方法越来越强大的同时,其计算就越来越不透明,人类会越来越想理解它们。


施瓦茨曾经举了一个例子,从衰变产物中寻找顶夸克,传统方法是使用该领域的知识来表征这些衰变产物。机器学习的方法则是对模拟数据训练一个神经网络,而不需要粒子物理标准模型的任何洞见。结果是,机器的性能明显优于传统方法。施瓦茨指出,我们所能做的只是把对机器的理解简化为我们的语言,因为我们无法直接处理它的语言。人类无法理解机器的思维。


在其他领域,如天文学、宇宙学、气候变化、能源、环境科学、生命科学、材料科学等具有真正大数据的学科,科学人工智能更容易发挥作用。也就是说,科学人工智能正在悄然改变科学发现的范式。