10_副本

施郁

中国科学技术大学教授

复旦大学物理学系原教授

2018年5月28日,复旦大学举办的上海论坛进行了题为“脑科学与机器学习:下面是什么?”(BrainScienceand MachineLearning:WhatNext?)的高端对话,由复旦大学新闻学院教授张力奋主持,演讲嘉宾包括英国皇家学会院士、2017年“大脑奖”得主彼得?·达扬(PeterDayan),伦敦大学学院计算机系教授李兆平,复旦大学物理学系教授施郁,复旦大学哲学学院教授徐英瑾,小i机器人公司CEO朱频频。我的演讲主要讨论了人工智能与物理学的交叉。

在演讲后的对话环节,张教授问:“两年以后,人工智能会发生一些什么?”我的回答是:“可能会有初步帮助科学研究的人工智能软件或者平台出现。” 在演讲最后,我也畅想了人类的终极未来。当宇宙局部乃至整个宇宙不允许人类作为生物体继续生存时,也许我们只好将意识上传到能在宇宙中存在下去的其他介质。即使不能意识上传,也可以让人工智能继续我们探索宇宙规律的使命。作为宇宙的一部分,人类对科学规律的探索使得宇宙更有意义。

最近几年,相关领域的进展与我的讨论和展望很契合,特别是机器学习与人工智能在各领域的应用情况。机器学习的应用如雨后春笋,数不胜数,“用于科学的人工智能”(AIforScience)得到了蓬勃发展,在诸如材料和药物设计、精确医疗、天文学数据处理、计算机软硬件设计、与脑科学的交叉、生产效率的提高、自动驾驶等方面得到长足的发展,可解释性和伦理问题也得到了更多的关注。除了快速有效地处理和分析海量数据,识别数据中的模式和关联,人工智能和机器学习还被用于实验的控制和优化,甚至用于协助科学家做出假说,比如为数学证明提供参考意见。生成式人工智能能够在不同理论中识别出最符合数据的理论。这些进步将逐步改变科学家的工作方式,也加快科学进步的步伐。对于依赖大量数据的复杂性科学问题,例如气候和天气问题、传染病问题等等,人工智能更是能发挥巨大作用。

我所展望的用人工智能协助发现物理定律,包括我具体设想的人工智能发现日心说乃至引力定律方面,也取得了初步成果。有一个研究小组的神经网络对于所输入的地球参照系的太阳和水星位置数据,能够自动转换到太阳参照系的水星和地球位置数据。不过我认为,这离发现日心说还相距甚远。

人工智能与其他技术(比如互联网)的结合也得到很大发展,包括帮助科学研究的人工智能软件或者平台,也就是上述我在对话中预见的“初步帮助科学研究的人工智能软件或者平台”。这包括著名的人工智能聊天机器人程序聊天生成预训练转换器(ChatGenerativePre-trainedTransformer,ChatGPT)。ChatGPT是生成式人工智能的产物,基于监督和强化机器学习技术,用大型语言模型来强化学习训练,以文字方式交互,可以生成文本、回答各种问题、提供文字服务,编写计算机程序、总结文献和科研结果,等等。在对大量文献和数据的学习基础上,ChatGPT将对科学研究产生影响。

人工智能与物理学

作为一名物理学工作者,我尤其关注机器学习和人工智能在科学研究中的应用,所以我从与物理学相关的进展谈起,讨论机器学习和人工智能与物理学乃至整个基础科学研究的联系,并展望未来。

人工智能,特别是机器学习,在物理学研究中得到越来越多的应用。我们知道,机器学习由数据驱动——机器从数据中学习,从而逐步改进性能,基于数据给出预测。机器学习不是对静态程序的执行,而是从模式识别发展而来。因此自然地,目前机器学习在科学研究中的应用大多与分类和模式识别有关。

例如,在天文学中,机器学习被用于各种天体的识别和分类。一个具体的例子是系外行星,这是围绕其他类似太阳的恒星运转的行星。天文学家用机器学习来帮助对系外行星进行识别和分类。

凝聚态物理和材料科学对于物质的相很感兴趣。相是指物质的形态,比如冰、水、水汽是同样的水分子组成的物质的三个不同的相。已知某物质由很多原子或者分子组成,也知道原子或者分子之间的相互作用,如何预言它在某个条件下,处于哪种相?机器学习帮助我们回答这个问题,识别物质的不同相。

机器学习也应用于高能物理,也叫粒子物理。粒子物理研究组成物质的基本粒子,需要用到一些大型的加速器,最大的是位于瑞士和法国交界的欧洲核子研究中心(CERN)的大型强子对撞机(LHC),它代表了物理学在微观尺度上的实验前沿。所谓的“上帝粒子”,即希格斯(Higgs)粒子,就是2012年在那里发现。现在这个对撞机的探测器上也在配置机器学习的技术,从而可以更快速地确定高能粒子碰撞的产物。

对于机器学习在物理学研究中的应用,我再举量子物理研究中的一例。量子物理告诉我们,世界在微观层次上本质是随机的。爱因斯坦为此感到困惑,他虽然承认量子力学的计算结果是对的,但是认为,也许背后存在某些未知因素,决定了量子物理里面的随机性。物理学家设计了一些实验来检测是不是这样。典型的方法是,将两个互相之间具有量子纠缠的粒子分离开来,分别独立地以自由随机选择的方式对其测量。为了保证测量方式的选择是真正随机的,2018年国际上12个实验室合作进行了一个实验项目,包含13个实验。为了确保所做的选择是自由随机的,是完全由人的自由意志做出的,他们通过网络,在全世界找了10万名志愿者,每位志愿者参加一个网络游戏,提供一组随机的二进制数字,即比特,也就是一串由0和1组成的数字。这些随机的比特传送给世界上的12个实验室,用来决定测量方式的选择。而在随机数的产生过程中,用到了机器学习技术。具体来说,为了确保输入的数据完全随机,没有任何规律,这个网络游戏使用机器学习来分析输入的数据是否真的是随机的,而且还提醒志愿者,要输入尽量随机的数。

谈到量子物理,这将带到我要说的第二点,即量子物理学家正在将机器学习与量子计算联系起来。这说明,物理学也可以反过来为机器学习的发展作出贡献。

量子计算是一种全新的计算方法,基于量子力学的基本原理,通过量子叠加态,实现所谓的量子并行,对于一些计算问题,比如找出一个大奇数的因子,能够指数级提高计算速度。传统的计算可以表示成对比特0和1组成的二进制数进行运算,而量子计算则对量子比特组成的量子态进行量子演化。单个量子比特的量子态不一定是0态或者1态,一般是它们的叠加态。传统计算中,找到大奇数的因子很慢,所需的时间是数字位数的指数函数,信用卡的保密正是基于这个事实。而量子计算所需的时间只是数字位数的多项式函数,因此很快就能找到大奇数的因子。因此将来有了量子计算机后,信用卡目前的保密方案就失效了。量子计算已经成为目前的一个研究热点。当然,物理上要造出能有效解决大奇数因子化问题的量子计算机,还有一段艰难的道路要走。

在这样的背景下,量子计算与机器学习这两个研究热点有所结合。人们提出了加速机器学习的量子算法,比如量子基本线性代数子程序,以及簇分配与聚类发现的量子算法。有些专用量子处理器,比如量子退火器、可编程光学点阵,可以匹配深度学习的架构。当然,实验上将这些实现出来还需要努力。

人工智能具有人脑所不具备的一些性质。在人工智能中,我们可以加入量子计算的成分。但是,大脑中是否有量子信息和量子计算的实质性成分?这是一个还没有解决的问题,而且还处于当今主流脑科学之外。另一方面,计算机器和人工智能还需要向大脑学习很多方面。事实上,在工作方式上,大脑与计算机和人工智能之间有很多不同。比如,大脑的体积如此之小,耗费的能量如此之少,然而却如此富有智慧,而计算机需要消耗很多电力,在这个方面有很多值得研究的地方。为什么大脑会运作得那么高效?向大脑学习有助于计算机原理的革新,也许是克服摩尔定律的另一条路。例如,人们在发展神经形态处理器,模仿大脑中的神经回路。

反过来,脑科学也可以向人工智能学习。2018年赢得围棋比赛的AlphaGo人工智能技术,即深度学习,被用于模拟大脑的空间导航。人工智能系统发展了一个空间的网格,非常相似于人脑中的网格细胞。这说明人工智能已经与大脑有一些相似之处。

讲到未来,最让我感兴趣的问题是,人工智能是否能够具有进行科学研究、发现自然定律的能力。比如,将太阳系各行星的轨道数据给人工智能,它能否发现开普勒定律,即行星围绕太阳运动的基本定律?给人工智能一定的运动数据,它能不能发现牛顿运动定律?在牛顿运动定律和开普勒定律的基础上,人工智能能否发现万有引力定律?

如果这样的人工智能出现,基于已有的实验和观测数据,它们也许能发现我们忽略的自然定律。另一方面,基于新的实验和观测,它们也许能比科学家更好地发现新的自然定律。如果这样,科学家将做什么?我们会失业吗?科学家(scientist)会类似计算机那样,成为一种机器的名称吗?如果是,scientist的中文大概要改称为科学机。

机器和我们的大脑都由原子构成,归根到底由相同的电子以及其他微观粒子构成,服从同样的基本物理规律。在此相同的还原论基础上,我们大脑的智能是一个复杂系统的层展现象,大脑也可以看成一个智能机器。实现具有创造性和发现自然定律能力的人工智能,原则上似乎没有一个终极的阻碍,当然肯定要有非常漫长的道路要走。但是请注意,现代人类只有20万年左右的历史,而在我们的地球变得不宜居之前,还有漫长的10亿年,所以我们还有很长很长的时间来发展包括人工智能在内的科学技术。

强人工智能

强人工智能,即能够像人类那样具有意识、能够思考的人工智能,还只是猜想。如果强人工智能真的实现,能否对人类构成威胁?我认为,即使人工智能在很多方面比我们更智能,它们并不分享我们的价值观,不管是好的还是坏的,除非制造者特意赋予他们以某种价值观。我们的价值观来自我们的演化史以及生存竞争。强人工智能之间的互动影响他们自己的价值观。不过,人工智能对人类的危险性会发生在以下的情况:一是有人用人工智能对付其他人,比如在不同人群或者国家之间发生冲突的时候;二是有人将人的价值观赋予人工智能的时候。这与核武器对于人类的危险性不无类似。因此,为了消除人工智能的危险性,人类应该成为团结合作的整体,避免使用强人工智能来互斗,至少应该建立各种伦理规则,正如人类已经建立了关于核武器和生物工程的伦理规则。

理想的情况是,我们将认为强人工智能只是我们的工具,虽然在很大程度上世界由它们运转。这就类似于无人驾驶汽车。因此,即使科学研究大多由人工智能来做,我们仍然认为是我们使用它们来做,是我们自己做出了科学发现,强人工智能只是我们的工具,类似于现在我们在工作中使用计算机。因此,人类科学家仍将存在,任务也许差不多是理解人工智能的发现。只有我们理解了,一个发现才能足以被我们认为是一个发现。另一个可能是,将我们的智能与人工智能结合,例如,在脑中植入芯片,或者将我们的大脑与人工智能连接起来。

在遥远的未来,人类智能与人工智能结合也许出现一个极端情形,将人脑的信息、思维和意识上传或者转移到另一个媒介或机器,简称意识上传。谈到信息处理的媒介或机器,现在是电子计算机。但是在遥远的未来,会有其他的可能性。

前面提过,关于意识和思维是否是量子力学过程,科学上还没有定论。微观上,以化学和电过程为基础的大脑活动当然可以归结于电子和原子核的量子运动,然而现在大多数科学家认为,思维和意识本质上只是在更高层次上的经典信息过程。这是复杂系统的层展现象,就好比,虽然电子计算机里的计算过程归根到底也是电子和原子核的量子运动,但是作为信息处理,计算过程本质上只是经典逻辑线路上的经典计算,原则上也可以用其他物理过程(比如机械计算机)实现。如果意识本质上是经典的,上传就是经典信息的传输或者复制。原则上,意识上传后,原来的人没有改变,只是意识多了一个数字拷贝,其后,脑中的意识和数字拷贝可以独立发展。不够完善的技术也许夺走原来的人的生命。但这是技术问题。

但是有少数科学家认为,意识和思维本质上是量子过程,甚至类似于量子计算。如是,意识上传就必须是量子态的转移。量子信息学告诉我们,量子态不能复制。因此,意识上传后,原来的人的意识将变成在严格字面意义上一片空白。具体的上传过程也许可以基于量子隐形传态,当然也可能有其他方法。不论具体用什么方法,量子态的转移比经典信息的传送或复制难度大得多。

即使思维和意识本质上是高层次上的经典信息过程,仍然基于微观的量子过程,所以保险但是也困难得非常多的方法是将整个微观量子态全部转移。微观到什么层次,取决于从什么层次开始的物理过程对意识活动有本质影响。

长期来说,十亿年以后,我们的地球就不再适合居住,也许那时我们可以暂时迁移到太阳系的另一个行星;几十亿年之后,太阳将会死亡,成为红巨星时就会吞噬地球,我们势必不能在太阳系继续生存,至迟那时候就要离开太阳系。而且整个宇宙在演化,很久很久之后,我们注定不能在宇宙中任何一处生存。到那个时候,很可能我们的意识将上传到机器。不管有没有上传我们人类的意识,智能机器必然将继续我们的使命,即理解宇宙,这使得宇宙本身更有意义。

人工智能与科幻

最近的科幻电影《流浪地球2》中的数字生命也与我所畅想的部分情景有相似之处。

物理学告诉我们,宇宙终将不适合人类或者其他生命生存,那么科学的使命如何继续?为了将科学事业继续下去,届时意识上传到其他载体是一个选项。因为那是非常非常遥远的终极未来,所以很可能届时能实现,但是也有不上传的可能性。

我用的词是“意识上传”,没有用“数字生命”这个词。《流浪地球2》里的数字生命包含了意识上传,虽然它没有用这个词。数字生命的字面含义是用数字方法实现人工生命,强调生命。目前这方面是有常规研究的,但是往往是用计算机模拟各种生命过程,比如繁殖、遗传、进化。

数字生命既然用了生命这个词,也可以是有死亡的。《流浪地球2》里的台词提到过“完整的一生”,说明它所说的数字生命确实有死亡这一生命特性。作为生命,既然有死亡,那也可以有繁殖和出生。这在电影里没有触及。

单纯的意识上传并不要求上传后还有其他生命属性。事实上,有人希望以此实现数字永生。当然,所有这些都是对遥远未来的猜想。不过,这个猜想与很多现实的科学技术是相关的,除了计算机科学和人工智能方面,还有脑科学方面,比如对大脑信息的提取和模拟,以及对动物脑及其活动的测绘以及模拟。

很多科学家同意,智能、思维和意识是大脑这个物质的功能,是复杂系统的层展性质,好比计算机里的软件、信息和计算。如果确实如此,那么原则上,意识上传就有可能,好比同样的软件、信息和计算可以负载于不同的计算机,可以用不同的物理过程。当然,这是非常遥远的事情,不仅很多科学问题还没有搞清,比如自我意识是如何产生的,而且技术障碍也十分巨大。意识本质上是不是量子过程?目前大多数科学家认为不是,但是也有少数科学家认为可能是。如果是,还需要进行量子态的传送,也许可以通过量子隐形传态。即使意识本质上不是量子过程,鉴于大脑一切的活动在微观上都基于构成大脑的微观粒子的运动,如果将这些微观粒子的量子状态全部上传,那也就实现了意识上传。但是从微观上“一锅端”,难度又增加了很多很多很多数量级。另外,量子态不能复制,传上去以后,大脑意识就真正一切空白了。注意,我这里只是对非常非常非常非常遥远的未来的猜想。

数字生命和人工智能,两者不一样,但也有共同点。“数字生命”包含了意识上传,将人脑里的信息上传到了计算机中,另外可能还有生命的其他性质。意识上传与人工智能都是计算机里的智能,有共性,前者可以看成一种特殊的强人工智能。强人工智能是指像人那样有意识的人工智能,目前还只是猜想。至少目前人工智能不是来自意识上传,往往也不是对具体某个人的智能和意识的仿真,虽然原理和设计上借鉴人脑。

此外,如果上传的不仅是记忆,而是包括整个意识,那么数字化后,很多方面类似强人工智能。如果原来的人的意识还活着,可以脑机结合,用这个方式增强原来人的能力,数字部分成为人的附件。但是在遥远的未来,原则上没有必要一定脑机结合,上传以后的数字意识可以独立于原来的人,原来的人在意识上传以后,也可能就不在了。大概会有各种情形吧。

有人觉得,意识上传的不过是一个复制品、冒牌货,基因储存才是人类的前途。我认为,有几种情况下可能出现数字生命。一方面,如果原来的有机生命体甚至任何有机生命体不能继续存活了,只能借助数字生命延续意识和生命,如果有这个能力。另一方面,如果真的完美实现了意识上传,从信息的角度,上传后的意识与负载在原来有机生命体上的意识基本上没有本质区别。保存基因,如科幻电影《星际穿越》中提到过的,当然是很好的选项,技术上也比意识上传容易得多,能保存当然要保存。但是假如DNA没法保存,或者有机生命体无法生存,无法产生后代呢?基因的信息也可以保存在计算机或其他媒介上。另外,数字生命或者数字意识原则上可以永生,当然这是在意识载体存在的前提下,也要求有能源、能保持有序度,从而数字意识得以维持。

当然,数字生命这项技术如果真的存在,会有很多很多、各种各样的伦理问题,特别是要防止有人利用这项技术来侵犯其他人。届时需要明确原则,确定规则。这项技术特别适合于迫不得已时,比如人类在自然环境无法生存时。在此之前,如果使用,也肯定会有各种规定。另外,相比整个意识和大脑信息活动的上传,单纯的记忆上传容易得多,可以将人的记忆提取出来,特别是去世的人。现在还是要区分对遥远未来的猜想或者科幻与现实中已有的科学技术。