可能掌握开启人工智能钥匙的天才神经学家

发布时间：19年07月18日

编译凌寒

卡尔·弗里斯顿的自由能原理可能是继达尔文的自然选择学说以来最能包罗万象的理论。但是想要理解这一理论，你就得深入了解弗里斯顿其人的内心世界

　　当英国国王乔治三世（KING GEORGE III）在位末期开始表现出明显的急性躁狂症时，有关王室疯狂的传言迅速在公众的脑海中流传。有传言说，乔治国王试图和一棵树握手，因为他相信这棵树是普鲁士的国王。另一种传言则描述了他是如何被匆忙带到伦敦布卢姆斯伯里区皇后广场的一所房子里，同他的臣民一起接受治疗的。乔治国王的妻子夏洛特王后在国王住院期间，租用了当地一家酒吧的酒窖来为国王存储制作正餐的食材。

　　两个多世纪过去了，这则关于皇后广场的故事仍然在伦敦旅游指南中广受欢迎。不管传言是真是假，这些年来附近街区似乎一直朝着符合这个故事的方向发展。广场北端矗立着一座夏洛特王后的金属雕像；街角的酒吧叫作“女王的贮藏室”；广场上静谧的长方形花园现在几乎被研究大脑和大脑需要运转的人所包围。英国国家神经病学和神经外科学医院——现代的皇室成员很可能会去那里寻求治疗——占据了皇后广场的一角，而伦敦大学学院享誉世界的神经科学研究机构则围绕在医院周边。2017年7月天气极好的某个星期，数十名神经病患者和他们的家人在草坪外缘的木质长椅上安静地度过了一段时间。

　　在通常的星期一，卡尔·弗里斯顿（Karl Friston）中午12点25分到达皇后广场，在夏洛特王后雕像旁的花园里抽了一支烟。弗里斯顿是伦敦大学学院著名的功能成像实验室（在那里工作的每个人都知道这个叫做FIL的实验室）的科研主任，他微微有些驼背，有着一头浓密的灰色头发，常常独来独往。抽完烟后，弗里斯顿踱步到广场西侧，走进一座砖和石灰岩砌成的建筑中，来到四楼的一间研讨室，那里可能有2到20多人正在等他。

　　他对大家的问候很可能是他一天中第一次实质性的发言，因为弗里斯顿不喜欢在中午之前和其他人说话。他也极少和人单独见面。相反，他更喜欢召开这样的公开会议，在这类会议中，学生、博士后和渴望获得弗里斯顿的专家意见的公众人士可以寻求他的专业知识。他认为，如果一个人有一种想法、一个问题或一项正在进行的项目，那么了解它的最佳方式就是让整个团队聚在一起，听取这个人的意见，然后每个人都有机会提问和讨论。因此，一个人的学问就变成了所有人的学问。在每周一的会议开始时，每个人都会在会议之初陈述自己的问题。弗里斯顿会一边听，一边从容踱步。然后，他会在接下来的几个小时里依次回答问题，他甚至会用礼貌而干脆的措辞来回答最让人困惑的问题。

　　弗里斯顿首次成为学术界的英雄人物，是因为他发明了许多最为重要的工具，正是这些工具使得人类的大脑可以为科学所解读。1990年，他发明了统计参数映射，这是一种计算技术，这种计算技术可以把大脑图像“压缩折叠”成一致的形状，这样研究人员就可以对不同颅骨内的活动进行横向对比。从统计参数映射中获得“体素形态测量法”（voxel-based morphometry），这是曾在一项著名的研究中使用过的成像技术，该研究表明，伦敦出租车司机在学习“知识”的过程中，他们的海马体后侧会增长。2011年，发表在《科学》杂志上的一项研究使用了弗里斯顿发明的第三代大脑成像分析软件：动态因果模型，以确定严重脑损伤的人到底是处于最低程度的有意识状态还是仅仅是植物人状态。

弗里斯顿的办公室。一位朋友形容他是“维多利亚时代的绅士，有着维多利亚时代的风度和品味

　　2006年，弗里斯顿入选英国皇家学会。皇家学会称他对大脑研究的影响是“革命性”的，大脑成像领域发表的论文中，90%以上使用了他的方法。2016年，艾伦人工智能研究所经计算得出，弗里斯顿是世界上被引用次数最多的神经科学家，他的h指数（用来衡量科研人员发表论文影响力的指标）几乎是爱因斯坦的两倍。2017年，科睿唯安将弗里斯顿列为诺贝尔生理学或医学奖最有可能的3位获奖者之一。而过去的20多年，科睿唯安成功预测出46位诺贝尔科学奖得主。

　　然而，值得注意的是，近期拜访弗里斯顿的研究人员中却很少有人提到大脑成像。2018年夏天，10天之内，弗里斯顿对如下人员进行了咨询：天体物理学家、几个哲学家、着手打造出Amazon Echo竞品的计算机工程师、全球最大保险公司之一的人工智能负责人、试图制造更好助听器的神经科学家、着眼于应用机器学习来帮助治疗抑郁症的精神病学家。他们中的大多数人之所以来到这里是因为他们渴望了解别的事情。

　　在过去10年左右的时间里，弗里斯顿投入了大量的时间和精力以开发他称之为自由能原理的想法。有了这个想法，弗里斯顿相信他已经参透了所有生命和所有智慧的组织原理。他试图回答：“如果你还活着，你必须表现出什么样的行为?”

　　首先，坏消息是：理解自由能原理异常困难。许多非常聪明的人试图理解它，但都失败了。而我采访过的几乎每一个人，包括该相关领域的研究人员在内，都告诉我，他们并没有完全理解它。

　　但是，这些人通常会急于补充道，自由能原理的核心讲述了一个简单故事，解决了一个基本难题。热力学第二定律告诉我们宇宙趋向于熵和消失，但是生物却强烈地抵制它。弗里斯顿的自由能原理认为，所有生命，无论其机体组成的规模大小（从单个细胞到拥有千亿神经元的人类大脑）都受到同一个普遍规则的驱动，这种规则可以简化为数学函数。他说，生存就是缩小你的期望和你的感官输入之间的鸿沟。或者，用弗里斯顿式的术语来说，就是最小化自由能。

　　要了解这一理论的潜在含义，你只要看看周一早上闯进FIL门口的人就行了。有些人来这里是因为他们想利用自由能原理来统一心智方面的理论，为生物学提供新的基础。另一些人则希望自由能原理能够以大脑的功能理解最终为精神病学奠定基础。还有一些人想利用弗里斯顿的点子来突破人工智能研究的障碍。但是，他们来这里的共同原因是：唯一真正理解弗里斯顿的自由能原理的人可能就是弗里斯顿本人。

　　弗里斯顿不仅是他所在领域最有影响力的学者之一；他也是所有学科中最多产的人之一。自世纪之交以来，他发表了1 000多篇学术论文。仅在2017年，他就以主要作者或共同作者的身份发表了85篇论文。

　　弗里斯顿追溯起自己研究自由能原理的历程，这始于他8岁那年一个炎热的夏天。他和家人住在利物浦附近城墙环绕的英国切斯特市，他母亲叫他到花园里去玩。他把一根旧木头翻过来，发现了几只木虱在四处乱窜，起初他以为这些木虱是在寻找遮蔽处和黑暗。盯着它们看了半个小时后，他推断这些小虫子其实并不是在找阴凉处。”弗里斯顿说：“那是一种幻觉，是我自己制造的幻想。”他意识到这些木虱的活动并没有目的，这些生物的运动是随机的。

弗里斯顿的办公室。一位朋友形容他是“维多利亚时代的绅士，有着维多利亚时代的风度和品味

　　弗里斯顿把这件事称为他的第一个科学洞见，那一刻“所有人为的、拟人化的关于目的和生存之类的解释似乎都土崩瓦解了。”在10多岁的时候，弗里斯顿经历了另一次“木虱时刻”。他刚刚看完电视回到卧室，注意到窗外花繁叶茂的樱桃树。他突然被一个念头紧紧缠住，自那以后再也没能逃开。“一定有一种理解万物的方法，如果我只被允许从整个宇宙的一个点开始，那么我是否能从中得到我需要的其他的一切呢?”他在床上躺了好几个小时，做出了第一次尝试。“显然，我彻底失败了。”他说道。

　　完成医学学业后，弗里斯顿搬到牛津，在一所名为利特莫里尔的维多利亚时代的医院作为住院实习生实习了两年。弗里斯顿被分配给一组由32名慢性精神分裂症患者组成的小组，他们是利特莫尔最穷困的居民。

　　离开利特莫尔之后，在20世纪90年代早期的大部分时间里，弗里斯顿使用相对较新颖的技术：PET扫描，试图了解精神分裂症患者的大脑内部到底发生了什么。在这一过程中，他发明了统计参数映射。弗里斯顿坚持认为这项技术应该免费分享，而不是专利化或商业化，这在很大程度上解释了这项技术是如何变得如此普及的。

　　1994年，弗里斯顿来到皇后广场，有好几年时间他在FIL的办公室跟盖茨比计算神经科学中心隔了几扇门。盖茨比计算神经科学中心（供科研人员研究生命和机器系统的感知和学习理论的地方）由其创始人、认知心理学家、计算机科学家杰弗里·辛顿（Geoffrey Hinton）管理。当FIL逐渐发展成为神经成像方面的领先实验室之一时，盖茨比计算神经科学中心也逐渐成为将数学模型应用于神经系统很感兴趣的神经科学家们的训练基地。

　　和其他许多人一样，弗里斯顿被辛顿对最成熟的统计模型那“孩子般幼稚的热情”所吸引，两人成了朋友。

　　时光荏苒，辛顿说服了弗里斯顿，让他相信研究大脑的最佳途径就是把它看作一台贝叶斯概率机。这一观点可以追溯到19世纪赫尔曼·冯·亥姆霍兹（Hermann von Helmholtz）的研究理论，即大脑以概率的方式计算和感知，不断做出预测，并根据感官提供的信息调整观念。根据最流行的现代贝叶斯理论，大脑就是寻求最小化“预测误差”的“推理引擎”。

　　2001年，辛顿离开伦敦前往多伦多大学，在那里，他成为人工智能领域最重要的人物之一，为当今深度学习领域的许多研究奠定了基础。

　　然而，在辛顿离开之前，弗里斯顿最后一次去盖茨比计算神经科学中心拜访了这位朋友。辛顿描述了他发明的一种新技术，这种技术可以让计算机程序更有效地模拟人类的决策过程，集成了许多不同概率模型输入的程序，在如今的机器学习中被称为“专家级产品”。

　　受辛顿想法的启发，本着知识互惠的精神，弗里斯顿寄给辛顿一套记录着自己想法的笔记，这个想法将大脑的“相关的解剖学、生理学和心理物理学属性”联系在了一起。弗里斯顿在2005年发表了这些笔记，他后来写了几十篇关于自由能原理的论文，这是他的第一篇。

　　在描述自由能原理时，就连弗里斯顿自己也很难决定从哪里说起。他经常让大家自己去查维基百科。但对我来说，从弗里斯顿办公室的沙发床上铺着的毯子开始说起似乎最合适。

　　这是一条白色的羊毛沙发毯，上面印着一副黑白定制肖像，画的是一位名叫安德烈·安德烈耶维奇·马尔科夫（Andrei Andreyevich Markov）的俄罗斯数学家，留着络腮胡子，表情严肃，1922年去世。被称为“马尔科夫毯”（Markov blanket）的概念就是以马尔科夫命名的，在机器学习中，马尔科夫毯是基本屏障，将层级系统的一组变量与其他变量区分开来。心理学家克里斯托弗·弗里斯（Christopher Frith）曾将马尔科夫毯描述为“细胞膜的认知版本，将细胞内的状态与外界的状态隔离开来”。

　　在弗里斯顿的心目中，宇宙是由一个套一个的马尔科夫毯组成的。我们每个人都有一个马尔科夫毯，它将我们与非我们的事物区分开来。在我们体内，马尔科夫毯将器官分开，器官内的马尔科夫毯将细胞分开，细胞内的马尔科夫毯将细胞器分开。马尔科夫毯定义了生物如何随着时间而存在，定义了生物的行为如何相互区别。没有马尔科夫毯，我们只是逐渐消散在以太的热气。

　　“这就是你们读到过的马尔科夫毯。就是这个。你可以摸摸看。”当我第一次看到他办公室里那条毯子时，弗里斯顿冷冷地说道。我情不自禁，我确实伸出手去用手指碰了碰那条毯子。自从我第一次读到马可夫毯这个词，我就到处都能看到它们的身影。马尔科夫毯围绕在一片树叶、一棵树和一只蚊子周围。在伦敦，我看到马尔科夫毯围绕在FIL的博士后周围，围绕在反法西斯集会上身着黑衣的抗议者周围，围绕在住在运河里的小船上的人们周围。每个人周身都披着隐形的斗篷，每个斗篷下都有一个不同的生命系统，它能将自身的自由能最小化。

　　自由能的概念本身来自于物理学，这意味着如果不涉及数学公式就很难精确地解释它。从某种意义上说，这就是它的强大之处：它不仅是一个夸张的概念，还是一个能够模式化的可测的量，使用的数学方法与弗里斯顿用来解释大脑图像的方法相同。但是，如果你把这个概念从数学翻译成语言，大致就是这样的：自由能就是你期望达到的状态和你的感官告诉你你所达到的状态之间的差。或者换句话说，当你在最小化自由能的时候，你就是最小化意外。根据弗里斯顿的观点，任何能够抵抗紊乱和分解倾向的生物系统都遵循自由能原理。

　　单细胞生物具有减少意外的指令，大脑同样如此。唯一的区别是：随着自组织生物系统的发展，人类大脑变得极其复杂：它从数十亿感官感受器汲取信息，它需要高效地将这些信息整理成精确的世界模型。弗里斯顿说：“从某种意义上说，大脑确实是一个神奇的器官，它产生的假设或幻想适用于解释这些无数的模式和接收到的感官信息流。”

　　弗里斯顿使用“主动推理”这个术语来描述生物体最小化意外的方式。弗里斯顿认为，当大脑做出的预测并不能立即通过感官反馈被证实时，它可以通过以下两种方式之一最小化自由能：它可以修正自己的预测、吸收意外、承认误差、更新它的世界模型，或者它会行动使预测成真。假如我推测我正在用左手食指摸鼻子，但是我的感受器告诉我；我的胳膊还垂在我的旁边，我就可以通过抬起胳膊，把手指按到我的脸中间来最小化我大脑的预测误差信号。

　　事实上，这就是自由能原理如何解释我们所做的一切：感知、行动、计划、解决问题。当我乘车出差时，我可以通过行动来确认我的假设（我的幻想），从而最小化自由能。

　　事实证明，自由能原理不仅是关于行动、感知和计划的统一理论；它同时也是有关精神疾病的理论。当大脑分给感官输入的信息比重过少或过多时，麻烦就来了。例如，某位精神分裂症患者可能无法更新他们的世界模型来解释来自眼睛的感官输入。“如果你思考一下精神疾病，大部分的神经类疾病，它们只不过是破碎的信念或错误的推断（幻觉和错觉）。”弗里斯顿说道。

　　在过去的几年里，弗里斯顿和其他一些科学家已经利用自由能原理来帮助解释焦虑、抑郁和精神病，以及自闭症、帕金森病和精神变态的某些症状。在许多情况下，科学家已经知道（多亏了弗里斯顿的神经成像方法）在不同的疾病中，大脑的哪些区域容易出现功能障碍，哪些信号容易受到干扰。但仅仅只是这些还不够。他说道：“仅仅了解哪些突触、或者哪些大脑连接运作不正常是不够的，需要关于信念的计算式。”

　　所以，自由能原理为心智如何运作提供了统一的解释，也为心智如何失灵提供了统一的解释。因此，它也可能使我们走上一条从头开始建立心智体系的道路。

　　几年前，一组英国科研人员决定用一种新的分析工具重新审视乔治国王三世疯癫的事实。他们将国王写的大约500封信载入机器学习引擎，并对系统进行了艰苦的训练，以识别各种文本特征：单词重复、句子长度、句法复杂性等等。在培训过程结束的时候，系统已经能够预测出某封王室信函是国王在狂躁时期写的，还是在神志清醒时期写的。

　　人工智能的另一种方法称作强化学习，强化学习不需要人类对大量的训练数据进行标注，它只需要告诉神经网络去寻求某种奖励，通常就是在游戏中获胜。神经网络通过一遍又一遍的玩游戏来学习，优化任何可能会让它进入最终对决的动作。但强化学习也有相当大的局限性。在现实世界中，大多数情况并不是围绕着一个单一的、狭隘定义的目标来组织的，现实世界中的大多数环境并不像游戏那样稳定和受规则约束。

　　对于弗里斯顿和他的狂热追随者来说，这种失败是完全有理由的。毕竟，根据自由能原理，人类思想的根本驱动力并不是寻求某种任意的外在奖励，而是为了最小化预测误差。显然，神经网络也应该这样做。

　　2014年，Netflix机器学习基础设施主管朱莉·皮特（Julie Pitt）发现了弗里斯顿和自由能原理，这改变了她的想法。皮特说，自由能模型的美妙之处在于，它允许人工主体在任何环境中发挥作用，即便是新的且未知的环境。在旧的强化学习模式下，你必须不断制定新的规则和奖励来让你的主体去应对复杂的世界。但是，自由能主体却总是能产生它自己的内在奖励：最小化意外。

　　2017年底，由伦敦国王学院神经系统科学家兼工程师罗莎琳·莫兰（Rosalyn Moran）领导的一支团队，在某一版本的3D射击游戏《毁灭战士》中，让两名AI玩家对抗。目的是对由主动推理驱动的主体和由奖励最大化驱动的主体进行比较。基于奖励的主体的目标是杀死游戏中的怪物，但是自由能驱动的主体只需要将意外最小化。一段时间后，明显可以看出，即使在游戏的玩具环境中，奖励最大化主体也“明显不那么稳健”；自由能主体能够更好了解它的环境。莫兰表示：“它比强化学习表现更好，因为它在探索。”在另一款模拟游戏中，自由能最小化主体与真人玩家进行对抗，其过程大同小异。弗里斯顿式主体在迅速实现仿人类的表现之前，一开始也是缓慢却积极地探索各种选择，按照弗里斯顿的说法就是认知式觅食。莫兰告诉我,尽管速度缓慢，但主动推理已经开始蔓延到更多的主流深度学习的研究中。

　　当我第一次向弗里斯顿请教自由能原理和人工智能之间的联系时，他预测在5到10年内，大部分机器学习将会包含自由能最小化。到了第二次，他的回答就很风趣了。弗里斯顿说道：“想想它为什么被称为主动推理（active inference）”，嗯，就是人工智能（AI）呀，主动推理是新的人工智能吗？是的，就是首字母缩写。”

　　我在伦敦的时候，弗里斯顿在一家量化交易公司做了一次报告。大约有60名娃娃脸的股票交易员在结束了一天的工作后，出席了会议。弗里斯顿描述了自由能原理是如何在人工主体中模拟好奇心的。大约15分钟后，他告诉听众如果能听明白他在说什么的话就举手。只有三人举手，所以他把问题反过来问了：“如果你觉得这完全是胡说八道，并且根本听不懂我在说什么，就请举起手来好吗?”这一次，很多人举起了手，并且我觉得其他没举手的人也是出于礼貌。

　　第二天早上，想到那些聪明的年轻人中似乎很少有人能理解他，我问弗里斯顿他是否认为这场报告进行得很顺利。他说道：“将有相当一部分观众能理解，只是不适合他们。有时他们会感到沮丧，因为这很重要，但他们自己又理解不了。他们觉得自己必须认为这是垃圾，然后离开。你会习惯的。”

　　2010年，哥伦比亚大学的精神病学家彼得·弗里德（Peter Freed）召集了15名大脑研究人员，来讨论弗里斯顿的论文。弗里德是这样描述《神经心理分析》杂志上刊登的这篇论文的，“屋子里的人拥有丰富的数学知识：有三位统计学家、两位物理学家、一位物理化学家、一位核物理学家和许多神经成像专家，但显然我们没有得偿所愿。我与普林斯顿大学的物理学家、斯坦福大学的神经生理学家、冷泉港实验室的神经生物学家会面讨论这篇论文。所有人再次一无所获：太多方程式、太多假设、太多运动部件、太过全球化的理论，根本没有提出问题的机会，于是人们放弃了。”

　　但是，对于所有被弗里斯顿的不可理喻激怒的人来说，几乎同样多的人认为他开启了某种巨大的东西，这是一个可以和达尔文的自然选择学说相媲美的想法。2014年，加拿大哲学家麦克斯韦·拉姆斯特德（Maxwell Ramstead）第一次读弗里斯顿的著作时，他就已经在努力寻找方法，将以不同尺度存在的复杂生命系统（从细胞到大脑、从个体到文化）联系起来。2016年，他见到了弗里斯顿，弗里斯顿告诉他，适用于细胞分化的数学原理同样也适用于文化动态。拉姆斯特德说：“对我来说，这次对话足以改变一生。”

　　我们坐在皇后广场的长椅上，周围满是附近医院的患者和工作人员，拉姆斯特德说：“这在历史上绝对是新奇的，在弗里斯顿出现之前，我们注定要永远徘徊在这个缺乏通用货币的多学科世界上，自由能原理带来了这种货币。”

　　2017年，拉姆斯特德、弗里斯顿以及墨尔本大学的保罗·拜德拷克（Paul Badcock）合著了一篇论文，在这篇论文中，他们用马尔科夫毯来描述所有的生命。正如细胞是为了生存而将自由能最小化的马尔科夫毯系统一样，部落、宗教和物种也是如此。

　　拉姆斯特德的论文发表后，当时供职于FIL的认知神经学家米卡·艾伦（Micah Allen）写道，自由能原理已经演变成了艾萨克·阿西莫夫（Isaac Asimov）心理史的现实版，阿西莫夫心理史是一个虚构的系统，它将所有的心理学、历史学和物理学都简化为统计科学。

　　的确，自由能原理似乎已经扩展到近乎万物理论。正如艾伦所疑问的：能够解释一切的理论是否也有可能什么也解释不了?

　　在旅行的最后一天，我拜访了身在里克曼斯沃斯镇的弗里斯顿，他住在一间堆满动物标本的房子里，他的妻子把制作动物标本当作一种爱好。碰巧的是，里克曼斯沃斯镇出现在《银河系漫游指南》的第一页上。就是在这个小镇上，“独自坐在小咖啡馆里的女孩”突然发现了把世界变成“美好幸福地方”的秘密。但命运从中作梗。“她还没来得及打电话将这一发现告诉任何人，一场可怕而愚蠢的灾难就降临了，从此，这个想法彻底消失了。”

　　目前还不清楚自由能原理是否就是那个能使世界成为美好幸福所在的秘密，正像它的一些信徒几乎认为的那样。在我们的谈话继续进行时，弗里斯顿本人倾向于采取一种更为慎重的说法，他只表明主动推理及其推论是很有希望的。他多次承认自己可能只是在“胡说八道”。在我上次参加的FIL的小组会议上，他告诉与会者自由能原理是一个“似是”概念，它不要求生物为了生存而将自由能最小化，它仅仅用于解释生物的自组织。

　　弗里斯顿说，他的工作有两个主要的动机。当然，自由能原理有朝一日能引领真正的人工意识是件好事，他说道，但这不是他的首要任务之一。相反，他的第一个大的愿望是推进精神分裂症的研究，帮助修复类似他在老收容所认识的那些患者的大脑。他的第二个主要动机就要“自私得多”。这一切可以追溯到他十几岁那年的那个晚上，他在卧室里看着盛开的樱花，想道，“我能用最简单的方法解决所有问题吗?”

　　他说道：“这是一件非常自我放纵的事情，它的背后并没有无私的冷静同情，这只是一种自私的欲望，试图尽可能彻底、严格、简单地理解事物。我经常思考人们拿我开的玩笑（有时是恶意的，有时是非常有趣的），说我难以沟通。我想：我又不是写给你看的。我是写给我自己的。”

资料来源 Wired