比尔?盖茨重磅推荐的“千脑智能”理论靠谱吗

2023-02-22 12:54:13 来源：IT之家阅读量：5652

“每一代人都以为自己可以将神经机制与高层行为联系起来，但事实上，我们紧抓不放的仍然只是一些秸秆，却以为这些秸秆将构成摩天大楼的基础。科学家必须要耐心一些才行。”

顾凡及

“千脑智能”理论的提出者杰夫?霍金斯享有“科技界一代传奇”的美誉，他出身电子工程，但对人脑如何拥有智能无比好奇。他曾申请将“以大脑理论为基础创造智能机器”作为博士研究课题，屡遭拒绝而不改初心。最后，他在加州大学伯克利分校攻读神经科学，后又重回信息技术界，发明了第一台掌上电脑，大获成功。如果他继续沿这条路走下去，也许会在智能手机方面拔得头筹，但他却毅然回归脑理论研究，甚至创立了红木神经科学研究所(Redwood Neuroscience Institute)，以后又创立了 Numenta 公司，专门从事大脑新皮层工作机制的理论研究。

千脑智能理论

无疑，霍金斯选择的是一条独特的道路。这可能有两大诱因:一个是 1979 年他在《科学美国人》杂志上读到诺奖得主克里克(Francis Crick)的一篇文章，其中讲到:“尽管有关大脑的细节知识在不断积累，但大脑究竟是如何工作的仍然相当神秘。…… 脑科学明显缺乏的是一个可以解释这些结果的普适的思想框架。”第二个是 1982 年，他又读到美国神经科学学会会长蒙卡瑟尔(Vernon Mountcastle)的一篇文章 (1)，他事后回忆说:“蒙卡瑟尔提出，在整个新皮层中，皮层柱和微皮层柱，具有相同的功能，执行一套基本算法，负责感知和智能的各个方面。”当时，据他自己说，“激动得差点从椅子上跌下来”，他觉得这是揭开大脑之谜的“罗塞塔石碑” (Rosetta stone)。(注 1)“我多么希望大家能体会到蒙卡瑟尔观点的简洁与彻底。最棒的科学观点往往是简洁、彻底且不同凡响的。”由此，他立志要做两方面的工作:① 建立起大脑新皮层工作机制的理论框架，并通过理解脑的工作原理来阐明智能的本质；② 在此基础上，通过逆向工程创建和人脑类似的智能机器。

:1799 年在埃及罗塞塔镇附近发现的埃及古碑，上面刻有用古埃及象形文字和拉丁文等三种文字，由此解开了古埃及的象形文字之谜。以后人们就用罗塞塔石碑隐喻解开难题的关键线索。

经过长期的潜心研究，霍金斯继 2004 年出版的畅销书《智能论》(2) 之后，又于 2021 年出版了《千脑智能》(A Thousand Brains)(2)。此书一经出版，就在神经科学界和人工智能界引起了广泛的注意。书中称:“我相信我们发现了克里克在文章中提到的思想框架，这个框架不仅解释了新皮层工作的基本原理，而且提供了一种思考智能的新方法。”(3) 如果真是这样，这自然是整个科学界中石破天惊的大事件。书中还说:“要创造真正智能的机器，我们首先需要对大脑进行逆向工程。”言下之意，霍金斯的工作打开了人工智能的新天地。2021 年，《千脑智能》进入比尔?盖茨的年度书单，也被翻译为各国语言，进入出版公司、书店力推的热销图书榜单。

左:《千脑智能》图书营销宣传资料；右:霍金斯在 2007 年 eTech 大会上。

可惜在笔者看来，自然和工程技术使用的途径完全不同，想要对人脑进行逆向工程，拷贝人脑、创建人工人脑只不过是一种迷思。虽然这本书中也不乏引人深思的思想火花，但总体上更像是一堆间或混有珍宝的彩色碎玻璃。本文就想对他所提出的“千脑智能理论”做简要的介绍和点评。由于篇幅的限制，本文集中剖析为什么“千脑智能”理论并没能构成脑功能的理论框架，因为这是他整个工作的基础和核心。如果基础不牢，后面描绘的壮丽蓝图也就只不过是镜花水月。当然，笔者明白自己的水平有限，只敢希望能引起同好的兴趣，对这些重要问题进行认真的思考和讨论。

霍金斯提出的思想框架如果要用一句话来说，那可能就是:人脑通过感觉-运动建立起一个世界模型，然后根据这个模型对将要发生的下一步事件进行预测。“模型-预测”也成了他给智能所下的定义。这一核心思想并非首倡，例如美国神经科学家弗里曼就曾提出过类似的想法 (4)，但霍金斯明确地把这些思想总结成了脑功能的基本机制，并以此作为智能的定义。不过，这一定义并没有回答脑是怎样做到建立模型和进行预测的，而霍金斯的“千脑智能理论”正是试图回答这个问题。

霍金斯的答案主要基于下面两个假设:所有的皮层柱都几乎相同，它们是脑功能的基本单位，都执行某种普适的算法；(2)每根皮层柱都附着同一事物的多个参考系，事物的性质就组织在这些参考系之中。皮层柱的上层细胞类似于位置细胞，带有事物的性质；皮层柱的下层细胞类似于网格细胞，带有事物的位置信息。这两类细胞之间进行着频繁的信息交换，所以知道了位置也就知道了内容，而知道了内容也就知道了位置。当主体运动时，位置的变化引起一连串内容的变化，这就是思想。不同皮层柱通过“投票”解决“绑定”问题。霍金斯据此进行仿真，取得了和他想象类似的结果。他由此深信他的这套理论就是脑科学中所缺失的那个理论框架。这一切听起来很完美，不过在笔者看来还经不起仔细推敲。下文我们就从神经科学的角度来看看这两大前提是否成立。

皮层柱假设

蒙卡瑟尔以及后来休伯尔和维泽尔(Torsten Weisel)在初级视皮层上对皮层柱的研究都表明了下面的事实:从解剖组织学上来看，脑的纵向切片中的细胞体和神经纤维都显示出某种纵向组织；从电生理记录来看，垂直于皮层表面往下，沿同一直线上的细胞都具有相同的感受野，并且检测的是相同的特征(其实，连这也有例外:例如初级视皮层中同一皮层柱中的神经元，一般认为它们检测的是刺激线段的朝向；但是某些皮层柱的中间层也有所谓的“斑块”结构，检测的是刺激光的波长)，这些细胞有共同的输入和输出。除了极少数“奇点”之外，相邻皮层柱所检测的特征参数作连续变化，这种变化还会呈现周期性。这些事实确实是大家公认的。

休伯尔等人认为，皮层神经元的这种组织方式可能带来如下好处:使具有类似功能性质的神经元相互沟通时距离最短，并共享来自不同通路的特定输入信息，这样就可使脑最有效地利用空间，加快处理速度，用最少的神经元分析不同的属性。如此而已，岂有他哉！

可是霍金斯声称:“所有皮层柱，即使是低层次的感觉区的皮层柱，都能够学习和识别完整的物体。”

然而，几乎所有的神经生物学文献都告诉我们，初级感觉皮层柱中的细胞只能检测刺激对象的局部特征，因此才会产生“绑定问题”。而霍金斯在书中却强调“在层次之间传递的是完整的物体，而不是特征。”确实，在高级皮层中也有细胞能识别整个物体，例如识别脸，但这究竟纯属单个细胞的功能，还是回路功能在单个细胞上表现出来尚未有定论。

霍金斯还说:“新皮层中有许多针对具体某个物体的模型。这些模型位于不同的皮层柱中。它们并非完全相同，而是互为补充。” “关于一个物体的知识…… 存储在成千上万个模型中，即存储在成千上万根皮层柱中，但这些仍然只占新皮层中所有皮层柱的一小部分。这就是我们称其为‘千脑智能理论’的原因:关于任何特定物体的知识都分布在成千上万个互补的模型中。”使笔者不解的是他所称的“模型”究竟是整个世界的模型，还是某个物体的模型，他似乎是交叉用“模型”一词有时指前者，而在别的时候又指后者。

另外，目前皮层柱的研究结果主要来自感觉皮层和运动皮层，因为对这两种皮层，实验可以探测其中神经元的功能作用，才谈得上神经元的感受野或投射野。而对于联合皮层，我们很难知道其中单个神经元的功能作用是什么，也就无从知道联合皮层是否具有功能意义上的皮层柱结构。

质疑之一:皮层柱真的存在吗？

2005 年，在庆祝蒙卡瑟尔发现皮层柱 50 周年之际，美国神经科学家霍顿和亚当斯( Daniel L Adams)总结了半个世纪以来有关皮层柱的研究，并得出“皮层柱可能并无功能”的结论！他们指出:“在经过半个世纪之后，这一术语究竟是什么意思依然说不清楚。在皮层中找不到有哪一个单一结构能与之对应。不可能找到和与皮层柱相对应的标准微回路。” “在某些方面，必须放弃皮层柱是皮层的基本功能实体的想法。从现在看起来，那种导致得出大脑皮层有模块结构结论的种种令人欢欣鼓舞的理论似乎都靠大不住。每个脑区的结构都各不相同，要想完全描述皮层构筑，各个细胞、各个层次、各个回路以及各个投射都得逐一分别考虑。”(6)。当然，并非所有人都同意这种意见，例如，达科斯塔(Nuno Ma?arico da Costa)和马丁(Kevan A. C. Martin)就认为彻底否定皮层柱有功能还为时过早，尽管如此，他们也承认“很明显，并不存在一个公认的单个皮层柱解剖实体。”(7) 他们认为，虽然皮层除了有分层结构之外，也在垂直维度上有组织，但与层次结构一样，“这些垂直组织的大小和形状也有很大差异”(7)。蒙卡瑟尔等人把锥体细胞顶树突束所构成的纵向组织视为皮层柱的解剖基础，不过锥体细胞的基树突和轴突所产生的横向联结要超越好几个“微柱”的范围。所以所谓的皮层柱并没有明确的边界。

美国神经解剖学家洛克兰在长期深入地研究了皮层柱问题以后得出以下结论:“解剖柱并非是一种有坚实基础的结构，它们是局部脑区中相互联结的系统的一个部分，人们提到的任何特定柱也参与到广泛分布的网络之中，柱不是皮层所必须具有的特征，而在脑的非皮层结构中也广泛具有类似柱状的结构。”(8) 她认为，“皮层柱”是一个过分简化的概念，它作为一个术语已经变得过于僵化，失去了表达皮层组织复杂和动态方面的能力。“这个词不可避免地具有固定、恒同和静态的含义。”

许多神经科学家都认为，把微柱看成是皮层的基本组织单位，虽然是一种很有吸引力的假设，但仍然缺乏定论。布克斯赫韦登(Daniel P. Buxhoeveden)等人比较全面地分析了这一问题 (9)，结论是:“虽然微柱就其外形来说都差不多，但是它们也高度的不规则。把微柱说成只是重复性的，几乎像是克隆出来的复本，却非常可能是错的，并且是造成某些混淆的源泉。…… 微柱尽管外形类似，但是它们在内部构造上却相当不一样。微柱在发育过程中会产生许多高度特异化的突触联结，这些联结甚至与其近邻也不一样。因此，不同皮层区，甚或同一脑区中的微柱之间也可能有实质性的差异。不仅如此，这些微柱的传入纤维数可能不同，而且投射略有不同的传出通路组。微柱间的这种差异可能源于环境对微柱结构所造成的影响，也可能是由于细胞和纤维分布上的不同。微柱似乎受到环境输入的强烈影响，环境输入造成了各个微柱各不相同。这种差异性可以解释在不同微柱之间观察到的某些‘大’的形态差异。这些差异包括微柱外神经堆空间(neuropil space)的大小、微柱内的细胞密度、细胞体垂直排列成直线的程度、微柱的宽度以及微柱宽和其周边的神经堆空间大小之比。微柱的异质性包括结构形状、反应性质、联结性、免疫组织化学、代谢和刺激偏好。”

从上面简要的回顾中，我们不难得出下列结论:尽管如坎德尔所总结的那样，皮层在纵向确实表现出一定的结构形式，但是说这种结构是由皮层的基本结构单元“功能柱”构成的，且皮层中所有的功能柱都完全一样，执行某种普适的算法，就令人生疑了。如果说蒙卡瑟尔在上世纪八十年代刚发现这种结构形式时，提出以上假设是可以理解、并引人思考的话，那么在经过半过多世纪的大量研究之后，霍金斯只坚持蒙卡瑟尔早期的理论，而忽视了之后大量实验结果引发的质疑，并把这一假设当成“公理”似的作为他的千脑智能理论的基本出发点，则无异于是在沙堆之上建筑大厦。无论这一理论大厦看起来多么宏伟，但依然是靠不住的。不幸的是，霍金斯把这一靠不住的假设当作了他全部工作的基础。

质疑之二:霍金斯真的懂空间认知吗？

千脑智能理论的第二大出发点叫做“参考系假设”。如果说皮层柱假设还有些实验基础的话，参考系假设则完全是出于对神经科学研究结果的曲解。

一如前文所述，霍金斯的参考系假设是说:每根皮层柱都附着同一事物的多个参考系，事物的性质就组织在这些参考系之中。他引以为据的实验事实是:近年来所发现的位置细胞(place cell)和网格细胞(grid cell)可能构成一个系统，使动物知道自己所处的空间位置 (11)；(2)在神经系统中有“what”和“where”两条不同通路，分别负责识别对象究竟是什么和位于什么地方 (11)。

目前确定知道的是在海马中确实有位置细胞，负责确定主体自己在所熟悉环境中的空间位置，而非外界对象所在的空间位置 (12)(虽然现在也知道蝙蝠脑的海马中有所谓的社会位置细胞(social place cell)，能检测附近的其他蝙蝠相对于自己的位置 (13)，但能不能检测一般不主动向外发信号的外界物体所在的空间位置还不得而知)。

至于网格细胞，现在也只知道在内嗅皮层中有。在熟悉的环境中，网格细胞会在类似三角形构成的网络的各个三角形顶点处有发放，这个三角网络确实有点像脑内部的某种坐标系，但也是相对于主体自身的坐标系，科学家普遍认为网格细胞是位置细胞得以确定自身在熟悉环境中空间位置的基础。不过，并没有多少证据表明网格细胞能确定外界物体在这个“坐标系”中的位置。

上:鼠脑中的位置细胞和网格细胞(蓝色示意激活)协同感知“我在哪里”(鼠的位置)。下:人脑新皮层的两条神经连接通路，绿色为背侧通路(dorsal pathway)，负责处理 where 的信息；紫色为腹侧通路(ventral pathway)，负责处理 what 信息。丨图源:wikipedia

总之，神经科学界现有的共识是:位置细胞和网格细胞主要用于确定自身在熟悉环境中的位置，而非所有外界物体在周围环境中的位置。另外这些细胞也只存在于海马-内嗅皮层系统中，没有证据表明新皮层各处都有位置细胞和网格细胞。

毋庸置疑，脑能识别外界物体，并识别其在空间中的位置。对视觉而言，已知这两种功能可能相对独立，分别由传向下颞叶的腹侧视觉通路和传向顶叶的背侧通路(where 通路)实现。识别外界物体及其位置，需要的是整个通路，而不仅仅是个别细胞，更无关于位置细胞和网格细胞。

如此说来，霍金斯所声称的在新皮层各处都有完全相同的功能柱，其上层细胞都类似于位置细胞，检测外界事物的性质；而下层细胞则类似于网格细胞，检测外界事物的位置信息…… 恐怕是混淆了一对细胞和一对通路，槽点太多，真不知从何说起。

质疑之三:预测仅仅靠树突神经脉冲吗？

霍金斯用皮层柱假设和参考系假设解释了脑如何建立模型，完成了他的智能“模型-预测”框架的前半部分。至于脑中的模型何以实现预测功能，则认为是由于近年来在神经元上发现有些树突也能发放神经脉冲。霍金斯解释说，这些神经脉冲传到轴丘(Axon hillock)，可以提高轴丘处的膜电位，因此当有外界刺激来到时，它能比没有收到树突脉冲的神经元更早发放神经脉冲 —— 这，就是所谓预测。

轴丘是神经元中细胞体靠近轴突的区域，紧邻轴突初始段。

难道“做预测”这种高级认知功能仅仅是依靠某些树突发放的电脉冲吗？霍金斯在这里混淆了预测和反应对刺激的滞后时间这样两种不同的概念。另外，即使没有树突脉冲，树突上的突触后电位作为一种分级电位也会扩布到轴丘，尽管其强度比通过脉冲传播要弱，但这只是量上的差别，而并质的差别。最后，学界一般认为，预测外界事件是神经元群体的功能，而非个别神经元的功能。霍金斯再次错用神经生物学上的发现来包装自己的观念。

其他质疑

霍金斯在《千脑智能》一书中写道:“关于大脑，尤其是新皮层，我们不了解的东西还很多。然而，我并不认为会有另一个系统性的理论框架，以一种不同的方式来填充拼图的边界部分。随着时间的推移，理论框架会得到逐步修改和完善。我预计千脑智能理论也会如此，但我相信，我在本书中提出的核心思想将大体保持不变。”

通过上面的分析，笔者对他的这段话深表怀疑。他坚持蒙卡瑟尔半个世纪以前的假设不放，很可能是因为这一假设在他看来既简单又合他的意思。这很像卡哈尔在诺奖颁奖典礼上反驳高尔基时所描述的现象:“没错，如果仅仅从逻辑的角度看问题，那么假定所有的神经中枢都是由介于运动神经和感觉神经之间的连续的中介网络构成的观点既方便又经济。不幸的是，大自然看来并不理会我们智力上对方便和统一的要求，它常常更喜欢复杂多样……”美国作家巴里在他的名作《大流感》(The Great Influenza)中说道:“但研究自然的人并不是一直都在采用科学方法。…… 这些研究者相信，如果他们的知识是根据一个他们认为合理的前提通过逻辑推理得出，那么他们就能了解该事物。…… 这种对逻辑的依赖与人类想以更广泛、更深入的方式认识整个世界的野心形影不离，而这种依赖实际上给科学，特别是给医学加上了一道障碍。具有讽刺意味的是，纯粹理性变成了进步最大的敌人。”“生物系统并非逻辑的产物，而是进化所致，而进化是一个不太讲究精准的过程。生命并不会选择逻辑上最佳的设计来迎合新环境，而只是在已然存在的基础上进行调整。”(15) 事情不正是这样吗？霍金斯却恰恰强调逻辑推理在他理论中起到了关键的作用。

行文至此，笔者不由得想起江渊声教授在给笔者信中的一段话:“每一代人都以为自己可以将神经机制与高层行为联系起来，但事实上，我们紧抓不放的仍然只是一些秸秆，却以为这些秸秆将构成摩天大楼的基础。科学家必须要耐心一些才行。”

在笔者看来，智能就像心智、意识、以至复杂性、信息等等复杂的概念一样，很难对人们在各种不同场合提及这些名词时所指代的意义给出一个无所不包的普适定义。适当的做法，就是在进行这方面的工作时首先讲清楚你指的是什么意思。正如王培教授在讨论智能时的做法:把“智能是一个信息系统在知识和资源相对不足时的适应能力” 当作他发展自己的有关通用人工智能的纳思理论的工作定义出发点。不同的人可以采用不同的工作定义，是否有用就要看由此出发能否得出有用的结论。霍金斯的模型-预测框架也只是有关智能的众多工作定义中的一个(虽然霍金斯认为他的框架不仅是智能的一个方面，而就是智能本身)。尽管这是一个有意思的工作定义，但它最后是否能得到公认，要看由这样的定义出发，能够得出什么样有意思的结果，无论是解决工程技术问题，还是阐明脑机制都行。

坦白说，笔者以为，霍金斯的千脑智能理论完全算不上是新皮层工作的理论框架，按此设计的机器也算不上是对脑逆向工程的产物。当然不管他的理解是否正确，他的思想总可以说是受脑研究的启发吧，不过按照这种启发所发明的机器是否真的有用，还在未定之天，只有实践才是检验真理的唯一标准，让我们拭目以待吧，看看霍金斯是否真的能像他的 Palm 掌上电脑那样发明出真正有用的智能机器。

致谢本文在写作过程中曾和王培教授、Karl Schlagenhauf 博士、梁培基教授以及俞洪波教授进行过有益的讨论，谨此致谢。

参考文献

Mountcastle V (1978) An organizing principle for cerebral function: The unit model and the distributed system. In The Mindful Brain, edited by Edelman GM and Mouncastle VB, 7-50. Cambridge, MA: MIT Press, 1978
Hawkins J with Blakeslee S (2004) On Intelligence. Levine Greenberg Literary Agency,Inc.
先后有两种中译本:霍金斯还布拉克斯莉著，贺俊杰等译人工智能的未来。陕西科学技术出版社；霍金斯和布莱克斯利著，廖璐、陆玉晨译(2022)新机器智能，浙江教育出版社。笔者对这两个书名的中译名都有保留，无论从原书名或书的内容来说，都以译为《智能论》或《论智能》较为贴切，不过当然不够吸引眼球。
Hawkins J (2021) A Thousand Brains: A New Theory of Intelligence. Basic Books.
中译本:霍金斯著，廖璐等译千脑智能，浙江教育出版社。
Freeman WJ (1999) How Brain Make Up Their Minds. Weidenfeld amp; Nicolson.
Kandel ER et al. (2013) Principles of Neuroscience. The McGraw-Hill Education.
da Costa NM and Martin KAC (2010) Whose cortical column would that be? Frontiers in Neuroanatomy. doi: 10.3389/fnana.2010.00016
Rockland AS (2010) Five points on columns. Frontiers in Neuroanatomy. doi: 10.3389/fnana.2010.00022
顾凡及(2017)三磅宇宙与神奇心智，上海科技教育出版社。
Abbott A (2018) Bat man. Nature 559:165-168
巴里著，钟扬等译(2020)大流感:最致命瘟疫的史诗。上海科技教育出版社
王培(2022)智能论纲要。上海科技教育出版社

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。