随着手机,搜索引擎与大模型成为我们每个人越来越不可或缺的“外挂记忆”,我们每个个体所拥有的主观情景记忆成了唯一能锚定我们自我身份的基石。根据人类海马体研究,多个事件通过共同出现的元素互相关联时,回忆就逐渐清晰。可总有一天等我们回溯过去时,却发现自己只能提取抽象概念,却无法访问原初事件的完整情境表征。正所谓“此情可待成追忆,只是当时已惘然”。
祖母细胞vs记忆索引:
两种关于记忆的编码框架
在剥离了个人的社会标签后,真正定义每个人的是他们的回忆往事,正如音乐剧《猫》中那首“memory”中的歌词:“Touch me, it's so easy to leave me,All alone with my memory”(歌词大意:请触碰我,这样轻易地抛下我,徒留我与回忆形单影只)。然而是大脑中发生的何种变化,让往事不会如烟?
对该问题的回答,最早源于神经学家提出的“祖母神经元”假说,它假设存在一个只要想起自己的祖母就会激活的神经元,其损伤将导致特定记忆的永久丧失,类似人工智能模型中独立向量表征特定概念的方式。
祖母细胞最早由杰里·莱特文(Jerry Lettvin)提出,原本是用来调侃当时对大脑神经元功能的过度简化理解[1]。这类概念神经元集中分布于人类内侧颞叶中,其特征有三,一是其激活模式具有非黑即白的特性,对特定概念要么完全响应、要么毫无反应。二是它们同时具有多模态不变性与情境不变性,即它们既会对同一概念的不同表达形式做出反应,也会对同一概念在不同场景下的触发做出反应。其三则是空间上邻近的概念神经元可能会编码截然不同的概念,这种空间排布使得在完全不需要依赖长程神经连接的情况下,让风马牛不相及的概念得以直接建立联系。
与之相对的,另一种关于情景记忆如何形成的神经机制被称为索引假说(indexing hypothesis)。该假说认为在初始编码阶段,构成情景的多模态元素,例如咖啡馆的环境、初恋对象的面容以及爵士乐的旋律,会建立一种皮质活动模式,并将其投射到海马体中的一组神经元上。值得注意的是,这些海马体神经元并不直接编码情景中的独立元素,而是生成索引指向场景中同时发生的所有元素,这被称作联合码(conjunctive code)。换句话说,索引神经元编码的是情景中各种元素的联合,而不是单个元素。举例来说,图1描述的场景中,索引神经元编码的是在咖啡馆与初恋以及爵士音乐相关的整个情景,而非单独记录咖啡馆装潢、恋人特征或音乐曲调。
▷图1:用概念神经元vs索引神经元解释我们回忆往事时,大脑会发生什么?左边为索引神经元,右边为概念神经元给出的解释。例如想起和初恋约会的咖啡馆,此时编码那一刻听到的音乐,喝到的饮品,以及你初恋的概念神经元被同时激活,亦或是连接这三个元素的索引神经元激活,从而让你回忆起当时的场景。图源:参考文献9
哪些证据支持索引神经元的存在?
最直接的证据来自人类微电极实验,即在人类受试者的脑中,通过安置微电极观测单个神经元的活动,从而在受控实验中定位编码情景记忆的索引神经元。在这项实验中,当受试者在独特情景事件中关联多张图像时,特定索引神经元会在记忆编码阶段被激活,并在后续成功回忆相同情景时精确复现放电模式。
更重要的是,这类神经元仅响应特定情景组合(如"A+B+C"三元素的共现),而对单个概念元素(如独立图片A、B或C)无响应。研究进一步发现,此类绑定情景记忆的神经元集中分布于海马体,其电生理特性表明它们可能是兴奋性锥体神经元。[2]
▷图2:实验识别出的情景特异神经元中编码和回忆时,相比无关情景的对应神经元的激活率。图源:参考文献2
除了基于人类的实验,跨物种研究的证据也支持了索引神经元的存在。例如,当山雀埋藏食物时,其海马体内小部分锥体神经元对特定储食位点产生特异性激活,这些神经元的活动,如同商品有各自的条形码,是山雀对其储存食物地点的编码。
观察表明,在储食过程中,鸟类海马体中一小部分锥体神经元对特定的储食位点表现出显著的活动增加。同时,大多数其他锥体神经元受到抑制,从而产生一种条形码式的活动模式,这种模式是每个储食事件的独特特征,在提取储食的过程中会被重新激活。值得注意的是,索引神经元的活动与存储位置保持独立,并且与其他相同位置的储食事件也呈现不同。这说明索引神经元不是标记某个地方或事件,而是记录了时间,空间及事件的线索集合。[5]
▷图3:储存食物的鸟类,海马体中的神经元活动如条形码一样形成特异编码。图源:参考文献3
记忆印记(engram):
整合概念神经元和索引神经元
记忆印记(engram)最早由德国演化生物学家理查德·西蒙(Richard Semon)提出,代表过往经历在脑中留下的物理痕迹[4]。可这种记忆印记是由编码特定元素的概念神经元(concept neurons)构成,还是由表征事件整体要素的索引神经元(index neurons)编码?对该问题的回答,将涉及记忆是如何形成,加固,最终在回忆时被提取的,同时,它也要能解释为何我们会在回忆中出现不存在的元素,却又能通过模糊线索唤醒尘封往事。
既然记忆印记对应的是一个物理过程,那其对应的神经元也不是非黑即白,而是处在可以相互转换的动态过程中。就好比你在咖啡店遇见朋友,根据记忆印记的解释,在咖啡店的经历最初将由一组相对更易兴奋的稀疏神经元编码,这些神经元的激活随时间逐渐减弱。随后,它们转化为指向整个事件的索引神经元。几天后,当你在公园再次遇见同一个人,并回忆起上次在咖啡店见面的情景时,索引神经元被重新激活,通过回忆重新激活的神经元会经历兴奋性的暂时提升,从而更容易与新的经历绑定。也就是说,尽管初遇和回忆相隔数日,神经元的优先分配机制,仍确保了编码具有共同元素的神经元集合之间存在持续的重叠[5]。
▷图4:记忆形成过程中索引神经元的形成过程。图源:参考文献9
值得注意的是,编码不同事件的索引神经元集合,仅有部分存在重叠,因此不同事件仍然可以被可靠地区分。这种“恰到好处”的重叠平衡使得索引神经元既能够提取出共同元素,而模式分离则能确保每个事件由一组不同的神经元独立编码。若重叠过多,就会破坏区分机制,导致相似记忆相互干扰。
回到之前文图1及图4对应的例子,几天后当你与同一个朋友看电影时,编码前两个事件(相遇的咖啡店和听到的音乐)的神经元集合很可能再次与第三个事件(看电影)的神经元产生关联。这三个事件之间的共同元素——你的朋友——将成为关键线索。可以设想的是,经过多次上述的重叠经历,最初编码咖啡店偶遇事件的索引神经元中的一部分会变得“语义化”,从而发展出对“某个朋友”这个特定概念的编码,于是一个新的概念神经元就此诞生。[5]
▷图5:重叠记忆将索引神经元子集转化为概念神经元。参考文献9
在人脑中,索引神经元与概念神经元在情景记忆提取过程中协同工作。概念神经元编码情景的语义方面(例如,咖啡店这一普遍概念),通过为频繁出现的概念提供压缩表示并赋予优先记忆访问权,来起到记忆支架的作用。这可以解释为何记忆严重偏向于已有的图式或语义模式。这是由于概念神经元充当了新皮层表征与稀疏情景编码之间的接口。情景特定神经元则补充编码概念神经元无法处理的细节(例如特定的背景音乐),或区分相似事件(例如重复访问同一咖啡馆)。这意味着概念神经元和情景特定神经元在记忆处理中具有互补的作用。
随着神经元被分配到特定的事件或开始老化,其兴奋性就会降低,从而限制了其参与新事件的可能性,这反映为学习能力的下降。新生儿神经元表现出更高的兴奋性和可塑性。然而,随着它们的成熟,其内在兴奋性和放电率会下降,导致对特定输入的选择性增加。因此,虽然神经元可以编码多个相关概念,却难以分配到无关事件,因为兴奋性降低削弱了可塑性,只能代表相关事件中出现的概念。与此一致的是,当一个新的刺激与神经元概念相关联时,只有4%的概念神经元能够在长期维持这种新关联的刺激,其余最初表征这个概念的神经元会逐渐被用来编码其它概念。
然而,对于索引神经元的存在证据,也存在质疑[6]。针对记忆印记[4]的研究,存在如下质疑,首先是在编码和回忆过程中,神经元激活仅在其中一个实验中进行了比较,这种编码的可靠性尚不清楚。其次,编码和回忆过程中,参与者可能在思考相同的概念。此外,重叠记忆的消歧(例如,涉及同一个人的两个记忆)没有被测试。而在另一项研究[7]中,受试者被明确要求消歧重叠的记忆/故事,并且在更多的尝试次数(每篇故事10到15次;图 6)中没有发现联合编码的证据,即最初不响应的神经元,随着组合的重复出现,开始对特定人物,以及针对特定上下文/故事[6]或特定关联的事件组合出现时放电。
▷图6:人类海马反应中无上下文调节。受试者学习了两个涉及同一人物(who)但执行不同动作(what)的故事,在不同的时间(when)和空间(where)背景下。记录神经元在编码记忆和回忆时的单个神经元活动。在编码和回忆过程中,大多数神经元(编码时 97%,回忆时 100%)对两个故事的反应在统计上是相同的。此外,几乎所有最初无反应的神经元在编码(100%)和回忆(99.5%)过程中都没有进行联合编码(对一个故事中的一个或另一个人物作出反应)。图源:参考文献7
认知记忆的理论框架,
决定了我们将如何研究记忆
我们理解自然的过程,不只是记录现象,还包括建立一个统一的理论框架。对于记忆的研究亦是如此,如果认为情景记忆只是由一个个概念神经元或索引神经元的形成与死亡决定,那我们就会着重于寻找对应神经元存在的证据,而忽视单一类型神经元无法解释的现象。相反,追随记忆印记的框架允许我们从感官体验出发,逐步构建被特定线索激活的记忆。正如五月天歌中所唱:“七岁的那一年,抓住那只蝉,以为能抓住夏天”,而当我们老去时,若没有虚度这一生,便不必只是感叹“庄生晓梦迷蝴蝶”了。
为了验证概念神经元和索引神经元相互转换的理论,我们需要的就不是去观察被试者在受到刺激前后的神经元活动,而是要持续记录多日内单个神经元的活动,尝试识别最初编码特定事件的神经元集合。随着被试在不同情境中反复接触相同概念,研究人员需观察其中某些神经元是否逐渐转变为专门编码该概念的神经元。即便存在无关事件的干扰噪声,只要核心元素重复出现,索引神经元转变为概念神经元的过程应当仍然可见,且伴随神经元放电模式和连接结构的改变。
这一转换高度依赖神经元的重新激活。如果外部环境因素抑制了相关神经元重新激活的能力,新情景记忆的形成就会受阻,这正是阿尔茨海默病患者难以记住新经历的原因。通过微电极刺激等技术定向提高特定神经元的兴奋性,可增加其被招募到特定事件中并最终成为概念神经元的概率,有望帮助阿尔茨海默病患者重建记忆编码能力。相反,若要降低过度活跃神经元的兴奋性,则应减少其固化为特定概念单元的倾向,这可以为创伤后应激障碍(PTSD)等记忆失调提供潜在干预手段。
伴随实验观测技术的进步,概念神经元和索引神经元动态转换框架可为神经科学研究提供更广泛的指导。鉴于目前的技术仍无法充分记录编码特定事件的神经元集合中的多个相邻细胞,若能在同一被试中记录数百个神经元,并分析其细胞间相互作用,我们便能检测到索引神经元集合的形成,研究人员就可以据此提出更细致的问题。例如,若是某个提示未能启动记忆提取,那么这些集合中的部分神经元是否会重新激活其放电活动,尽管这种激活可能不足以激活整个集合?集合重新激活的强度与情景提取的细节之间是否存在关系?这些问题的答案可能因神经元所处的海马亚区的功能不同而存在差异。
伴随着长期对特定神经元的观察与记录,我们将会可以回答更多的问题,比如,索引神经元的兴奋性是如何在多个事件中,进行竞争性分配的?这将决定我们的注意力会投向何方。而当索引神经元经过多次提取后语义化为概念神经元时,这是否会导致对单个事件的细节记忆丢失?相关记忆是否会随时间流逝变得更相似,从而降低准确回忆具体细节的能力,比如在回忆中出现不存在的事物?还有,在记忆提取过程中,概念神经元与索引神经元的再激活强度是否与记忆的主观体验相关,如果是这些因素是通过什么机制决定神经元再激活强度的?等等。
从情景记忆到抽象概念,
应用于大模型的可解释性
人类进行抽象思维时,其神经基础可能与索引神经元向概念神经元转换的机制类似。所谓的抽象思维活动,就是将一个个抽象概念分解并重新组合。抽象和分离的表征几何结构对于复杂认知至关重要。这种活动的出现可能只是源于情景记忆生成过程中,由索引神经元到概念神经元这一过程的加速。而抽象概念作为特定场景下的共性,会压缩信息并剥离多余细节,这让笔者想到人工智能研究中,智能源于信息压缩这一观点。
24年Nature的一项研究指出[8],在推理过程中,海马体中的神经元会同时编码多个任务变量并进行解耦,并在被试学会推理后被观测到。例如,当被试理解“行人过马路需左右观察”的抽象规则时,无论具体情境(城市/乡村)或国家交通规则(左舵/右舵),海马体神经元会将"地理位置"和"交通规则"编码为相互独立的维度。这种解耦使得线性解码器能跨情境泛化规则,支持快速适应新环境。
值得注意的是,无论通过试错学习还是语言指令获得推理能力,最终形成的海马体表征几何结构都高度相似。这表明海马体通过重组神经表征的几何属性,将具体经验转化为可复用的抽象概念。这些发现印证了解耦的神经表征格式与复杂认知行为的直接关联。
显然,概念神经元相比索引神经元无疑更直观且更易理解,因此在大模型可解释性研究中,归因分析会优先采用这类抽象表征。概念神经元的形成可类比生物记忆的语义化,正如索引神经元通过反复激活转化为概念神经元,大模型中的抽象概念也源自特定训练数据的重复强化;部分输入会激活完整概念集群,类似大脑中少量线索触发完整事件记忆;而模型参数增加时,相似概念会激活截然不同的神经元集群,类似海马体通过模式分离区分相似记忆。这种机制可以直接增强推理能力。记忆从具体事件到抽象知识的转化过程,为理解人工智能的语义表征提供了生物学参照框架。
关于追问nextquestion
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括学术会议和交流、夏校培训、AI驱动科学大奖、科研型临床医生奖励计划、特殊病例社区、中文媒体追问等。