【导读】大脑不同区域之间的高效协同,使我们能够感知环境、做出决策、执行动作。然而,当神经通路因疾病或损伤而“断线”,功能便会受损。此时,我们能否重建这种跨脑区的信息传递?近日,香港科技大学王怡雯团队在《Nature Computational Science》发表的文章提出了一种基于行为强化的神经脉冲生成模型,利用行为层面的反馈,实现了功能性神经脉冲的在线生成,为神经旁路系统与闭环脑机接口的开发提供了新思路,也为神经功能康复带来新的可能。
大脑通过神经元之间的电脉冲,即“神经脉冲”,进行信息编码与传递。然而,神经系统疾病或损伤(如中风、阿尔茨海默症等)会破坏这些通路,导致功能障碍。
近年来,脑机接口(BMI)为功能恢复提供了新的可能。多数脑机接口研究聚焦于读取大脑信号,帮助患者控制机械臂等外部设备,以替代受损的运动功能(图1左)。
图 1 脑机接口(左)与神经旁路系统(右)
另一类更具前瞻性的思路是神经旁路系统,其希望能构建一条人工信息通路,从上游脑区神经信号中实时生成下游脑区神经脉冲活动序列,以多通道、时变的微电刺激实时、精准的调控下游神经元活动,从而绕过受损部位,恢复甚至增强原有的运动或认知功能(图1右)。
这一设想的核心挑战在于:如何根据上游脑区信号,准确生成最有效的下游脑区的脉冲序列模式?
具体而言,在受损神经通路中构建跨脑区的神经脉冲生成模型,需要克服两大瓶颈:
·缺乏可用的下游信号:在神经通路已受损的情况下,下游脑区的正常活动记录往往不可获得,或已严重失真;
· 复杂的神经编码机制:神经活动与行为之间存在非线性、“多对一”的复杂映射关系(即相同的行为可能由不同的神经活动所编码)。模型需要从海量可能的脉冲模式中找到最有效的下游活动,建立上下游脑区神经活动间的非线性映射。
研究方法及实验验证
为解决上述问题,研究团队提出了基于强化学习的点过程框架(RLPP)。该方法不依赖下游脑区的脉冲记录,而是以“行为是否成功”作为反馈信号,引导模型生成有效的脉冲序列。
下图展示了RLPP框架的具体结构。RLPP 模型接收上游脑区的神经脉冲输入,生成的下游脉冲模式由一个预训练的行为解码器转化为具体行为。基于行为是否成功,RLPP模型不断优化参数,调整输出的神经脉冲模式,从而提高行为层面的表现。
图 2 RLPP框架在大鼠mPFC-M1功能回路上的应用
这一过程模拟了生物脑“试错学习”(trial-and-error)的机制,使模型具备持续的探索与自我改进的能力,能够寻找有效的神经编码方式,从而得以生成与下游脑区功能相近、模式相符的多神经元脉冲序列。
研究团队在大鼠的运动控制通路(从内侧前额叶皮层(mPFC)到初级运动皮层(M1))以及小鼠视觉-运动通路的数据上验证了方法的有效性。
在行为解码成功率上,RLPP生成的神经脉冲序列显著超越了基于监督学习的方法。进一步理论分析显示,RLPP模型能充分提取上游信号中与行为相关的信息,并将其转化为有效的输出序列。
图 3 RLPP模型在解码成功率上显著优于基于监督学习的方法(SLPP)
图 4 RLPP模型能更有效的提取上游脑区记录中行为相关的信息用于信号生成
未来展望
随着神经记录与刺激技术的不断发展,神经旁路系统在真实临床场景具有广阔应用前景。RLPP模型所生成的神经脉冲时空模式有望助力实现精准神经调控,恢复受损的神经功能。
研究团队预计将研究成果推广至更多功能通路,如认知与感受相关回路。未来,结合迁移学习、强化学习算法与深度学习架构,RLPP模型有望进一步提升性能。长期来看,模型引导的刺激范式可能通过Hebbian可塑性机制诱导皮层重塑,实现长期神经康复。这项研究为神经旁路系统的发展提供了新的计算模型,也有望为理解脑区间信息编码与学习机制提供全新视角。
作者信息:文章第一作者为伍圣晖,现任香港科技大学研究助理教授。香港科技大学王怡雯教授为独立通信作者。文章合作者还包括香港科技大学刘凯教授团队、帝国理工学院的Dario Farina教授、佛罗里达大学的Jose Principe教授。
论文链接:
https://www.nature.com/articles/s43588-025-00915-5
排版校对:祁玉
来源:脑机智能在线
仅用于学术分享,若侵权请留言,即时删侵!