多模态感觉信息整合与决策的神经机制----中国科学院脑科学与智能技术卓越创新中心

多模态感觉信息整合与决策的神经机制

发表日期：2019-10-09

　　10月10日，《神经元》期刊在线发表了题为《利用线性不变概率性群体编码实现基于复杂多模态感觉信息的最优决策》的研究论文，该研究由中国科学院脑科学与智能技术卓越创新中心（神经科学研究所）、中科院灵长类神经生物学重点实验室、上海脑科学与类脑研究中心空间感知研究组与瑞士日内瓦大学认知计算神经科学研究组合作完成。

　　生物体处在一个复杂多变的环境中，不同感觉信息输入的可靠性往往随着时间发生改变。例如，当我们在高速公路上突然驶入一团迷雾时，由于路面视觉信息输入的可靠性迅速降低，从而大脑需要立即调整策略，更多地依赖仪表读数、前庭觉、触觉和听觉等其它信息来判断车辆的行驶速度和方向，从而随时做出“是否需要刹车”和“是否需要微调方向盘”等重要决策，否则微小的失误就有可能导致严重的后果。大量的心理物理学实验表明，人类和很多其它动物都可采用贝叶斯推理（Bayesian inference）的方式，通过“估计不同信息来源的可靠性”和“根据可靠性对证据进行加权操作”两个关键步骤来整合感觉信息并优化决策形成。但是，大脑中实现这一过程的神经计算原理尚不清楚。

　　为了研究在复杂环境下多模态感觉信息最优整合及决策的神经机制，中国科学院脑科学与智能技术卓越创新中心的空间感知研究组以自身运动感知为模式系统，建立了一套基于前庭和视觉的虚拟现实实验平台。在该平台上，研究人员训练猕猴通过前庭与视觉两种不同模态的感觉信息来分辨其自身的运动方向（图1A）。重要的是，系统提供的运动刺激具有先加速后减速的过程；由于内耳前庭器官对加速度敏感，而视觉通道通常对速度敏感，因此大脑所接收到的这两种感觉信息具有不同的时间动力学，从而模拟了自然环境中证据可靠性实时变化的复杂多模态输入。经过训练，猕猴在多模态刺激（前庭+视觉）的实验条件下，可以分辨更加精细的自身运动角度变化，并且相对于单模态刺激的实验条件（仅前庭或仅视觉），其行为表现的提高符合贝叶斯最优整合理论的预期（图1B）。这些结果表明猕猴的确可以通过整合来自不同感觉渠道的信息来提高认知的精度，并且该过程中几乎不会发生信息的丢失（即“最优”）。

　　在猕猴分辨自身运动方向的同时，研究者通过金属微电极记录位于猕猴后顶叶皮层一个决策相关区域——顶内沟外侧区（lateral intraparietal area，或LIP）神经元的电生理活动。研究者发现，在两种不同的单模态刺激条件下，LIP神经元分别跨时间累积了来自不同物理量的证据——前庭来自加速度，而视觉来自速度（图1C和D，蓝色和红色曲线）。因此，神经元所接收的前庭和视觉证据的确具有实时变化的可靠性。那么，在多模态的实验条件下，神经元将如何实现贝叶斯最优整合的两个关键步骤，即“估计可靠性”和“实现加权操作”呢？一种假说认为，决策中枢实时收集每一小段时间窗口（例如几十毫秒）内的神经元脉冲信息，先评估该段时间内证据的可靠性，再依此调整对该段证据的权重分配；这种方式虽然在理论上可行，但容易带来决策的延迟，并且需要实时调整感觉输入的突触连接强度，因此对于生物大脑来说并不一定现实。相反，一种被称为“线性不变概率性群体编码（ilPPC）”的假说则认为，群体神经元的实时放电活动可以直接表征信息输入的可靠性：在这种情况下，只需要神经元群体对感觉输入进行一种突触权重不变的简单线性叠加，就可以实现信息的贝叶斯最优整合。因此，ilPPC假说提出的这种计算方式对于生物大脑来说会更加简易、快速和可行。

　　为了检验实验数据是否与ilPPC假说相符，研究人员构建和完善了一个基于ilPPC理论框架的神经网络模型（图1E）。理论估计和数值模拟的结果证实，网络中的神经元集群对前庭与视觉信息进行跨模态和跨时间的简单线性叠加的确可以自动实现证据可靠性依赖的加权操作，从而最优地完成多感觉决策的任务（图1F）。重要的是，神经网络模型中的神经元活动与真实的猕猴LIP数据具有一致的特性（图1G和H），提示大脑在复杂环境中面临实时多变的感觉输入时，的确可以采取线性不变概率性群体编码的方式实现贝叶斯最优决策。因此，该项工作首次为最优多感觉决策的ilPPC理论框架提供了实验和计算的支持，指出了决策神经元累积复杂多模态感觉证据的计算法则，从而填补了多感觉整合与感知决策这两个领域之间长期以来存在的空白。

　　该项研究由中科院脑智卓越中心（神经所）侯晗博士在顾勇研究员和亚历山大·布杰教授的联合指导下完成，侯晗为该论文第一作者，博士生郑啟豪和赵宇晨也参与了部分实验数据的采集和分析工作。该项研究得到了中国和瑞士双方的基础科学基金资助。

　　图1. (A) 实验装置的示意图。前庭和视觉信息分别由真实的平台运动（蓝色）和显示器上模拟的视觉光流（红色）提供。(B) 猕猴在整合条件下的心理物理阈值符合贝叶斯最优理论的预测。(C) 猕猴LIP脑区神经元的平均电活动。(D) 猕猴LIP神经元的群体费舍尔信息量。(E) 实现ilPPC理论框架的神经网络模型。(F) 与猕猴类似，该神经网络也可完成贝叶斯最优的多感觉决策（比较B和F）。(G) 网络模型中决策层神经元的电活动与真实的猕猴LIP神经元类似（比较C和G）。(H) 模型中决策层群体费舍尔信息量与猕猴LIP群体也类似（比较D和H）。

流金岁月

多模态感觉信息整合与决策的神经机制