发布时间:2023-03-17
2023年3月15日,《Cell Reports》期刊在线发表题为《Optimal policy for uncertainty estimation concurrent with decision making》的研究论文。该研究由中国科学院脑科学与智能技术卓越创新中心(神经科学研究所)杨天明研究组完成。该研究在传统的感知抉择任务中引入一个新的选择项来测量被试抉择过程中的不确定性,被试在不确定的时候可以选择这个新的选项以获取帮助,来更好地完成感知抉择。研究组记录了被试者的感知抉择,对不确定选项的选择,以及相应的反应时长,通过构建基于价值的最优策略模型,解释了大脑对不确定性估计的计算机制。该工作为研究大脑在抉择过程中的不确定估计提供了新的理论框架,为未来进一步探究其神经机制提供了行为学和计算理论基础。
在日常生活中,带有不确定性的抉择情景随处可见。比如,人们可能会根据天上云层的厚度来判断天是否会下雨;然而,如果抬头看一眼天空,云不多不少让人觉得无法判断,那么人们可能不会草率地进行猜测,而会求助于其他信息,例如翻出手机,查看天气预报来帮助抉择。在上述情景里,主要的抉择问题是“天会不会下雨”,而是否需要查看手机寻求帮助这一选择则体现了人们在抉择中对不确定性的估计的结果。不确定性的估计和主要的抉择问题在大脑中是同时进行的,人们常常在做出具体的抉择之前就已经对不确定性的估计有了结果,然后通过寻求帮助等方式来提升自己抉择的准确性。
图1: 不确定性估计任务。被试需要通过观察屏幕上的随机点的运动来判断运动方向是向左还是向右,并通过按压左右方向键做出汇报。随机点带有噪音的,研究者通过控制噪音的大小来控制任务难度。被试如果在观看随机点的过程中感到不确定,可以选择按下箭头键,这时候随机点阵的噪音降低到一个很低的水平,被试可以更准确地来完成任务。
为了研究大脑在抉择过程中的不确定性估计,研究组设计了一个不确定性估计任务。被试主要的抉择任务是一个经典的随机点运动方向的感知抉择任务。被试观察屏幕上的一组运动的随机点并判断其运动方向是向左还是向右,然后通过按压左右方向键做出汇报(图1)。随机点带有噪音,研究者通过控制噪音的大小来控制任务难度和不确定性。与经典的任务不同,被试如果在观看随机点的过程中感到不确定,可以选择按下另外一个键(下箭头)来寻求帮助。这时候随机点的噪音降低到一个很低的水平,被试可以更准确地来完成任务。由于当被试只有在对随机点的方向不确定的时候才需要寻求帮助,因此这个选择称作“不确定”选择。研究者记录了被试的感知抉择(左或右)、“不确定”选择、以及相应的反应时。研究表明,当随机点的噪音越大,任务越难,被试越容易做出“不确定”选择;然而,意外的是,被试做出“不确定”选择的速度并不会因为任务变难而更快。
为了解释被试的这些感知抉择和“不确定”选择,研究者构建了一个基于价值的最优策略模型。该模型采用了经典的随机扩散模型来描述感知抉择中的证据累积。由于随机点充满噪音,被试通过连续观看随机点的运动来进行证据的累积。基于累积的证据,研究者分别计算出任务过程中每个时刻如果立刻进行感知抉择、立刻进行“不确定”选择、或是进行等待并收集更多信息的收益,然后选取其中价值收益最大的选项来进行任务(图2)。
图2: 最优策略模型。横轴为时间,纵轴为累积证据。被试从0点(图最左侧中间)开始累积信息。图中的每一个点的颜色代表在当前时间下如果累积到一定证据下的最优策略:灰色代表等待;黄色代表“不确定”选择;深浅蓝色区域分别代表选右和选左的感知抉择。
这个模型较好地拟合并解释了不同被试的抉择正确率以及反应时。尤其值得一提的是,该模型能够很好地解释“不确定性”选择的反应时受噪音水平影响较弱这一意外的实验发现。对比其他现有模型,该模型对新的实验结果的解释能力有显著地提升,同时也能够解释前人经典实验的结果,表明了该模型的通用性。该模型提示大脑的价值环路很可能在感知抉择过程中发挥重要作用。结合该研究组以及其他研究者之前在感知抉择和价值抉择方面的工作,该研究构架了一个整合感知抉择和价值抉择的计算理论框架。
此研究由博士研究生李効东和苏瑞鑫,以及博士后陈奕麟在杨天明研究员的指导下完成。该工作获得科技部、中科院以及上海市的资助。