摘要:研究表明,基于奖励的学习需要两种神经调节剂来平衡彼此的影响。
如果你听说过大脑中的两种化学神经递质,那可能是多巴胺和血清素。别管谷氨酸和伽马氨基丁酸起了大部分的作用,吸引所有头条新闻的一直都是多巴胺和血清素。多巴胺是 “快乐化学物质”,而血清素则是稳定情绪的 “温柔剂”。
当然,头条新闻大多是错误的。多巴胺在塑造行为方面的作用远远超出了“快乐”甚至“奖励”这样的简单概念。事实上,提高血清素的SSRI抗抑郁药需要几周或几个月的时间才能起作用,这表明,实际上并不是血清素水平的立即上升,而是下游大脑回路中一些仍然神秘的变化。
图1 纹状体多巴胺和血清素对强化的相反控制
斯坦福大学吴蔡神经科学研究所的一项新研究揭示了这些情绪管理分子的另一个新方面。这项研究在线发表在《自然》杂志上,首次准确地展示了多巴胺和血清素是如何共同作用的——或者更准确地说,是如何对立作用,来塑造我们的行为。
该研究的资深作者、斯坦福大学精神病学和行为科学普利兹克教授Robert Malenka说:“除了与我们的日常行为有关外,多巴胺和血清素还与多种神经和精神疾病有关:成瘾、自闭症、抑郁症、精神分裂症、帕金森症等等。”“如果我们要在治疗这些疾病方面取得进展,了解它们之间的相互作用对我们来说至关重要。”
理论:多巴胺和血清素对塑造行为都很重要——但如何影响呢?
长期以来的研究表明,多巴胺和血清素在不同物种的学习和决策中起着至关重要的作用。然而,这些神经递质之间的确切相互作用仍不清楚。多巴胺与奖励预测和寻求有关,而血清素似乎可以调节这些冲动,促进长期思考。
目前出现了两种主要理论:“协同假说”(synergy hypothesis),认为多巴胺处理短期回报,而血清素管理长期利益;“对立假说”(antagonency hypothesis),认为两者是平衡我们决策的对立力量,多巴胺敦促立即行动,血清素建议耐心。
斯坦福大学的这项新研究是吴蔡神经计划的一部分,为这些相互竞争的假设提供了第一个直接的实验测试。
实验:多巴胺和血清素在联想学习中的双重控制
Daniel Cardozo Pinto等人组成的研究小组创造了经过特殊改造的小鼠,使他们能够观察和控制同一动物体内的多巴胺和血清素系统。
这种创新的方法帮助他们确定了这两个系统在大脑中相互作用的位置——特别是在一个被称为伏隔核的边缘区域,它在情感、动机和奖励处理中起着关键作用。
Cardozo Pinto说:“这是一个技术要求很高的项目,需要我们开发新的策略来记录和操纵清醒、行为正常的动物体内多种神经调节剂的活动。”然而,他补充说,“我坚持了下来,因为我强烈怀疑多巴胺和血清素系统之间会有令人着迷的相互作用,而其他研究一次只关注一种神经调节剂,而事实证明正是如此。”
Cardozo Pinto等人用他们的创新工具观察了当小鼠学会将音调和闪光与甜蜜的奖励联系起来时,伏隔核中的多巴胺和血清素信号是如何变化的。他们发现,多巴胺和血清素系统的反应方向相反——多巴胺信号随着奖励而上升,而血清素信号则下降。
然后,研究人员使用光遗传学操作(一种利用光来控制转基因神经元的技术)在奖励学习过程中选择性地减弱每个系统的正常信号——无论是单独的还是联合的。
可以预见的是,考虑到将这些信号系统与奖励学习联系起来的研究历史,阻断多巴胺和血清素信号使小鼠无法将声音和光线线索与含糖奖励联系起来。更令人惊讶的是,恢复多巴胺或血清素信号本身并不足以让动物重新学习。只有两个系统都在线,动物才能成功地利用这些线索预测奖励的到来。
Cardozo Pinto回忆说:“这个项目中最令人惊讶和难忘的时刻是当我进行我的第一个光遗传学实验时,我测试了小鼠是喜欢多巴胺增加、血清素下降,还是两者兼而有之。我们将小鼠放在一个盒子里,并将盒子的不同部分与每种体验配对,这样老鼠就可以用脚投票选择他们喜欢的体验。我永远不会忘记在实验结束时走进房间,看到所有的小鼠都站在盒子的一边,共同代表两种操作方法时的兴奋。在科学上,得到一个如此惊人的结果是非常罕见的,你可以立即看到它,这是我们第一个直接证据来支持几十年前的多巴胺-血清素对立假说。”
即将到来的:调控多巴胺和血清素以改善精神病治疗
研究人员说,研究结果表明,多巴胺和血清素以相反的方式共同作用,帮助大脑从奖励中学习。
基于他们的研究结果,他们提出这两个系统的作用有点像汽车上的油门和刹车。当事情比预期的好时,多巴胺通过发出信号来鼓励寻求奖励的行为,产生“行动”信号。相比之下,血清素似乎在这一过程中踩了刹车,产生“停止”或“等待”的信号,潜在地帮助我们更有耐心,考虑长期后果,而不仅仅是眼前的回报。研究表明,有效的学习既需要多巴胺发出的“开始”信号,也需要血清素发出的“等待”信号,这样生物体才能正确地评估和应对有益的机会。
这一发现也对涉及多巴胺和血清素功能障碍的疾病有启示,比如成瘾,其中多巴胺能超敏反应和血清素能缺陷会导致强迫性的寻求奖励,以及包括抑郁和焦虑在内的情绪障碍,其中血清素信号的减少可能会损害行为灵活性和长期计划。
“随着多巴胺在奖励学习中的作用越来越清楚,多巴胺系统已经成为一个自然的起点,用于研究涉及奖励处理中断的疾病,如成瘾和抑郁。我们的研究表明,多巴胺和血清素系统形成了一个奖励的‘刹车’系统,这表明,未来关注这两个系统之间的相对平衡将是富有成效的。”
例如,在成瘾治疗中,治疗可能旨在抑制过度活跃的多巴胺信号,同时提高血清素的活性。在抑郁症中,目标可能是增强这两个系统,以改善动机和长期规划。
此外,该团队为完成这项研究而取得的技术进步,可能会长期应用于神经科学研究,Malenka补充道。“我们为这项研究开发的新方法现在可以应用于一系列有趣的问题,这些问题涉及大脑如何调节适应性行为,以及在成瘾、抑郁和自闭症谱系障碍等普遍的脑部疾病中,这些神经调节系统出了什么问题。”
参考资料
[1] Opponent control of reinforcement by striatal dopamine and serotonin