專家點評Cell|虛擬實境範式揭示多巴胺信號的生理意義

2020-12-07 BioArt生物藝術

點評 | 劉鼎 博士 (哈佛大學Catherine Dulac課題組博士後),楊鴻斌 博士(加州大學伯克利分校Stephan Lammel課題組博士後)

撰文 | 陳文強(哈佛醫學院Ronald Kahn課題組博士後)

責編 | 兮

多巴胺在學習、動機和運動功能的調控上發揮著至關重要的作用。因此,了解多巴胺系統介導的信號傳遞對於理解多巴胺調控多種生理功能具有重要意義。現在的主流觀點是,在強化學習(reinforcement learning)過程中,中腦多巴胺能神經元在機體獲得獎賞時的時相性活動(phasic activity,也有稱瞬時性放電)代表著獎賞預測誤差(reward prediction errors, RPEs)【1】。這一假說對於推動我們對多巴胺功能的理解有著重要意義。然而,早期研究使用的行為範式相對較為簡單,因此,這一假說是否適用於更複雜的行為範式還需進一步驗證。另外,也有其他實驗室報導了多巴胺的伏隔核釋放可獨立於中腦胞體的活動【2】,因此,複雜環境下的多巴胺環路水平的信號記錄具有重要意義。

2020年11月27日,來自美國哈佛大學Naoshige Uchida團隊的研究人員聯合包括北京大學李毓龍團隊在內的多個合作團隊,在Cell雜誌在線發表了題為A Unified Framework for Dopamine Signals across Timescales的研究論文,使用虛擬實境(Virtual reality, VR)下的複雜實驗範式,比較記錄胞體及軸突鈣信號及伏隔核多巴胺水平變化,從多角度證實了多巴胺的伏隔核釋放可編碼RPEs,且軸突末梢活動性與胞體活動性一致,揭示了多巴胺遞增信號(ramping signals)的驅動因素,從而更好地幫助我們了解多巴胺信號時相活動性的計算生物學機制。

首先,研究人員構建一項特殊的行為實驗範式,使得頭部固定的小鼠能夠在一個狹長的虛擬跑道探索以獲得獎賞(圖1),這一行為範式使得研究人員可以將RPE和當前獎賞值(value of the state)區分開,這個行為範式對於鑑定多巴胺信號的生理功能具有重要意義。

圖1

一般可以認為,當小鼠接近獎賞目標時,其當前獎賞值呈單調遞增 (monotonic increase),然而,當小鼠在移動過程中,研究人員可以利用虛擬實境的優勢將小鼠「瞬息移動」(teleport)至更接近獎賞目標的位置。研究人員進行如下的理論假設:

(1) 如果多巴胺代表著獎賞值信號,就應該在瞬息移動瞬間表現出逐步增加而隨後逐漸遞增的活動性,到達獎賞目標時多巴胺信號應該達到最大水平(圖2C左圖)。

(2) 如果多巴胺代表著獎賞預測誤差(RPE),那麼就應該在瞬息移動瞬間表現出瞬時興奮性,代表獎賞值的即時增加(圖2C右圖)。

(3) 若檢測小鼠運動速度,如果多巴胺信號代表著RPE,則信號的遞增特徵則可被小鼠運動速度調控 (圖2D),速度越快則遞增的上升程度越高(圖2E右圖),而獎賞值將在獎賞到達前達到同樣水平(圖2E左圖)。

圖2

使用這一虛擬實境行為範式,研究人員可直接監測多巴胺信號的遞增特徵是否與RPE或當前獎賞值有關。為監測多巴胺信號,研究人員使用光纖記錄技術監測投射至伏隔核的多巴胺神經元軸突鈣信號(圖3)。經過訓練,軸突鈣信號能在3-4秒的時程範圍內表現出漸進的遞增活動性。

圖3

研究人員設計了4種不同實驗(圖4)來決定伏隔核的多巴胺軸突信號是否代表RPE或當前獎賞值——

(1)實驗1:研究人員隨機選取了三種不同的瞬息移動方式——長時程、短時程及5秒暫停。

(2)實驗2:研究人員選取三個不同位置進行瞬息移動。

(3)實驗3:研究人員使用不同速度 (2倍速或0.5倍慢速)進行瞬息移動。

(4)實驗4:研究人員移動場景運動速度而不改變獲取獎賞的時間(即加速和減速運動)。

使用模型擬合分析,研究人員預測了RPE和當前獎賞值的不同模型,並運用實驗觀測結果驗證兩種模型的符合度,發現在所有實驗條件下,RPE模型能比獎賞值模型更好地解釋觀察到的數據。

圖4

以上的實驗雖然提示伏隔核多巴胺軸突活動性與RPE時程差異一致,但是這一結論來自神經元群體信號,同時近期有研究提示多巴胺軸突的局部調控可獨立於胞體尖峰活動 (spiking activity) 【2】,因此,研究人員需要在中腦腹側被蓋區(VTA)的多巴胺能神經元以單神經元水平活動性的層面來驗證這一結論。通過將光敏感通道蛋白channelrhodopsin-2表達入多巴胺能神經元,研究人員可通過神經元的光反應來鑑定多巴胺能神經元。研究人員通過光電極記錄了102個VTA神經元,並重複了此前4項實驗中的實驗1和實驗3 (圖5)。這一部分結果提示,大部分單神經元與RPE一致,且位於內側VTA的神經元能表現出更多的遞增活動。

圖5

隨後研究人員將鈣指示蛋白GCaMP表達於VTA多巴胺能神經元以記錄胞體鈣信號,發現VTA多巴胺神經元胞體和軸突末梢表現出相似水平的遞增活動性(圖6)。隨後藉助北京大學李毓龍課題組開發的多巴胺探針,研究人員對伏隔核多巴胺濃度進行監測,發現多巴胺水平和其他實驗中觀察到的鈣信號類似,提示多巴胺濃度依然可代表RPE。隨後,通過對代表著獎賞接近程度的位置線索的操控,研究人員發現這些空間線索對引起多巴胺能神經元的遞增活動是必要的。

圖6

總的說來,這篇文章結合虛擬實境環境下的複雜行為範式與多種不同空間和時程解析度的電生理記錄技術,實現了RPE和當前獎賞值的有效區分。通過瞬息移動和速度操控,研究人員記錄到了多巴胺斜坡遞增信號的不同程度改變,這些改變均與RPE表現一致。本文不僅檢測了多巴胺神經元向伏隔核投射的軸突末端的鈣信號、多巴胺分泌,還檢測了多巴胺神經元胞體的電活動,因此,本文通過較為全面地檢測多巴胺環路多個水平的信號,再次確認了伏隔核多巴胺信號能代表RPE的時程差異,深入我們對多巴胺系統計算生物學特徵的理解,有助於並幫助我們更好地揭示多巴胺信號和複雜生理功能的關聯。

解讀者 | 陳文強 博士 (哈佛醫學院Ronald Kahn課題組博士後)

陳文強,香港大學李嘉誠醫學院博士,哈佛醫學院Ronald Kahn教授實驗室博士後,主要研究神經膠質細胞代謝如何參與中樞神經精神疾病進程。

專家點評

劉鼎 博士(哈佛大學Catherine Dulac課題組博士後)

劉鼎博士簡介:劉鼎,中科院神經所博士,哈佛大學分子與細胞生物學系Catherine Dulac實驗室和Naoshige Uchida 實驗室聯合培養博士後,主要研究社交本能的分子及環路基礎。

提到多巴胺,大家都知道它是腦內的獎賞信號,開心快樂愉悅感成癮都和它有關。但是具體多巴胺(或者說分泌多巴胺的神經元)如何編碼愉悅信號還不清楚。現在比較主流的觀點認為,多巴胺活動和獎賞的預期偏差(reward prediction error)有關。比如不期而遇的獎勵能更有效產生多巴胺(想想不勞而獲的感覺),因為沒有預期,任何獎勵都能產生一個「正」的偏差。反過來說,希望越大失望越大,因為預期過高,如果獎勵不足,就容易產生「負」的偏差。

哈佛大學分子與細胞生物學系的Naoshige Uchida實驗室就是長期致力於研究中腦多巴胺系統在上下遊神經網絡相互作用中如何整合、產生、傳遞和細分「獎賞偏差信號」,以及這一信號是如何指導學習和決策的。Uchida實驗室的研究以嚴謹、細緻、考慮周全著稱,實驗室近年來更是致力於將動物實驗和計算模型融會貫通,試圖在突觸前、local微環路、突觸後等不同層面對多巴胺系統的工作邏輯(包括神經元電活動、鈣活動、多巴胺分泌等)進行統一和整合。希望深入了解的小夥伴可以參考他們實驗室的網頁:

https://projects.iq.harvard.edu/uchidalab/publications

本期介紹的Cell論文就是Uchida實驗室的最新研究成果。

前人關於「獎賞偏差信號」的研究主要集中在「實際得到獎勵「(actual reward)和「出現獎勵提示信號」 (reward predicting cue)的時候。在等待或者接近獎勵的過程中(想想明天就要放假的感覺),多巴胺的活動是怎樣的呢?最近有些研究發現當實驗小鼠接近獎勵時,多巴胺分泌會越來越多,呈現一個緩慢單調遞增的趨勢(ramp up)。

怎麼解釋這個現象呢?領域內分成兩派:一派認為遞增的多巴胺信號編碼了「當下狀態」(state value),這個狀態可以理解成對未來的預期,離獎勵越近,預期就越高,這裡並沒有涉及預期和實際的偏差;另一派則認為遞增的多巴胺信號編碼了「當下狀態的變化」(derivative-like signal over value),是實時評估「預期的當下」和「實際的當下」的「偏差」,離獎勵越近,預期的變化就越快。所以依然可以整合進「預期偏差」的理論框架(這就是這篇論文題目裡unified framework 的意思)。

上面的兩個假說的矛盾焦點在於,多巴胺編碼的是當下的「狀態量」還是「狀態量的變化量」。如果可以對「狀態的變化」做人為的操控,就可以區分這兩個假說。基於這個思路,這篇論文的作者使用虛擬實境(virtual reality)技術,訓練實驗小鼠走過一段虛擬走廊,然後在走廊盡頭獲得獎勵。在狀態操控實驗中,作者把小鼠「虛擬移動」(teleport)過一段走廊,並且觀察多巴胺信號的變化。如果多巴胺只和「當下狀態」(這裡可以理解為走廊的位置)有關,那麼虛擬移動之後多巴胺將持續上升,因為離獎勵更近了;如果多巴胺和「狀態的變化量」有關,那麼虛擬移動之後多巴胺活動將會回落,因為位置變化的速度比虛擬移動時變慢了。這就很好地區分開了兩個假說。

這篇論文系統地改變了「虛擬移動」的距離、位置、速度、加速度、方向、場景、任務類型等等變量,都得到了支持「預期偏差」假說的實驗結果。這篇論文在多巴胺神經元胞體電活動、鈣活動、投射鈣活動、多巴胺分泌等多個層面使用不同的技術手段進行了全面細緻的驗證,使用數學模型對實驗結果進行擬合對比,並且非常嚴謹地設置了多個對照實驗排除其他可能,進一步探索了產生多巴胺遞增信號的本質。這是一篇全面、嚴謹、細緻,值得好好學習閱讀的論文。

專家點評

楊鴻斌 博士(加州大學伯克利分校Stephan Lammel課題組博士後)

楊鴻斌博士簡介:楊鴻斌,浙江大學神經所博士,加州大學伯克利分校Stephan Lammel實驗室博士後,主要研究多巴胺神經環路對動機行為的調控機制。

過去研究認為多巴胺的時相性活動(phasic activity) 與運動,獎賞等多種行為有關,特別是多巴胺在伏隔核的時相性釋放參與RPE 的編碼。那伏隔核的多巴胺時相性釋放是否受VTA 多巴胺神經元的胞體活動所控制?最近來自加州大學舊金山分校Berke實驗室在Nature雜誌的文章報導【2】驚奇發現(詳見BioArt報導:Nature長文 | 獎賞動機行為與學習行為受不同腦區多巴胺的調控),伏隔核的多巴胺釋放獨立於其細胞胞體的活動,然而該結論掀起較大的同行爭議,由於多巴胺神經元包括多種亞群,特別是投射到伏隔核不同亞區的多巴胺神經元功能完全不同,然而在解剖學結構上相對於內側伏隔核投射的多巴胺神經元,外側VTA多巴胺神經元更方便進行電生理記錄。

根據Berke實驗室Nature文章中的電生理記錄位置圖,Berke 實驗室所觀察到的有趣結果有可能是源自於電生理記錄的是不同亞群的多巴胺神經元導致實驗結果被汙染。Uchida課題組利用多種行為學範式並結合多種挑戰性的在體記錄技術證實,多巴胺在編碼RPE時的末梢活動與其胞體活動基本一致,並不獨立於胞體活動。這就間接證明了Berke實驗室Nature工作的結論可能並不正確。本研究雖然並未區分伏隔核不同亞區投射的多巴胺神經亞群【3】,但根據其記錄位置,提示應該是medial VTA DA→ medial shell環路編碼RPE。那lateral VTA DA → lateral shell是否有著同樣功能及類似生物學現象?值得未來進一步研究確認。

原文連結

https://doi.org/10.1016/j.cell.2020.11.013.

參考文獻

1. Schultz, W., Dayan, P., and Montague, P.R. (1997). A neural substrate of prediction and reward. Science275, 1593–1599.

2. Mohebi, A., Pettibone, J.R., Hamid, A.A., Wong, J.T., Vinson, L.T., Patriarchi, T., Tian, L., Kennedy, R.T., and Berke, J.D. (2019). Dissociable dopamine dynamics for learning and motivation. Nature570, 65–70.

3. Yang H, de Jong JW, Tak Y, Peck J, Bateup HS, Lammel S. (2018) Nucleus Accumbens Subnuclei Regulate Motivated Behavior via Direct Inhibition and Disinhibition of VTA Dopamine Subpopulations. Neuron. 97(2):434-449.

相關焦點

  • 【學術前沿】專家點評Cell Research | 汪源/陳路/張燕組揭示惡性...
    BioArt高屋建瓴,提供專家點評,引導學術爭論,展現學術批評;誠心實意,關注科研生態,推廣科研經驗,倡導師生交流。總的來說,本研究確立了新的高效建模方法,並以此為基礎全景式展示了從hNSC到惡性膠質瘤的癌化路徑和細胞分子圖譜,對理解GBM發病機制和異質性形成原理並在此基礎上開發臨床早期診療策略具有重要意義。
  • 研究揭示多巴胺在學習過程中的功能
    研究揭示多巴胺在學習過程中的功能 作者:小柯機器人 發布時間:2020/12/25 14:59:16 美國哈佛醫學院霍華德休斯醫學研究所Bernardo L.
  • 【Cell Stem Cell】AD細胞療法!王建枝團隊揭示pTau蛋白異常聚積...
    而增強GABA能信號傳導,可促進AD模型鼠內源性的海馬神經元新生,並改善其認知功能。這為幹預海馬GABA能神經元調控海馬神經新生在AD細胞療法提供了理論基礎。 這項研究創新性地揭示了AD患者腦內失衡的微環境已不利於神經幹細胞正常增殖、分化為新生神經元。
  • 研究揭示GPCR磷酸化模式如何協調抑制素介導的信號傳導
    研究揭示GPCR磷酸化模式如何協調抑制素介導的信號傳導 作者:小柯機器人 發布時間:2020/12/10 16:23:07 美國史丹福大學醫學院的Ron O.
  • 專家點評Cell|利用基因組圖揭示癌症複雜結構變異特徵
    專家點評葉凱(西安交通大學)基因組變異包括單鹼基替換變異(SNV)、短插入缺失變異(indel)和結構變異。當前,世界各國高質量的二代甚至是三代測序數據大量湧現,進一步揭示了結構變異在種群差異、驅動物種性狀演化、疾病發生發展中的重要作用。最近人群隊列和腫瘤基因組研究揭示了複雜結構變異的存在,學界仍然在探索如何更好地發現、表徵複雜類型結構變異,統一複雜結構變異的數學描述。
  • 科學家揭示細胞大小變化的秘密
    科學家揭示細胞大小變化的秘密 作者:小柯機器人 發布時間:2020/10/17 22:55:09 法國巴黎文理研究大學Yohanns Bellache團隊和美國密西根大學David K.
  • 【科技前沿】專家點評:楊輝/周海波等利用CasRx在神經性疾病治療...
    同時,該研究還證明了這項技術可以非常高效且特異地將紋狀體內的星形膠質細胞轉分化成多巴胺神經元,並且基本消除了帕金森疾病的症狀。該工作稱得上是神經生物學領域一項重大突破,給今後臨床上治療相關疾病奠定了堅實的基礎。更多精彩詳見文末點評!
  • 宇宙是虛擬還是現實?專家:量子世界的2種情況讓人不得不懷疑!
    宇宙是虛擬還是現實?專家:量子世界的2種情況讓人不得不懷疑!人類自誕生以來,對於這個世界的認知,基本上都是通過大腦接收一切信號處理之後所產生的結果,比如說人類的眼睛,當看到某一個物體之後,視覺系統就會啟動,產生一種很特別的生物電信號,而這種信號會通過一系列的傳遞,進入我們的大腦,最後大腦會專門處理這些信號,因此我們才會看到世界上的任何物體。
  • 你的愁你的樂 螢光多巴胺探針能「看到」
    多巴胺是一種重要的神經傳導物質,用來幫助細胞傳送脈衝,它與帕金森氏症、藥物成癮、精神分裂症、多動症和創傷後壓力症候群等多種神經系統疾病密切相關。       為更好地研究多巴胺在生理和病理過程中的作用,研究人員需要擁有一種能夠實時、靈敏、特異地監測多巴胺的趁手「兵器」。
  • 科學家揭示章魚觸覺感受外界刺激的分子基礎
    科學家揭示章魚觸覺感受外界刺激的分子基礎 作者:小柯機器人 發布時間:2020/10/31 20:50:14 2020年10月29日,哈佛大學Nicholas W.
  • Cell Reports | Matthias Mann團隊新研究揭示凋亡Vs壞死性細胞...
    本文由景傑學術團隊原創解讀 細胞死亡(cell death)可表現為壞死(necrosis)和凋亡(apoptosis)。兩種死亡方式通過釋放不同的分子,從而導致明顯不同的生理結果。近年來,基於質譜的蛋白質組學的飛速發展,為系統地研究不同死亡方式下細胞內含物的釋放提供了一個全面的發現工具。
  • Cell:研究揭示大腦工作記憶新圖譜
    Sethupathy說:「與標準實驗室小鼠不同,這些小鼠的遺傳多樣性水平與人類的水平相當,這意味著有些可能擅長工作記憶任務,有些則沒有那麼多,我們可以研究他們大腦中的信息生理學會引起這種變化。」通過迷宮實驗,研究人員發現了一種對動物的工作記憶具有顯著影響的基因。
  • Cell+8篇Cell Reports|多組學研究揭示太空飛行對人體的影響
    因此,從某種層面上可以說,未來載人航天項目的成功取決於我們是否深入了解載人航天對人體生理的深刻影響。Comprehensive Multi-omics Analysis Reveals Mitochondrial Stress as a Central Biological Hub for Spaceflight Impact的研究論文,藉助系統生物學的研究方法,使用來自太空飛行的多個人源、小鼠源的組織細胞模型,通過轉錄組、蛋白質組及代謝組在內的多組學分析手段,從分子細胞水平揭示了太空飛行對人體生理的深刻影響
  • 經典回顧丨Cell種康:無損「電生理」鈣流為揭示水稻感知寒害分子
    基本信息主題:無損「電生理」鈣流為揭示水稻感知寒害的分子機制提供直接證據期刊:CellCOLD1編碼一個定位在質膜和內質網(ER)上的G-蛋白信號調節器。它與G蛋白α亞基相互作用,激活感知低溫的Ca2+通道,加速G蛋白GTPase的活性。研究進一步確定COLD1中的一個SNP2來源於中國野生稻(Oryza rufipogon),是COLDjap/ind具備耐寒能力的原因。
  • 政治的話語分析範式
    也正因為如此,政治的話語分析方式和政治學與語言學結合來進行政治研究,就顯得更加具有理論意義和現實價值。  沃達克關於政治的話語分析範式所揭示的是什麼呢?就是政治的虛構化。從沃達克的分析來看,政治「前臺」與「後臺」的內容是大相逕庭的。人們對政治家是有期待的,而政治家的「前臺」表演往往被人們賦予了一種自己所期待的客觀事實。如果是這樣,那就意味著政治家在「做政治」的時候成功地進行了知識管理,即把組織知識、專家知識、政治知識成功地調動起來並產生了積極的成效。
  • 腦外科專家顧建文講解現代「讀腦」電生理技術
    直到自然科學發展到了今天,人們才逐漸揭示大腦的奧秘。自然科學家在面對大腦進行研究的時候,才逐漸握向自然造化之妙的本質。科學家通過電生理為主的方法觸摸到了記憶思維的本質性的結構和興奮傳遞。2000喜訊傳來。卡爾松,格林格德教授因為在慢速突觸傳遞及其信號轉道方面的先驅性貢獻而獲得諾貝爾生理學和醫學獎。什麼是慢速突觸傳遞呢?神經細胞體之間的連接點,叫做「突觸」。
  • 多巴胺是如何讓我們對技術上癮的?
    教授的實驗表明,在中腦內部,多巴胺跟我們從行動獲得的回報有關。多巴胺似乎跟欲望、野心、成癮和性慾有關。Schultz和他的研究人員當時把一塊蘋果放到了屏幕後面,結果發現老鼠一啃食物的時候就看到了多巴胺反應。
  • 張忠華教授在《The Plant Cell》發表論文揭示黃瓜全雌基因分子...
    張忠華教授在《The Plant Cell》發表論文揭示黃瓜全雌基因分子作用機制 近日,青島農業大學園藝學院院長張忠華教授與中國農業科學院蔬菜花卉研究所孫進京副研究員進行合作,聯合中國農業科學院深圳農業基因組研究所,首次發現黃瓜中全雌基因(Female)是獲得新功能的基因ACS1G
  • 中國農業科學院作科所揭示弱藍光信號控制大豆赤黴素代謝和避蔭...
    近期,中國農業科學院農作物基因資源與基因改良國家重大科學工程作物生物信息學及應用創新團隊研究揭示了大豆隱花色素介導弱藍光信號調控赤黴素代謝和避蔭反應的分子機制,並為擴大大豆適應範圍及培育適合耐密抗倒高產大豆新品種提供了重要靶基因和育種新材料。相關研究成果於11月27日在線發表於《分子植物(Molecular Plant)》上。