大數據文摘作品
編譯:蔣寶尚、龍牧雪
就在這周,谷歌剛剛發布了一個AI+AR顯微鏡組件,把它裝在普通的光學顯微鏡上,醫生就能在看到細胞組織的同時,看到AI預測出的癌細胞區域輪廓線,大大方便了診斷過程。
4月12號,一項谷歌和生物醫學研究機構Gladstone Institutes合作的有關「矽標記」的研究成果發表在了著名期刊Cell上。
論文連結:
https://www.sciencedirect.com/science/article/pii/S0092867418303647
矽標記,指使用計算機直接識別未被標記的圖像中細胞的特徵。
人眼識別這類特徵是非常困難的。傳統上,科學家主要使用一些化學物質,比如螢光標記,使細胞特徵人眼可見,但這些化學物質往往也殺死了細胞。
這項研究表明,計算機可以在不使用「侵入性技術」的情況下識別圖像中細胞的特徵,這意味著可以檢測未經處理的細胞,並幫助科學家收集他們自己無法觀察到的數據。
事實上,圖像所包含的信息遠比想像的要多。
Steven Finkbeiner博士是Gladstone Institutes的主任兼高級研究員,他與谷歌的計算機科學家合作,研究如何用人工智慧方法,通過訓練一臺計算機,從而給科學家「超人」的能力。他主要使用深度學習開發數據分析、識別模式以及趨勢預測的算法。
「這將帶來革命性的改變,」Finkbeiner說,「深度學習將從根本上改變我們生物醫學現有的研究體系,不僅能幫助我們發現未識別的特徵,而且還可以幫助我們找到新的治療方法來滿足醫療需求。」
生物學和人工智慧的碰撞
10年前,Finkbeiner和他的團隊在Gladstone發明了一種全自動機器人顯微鏡。這一顯微鏡可以追蹤細胞數小時,數天甚至數月。由於它每天產生3-5TB的數據,因此他們開發了強大的統計算法來分析這些數據。
鑑於收集到的數據的規模和複雜性,Finkbeiner開始研究深度學習,希望通過提供人類無法發現的洞察力來來幫助他分析數據。然後,谷歌找到了他。因為谷歌一直是人工智慧領域的「扛把子」,並在神經網絡算法方面有著絕對的權威。所以Finkbeiner決定與谷歌通力合作。
「我們想要利用我們對機器學習的熱情來解決一些複雜問題,」Google Accelerated Science主管Philip Nelson說,「與Gladstone合作是一個極好的機會,我們可以利用我們的人工智慧知識來幫助其他領域的科學家,這給社會帶來切實的利益。」
這一合作可謂強強聯合。Finkbeiner需要先進的計算機科學知識。谷歌需要一個生物醫學研究項目產生相關數據,來幫助他們訓練模型。
Finkbeiner最初嘗試過使用現有的軟體解決方案,但成效有限。這一次,谷歌幫助他的團隊使用TensorFlow定製了一個模型。
一個「神經網絡」的超人表現
儘管他們的大部分工作都依賴於顯微鏡圖像,但生物細胞大多是由水組成,所以並不容易探測出細胞的內部情況。
但科學家們一直在努力解決這一問題。隨著時間的推移,他們發現將螢光標記添加到細胞中,可以觀察人眼看不到的特徵。但是這有很大的缺點,因為這些化學物質往往會殺死細胞。
他們發明了一種叫做「矽標記」的深度學習方法,用這種方法,計算機可以發現和預測未標記細胞圖像中的特徵。這一方法使得科學家獲得了很多的隱藏信息,從而大大推動了生物醫學研究的進步。
「我們用同一細胞的兩張不同狀態的圖像來訓練神經網絡,一張是未標記的,另一張帶有螢光標記,」Google Accelerated Science軟體工程師Christiansen解釋說,「我們重複了這個過程數百萬次,然後,我們用神經網絡模型識別未標記的那一張圖片時,發現它可以準確預測出螢光標籤所屬的位置。」
當神經網絡識別細胞是否還活著的時候,可以達到98%的正確率。它甚至能夠在一堆活細胞中分辨出單個死細胞。相比之下,人類只有80%的正確率。
事實上,即使有經驗的生物學家在對同一細胞的圖片識別兩次的時候,也可能給出不同的答案。
Finkbeiner和Nelson認識到,一旦經過數據訓練,神經網絡就可以繼續提高性能,提高處理任務的能力和速度。
該模型還能區分不同的細胞類型。例如,神經網絡可以識別混合細胞中的神經元。甚至可以更進一步判斷神經元的延伸是軸突還是樹突。
Nelson說:「模型學到的越多,學習新的類似任務所需的數據就越少。這種遷移學習,即從一個環境中學到的知識用來幫助新環境中的學習任務,一直是人工智慧面臨的巨大挑戰。通過將以前的經驗應用於新的任務,我們的神經網絡可以繼續得到改進。」
「這種方法有可能從根本上改變生物醫學研究,」美國國家神經疾病和中風研究所的Margaret Sutherland說,「研究人員正在生成大量的數據,對於神經科學家來說,這意味著訓練機器來幫助分析這些信息,可以幫助我們更快地理解大腦細胞是如何組合在一起的,以及理解與藥物開發有關的應用。」
深度學習可以改變生物醫學
從智慧型手機到自動駕駛汽車,深度學習在領域內的應用幾乎已經司空見慣。但對於不熟悉人工智慧技術的生物學家來說,在實驗室中使用人工智慧作為工具是很難理解的。
深度學習在生物學上的潛在應用是無窮無盡的。在他的實驗室裡,Finkbeiner正試圖尋找新的方法來診斷和治療神經性疾病,如阿爾茨海默病、帕金森病等。
Finkbeiner說:「對於90%的患者來說,我們仍然不清楚疾病的確切原因,更有甚者,我們甚至不知道我們是否可以將這些疾病分為不同的類型。」
「深度學習工具可以幫助我們找到這些問題的答案,這對我們研究疾病的方式和我們進行臨床試驗的方式都有著巨大的影響。」
在不知道疾病分類的情況下,一種藥物可能在錯誤的患者群體上檢測時是有效的,並且實際上在針對其他不同患者群體時無效。
利用誘導多能幹細胞技術,科學家可以將患者自身的細胞與他們的臨床信息相匹配,而深度神經網絡可以找到這兩個數據集之間的內在聯繫,幫助找出一組細胞特徵相似的患者,並將其與適當的治療方法相匹配。
藉助人工智慧,可以從圖像中獲得幾乎無限數量的特徵信息。人類想像力的極限有可能是限制獲得這些數據的唯一因素。