香港中文大學(深圳)生命與健康科學學院教授;
瓦謝爾計算生物研究院,執行院長;
國家「千人計劃」創新人才長期項目特聘專家。
作為從教生涯橫跨兩岸三地(從臺灣交通大學到香港中文大學再到深圳校區)的學者,黃教授在9月12日下午向現場來賓展示了自己在AI和大數據領域的科研方向和學術成果,以及AI與大數據在未來的潛力。
以下為演講實錄,隨附本次演講的PPT。
謝謝劉博的邀請,今天我演講的題目是「AI與大數據在婦幼醫療之應用潛力」,生物信息這個領域講的AI和大數據以及我們剛剛看到的上一個部分講的AI在醫療器械的應用是有一些區別的。
我來自香港中文大學,相信各位都知道人工智慧、機器學習、深度學習的概念。AI其實是最先出來的,事實上這些範圍是越來越小,最開始我們講AI是想把機器和人做得一樣、想得一樣或者可以讓機器變得更聰明。現在計算機的計算力非常強,我們可以計算很多的東西,只要有大量的AI和大量的計算都可以算得出來,如果你相信手上的AI是有模型的,機器就一定會做到,最後的醫療器械一定是可以做出來的。
下面我往深走一些,有一些資料是沒有規則的,或者規則是沒有被找出來的,這就需要我們用AI和大數據來發掘生物醫藥標的的規則。剛剛劉博介紹的時候也講得非常好,我們在高校做的就是原始的創新,把這個原始的創新轉化到產業、帶動產業的發展,所以我今天講的AI和大數據希望從這個地方做一個介紹。
實際上AI存在於包括醫療器械在內的各個領域,但是我們做醫療器械的時候,需要這麼多AI嗎?我覺得AI最有應用潛力的實際上還是在開發新的診斷方法和治療方法以及藥物。但是這一切都是以數據為基礎的,要從數據中找到靈感。這裡展示了各式各樣的數據,有診斷數據、研究數據,患者數據,還有醫院管理的數據。
我今天說一下Human Genetic,它已經為人類醫療計劃起了一個很好的帶頭作用,我們知道了人的所有DNA。但是人是有個體差異的,我們也可以做各式各樣的測序和檢測以及個體化醫療和精準醫療。怎麼把人分成幾個區域,怎麼把14億人口的各種基因都分群,這裡其實就是AI做的事情,也涉及到我們說的大數據。
高通量測序的數據是非常大的,以後到醫院檢查的前提就是做一個高通量測序,就像拍X光一樣,你會發現之後的很多檢測都是非常簡單的。
現在還有了第三代測序,這是一家英國牛津大學的公司。這個測序的方法可以用在各個領域,深圳已經有大量的公司用測序和AI以及大數據來做檢測了。所以高通量測序已經有了大量的應用。
另外我講一下大數據。現在我們要做原始的創新就必須要從我們這個原生的土地上的人開始,例如婦女的乳腺癌和肺癌都是發病率前幾的。國內的數據都還不完善,我們其實可以仿照美國做大量的癌症資料庫,包括女性乳腺癌,還有肺癌、肝癌,甚至每一種癌症都可以這樣做。
這裡介紹的是多組學,是針對一個生物系統收集的各式各樣的數據,都可以用AI和大數據來分析,可以精確匹配和疾病相關的藥物。舉個例子,通過一個基因的抑制或者誘發就可以治療疾病,這些多組學數據可以用來發掘更多的藥物標的,有了標的就可以做創新。
大家都知道三陰性的乳腺癌現在還沒有很好的治療方式,我自己的項目也有涉及這方面的研究,用這些大數據可以讓我們找到創新藥物的標的用於精準治療。
現在國內有些卵巢癌病人在做化學治療之前需要檢測化療藥物是否有效。這個檢測涉及的生物標記也是經過大數據的分析才可以得到。這些成果轉化都是可以做成檢測服務的,包括醫院和第三方都可以做。
子宮內膜癌同樣也可以使用大量的數據來得到生物標的來用於醫療研究。在生殖和婦幼相關領域我們也做了很多的探索,比如現在最流行的微生物菌群,婦女的陰道裡面同樣也有菌群存在。
我們發現男性的精液菌群的檢測也可以用於臨床上評定精液的質量。我們收集了大概200個男性的精液,左邊的就是細菌的分布,大概有三類。我們知道不育症有的時候是男性的問題,有的時候是女性的問題。
血管裡面有很多的東西,包括新鮮的血液、正常細胞的DNA和癌細胞的DNA。現在只要抽靜脈血就可以做檢測分析,通過測序發掘數據,然後用這些數據開發分析歸納算法。
我們有一個涉及到腦電工程和AI的項目,做了一個系統用來診斷兒童多動症。我們讓一個小孩玩遊戲,用這個特定的帽子來檢測數據,然後用AI模型來判斷它是不是有某種形式的疾病。除了診斷我們也希望可以做到疾病的治療,比如讓接受測試的孩子,通過訓練得到改善。
醫療器械和AI以及腦科學的結合從國外來看肯定是一個很大的方向,尤其是對老年痴呆和失智症,而且這個交叉領域越來越大、越來越複雜。
這裡我做一個簡單的總結,各位可以看到很多的大數據,所以這些生物領域裡面,所要做的最原始、最源頭的創新就是要掌握第一手的資料,國內各個大學和各個研究機構都不斷的想要產生自己的數據,但是產生的數據還需要專業人員來訓練算法模型。。開發算法的方式非常多,但是開發算法的人懂生物或者懂醫學影像的是非常少的,懂生物醫藥的就更少了,這些都需要我們來推動。
我的看法是AI和大數據在未來的生物醫藥的產業有這麼幾個大方向,這幾個大方向我想鎖定的是最原始的創新,雖然最開始很辛苦,但肯定能走的更遠。用大數據產生大數據,AI其實是非常容易的,但是關鍵的是用你自己所掌握的數據來找到新的藥物和標的。假設你有一個藥物標的是別人做的,你還是可以做設計和開發,這樣就不能用舊有的方法去做。前面實際上是挖掘數據,我們說到所有的診斷其實儘可能做到精準。我們還可以做一個輔助醫生,最後讓醫生做診斷。現在的康復都已經做了,一個智慧康復的輔助工具是非常有應用前景的。最後一個是我覺得最難的,很多公司都在做,但是沒有一個做好的,就是你的健康大數據的分析,能不能做到好的預防,我個人相信把營養做好了就可以解決這個問題。
這個是我們學校的一個照片,歡迎大家來我們學校參觀,謝謝大家。