「公民科學」要麼是利用「人多力量大」的優勢,完成以科學家有限的時間和精力無法完成的海量研究工作;要麼是利用人類行為的隨機性和人類創造力上的差異性,實現對更多可能性的嘗試與探索。
葉盛
如果玩遊戲也能為科研做貢獻,你會感覺有點驕傲嗎?近來,科學界和遊戲界進行了不少合作。如火爆的電子遊戲《無主之地3》中嵌入了一個小遊戲,玩家看似在給彩色磚塊分類,其實已在不知不覺中,完成了一個科研項目的部分工作——給微生物基因組分類。
讓公眾通過玩遊戲參與科研項目,是「公民科學」的一種實現形式。人類自從進入網際網路時代以來,突然之間就發現:地球變小了。兩個遠隔重洋的陌生人,可以在網際網路上就同一個問題進行熱烈討論;互不相識的幾百人、幾千人甚至幾萬人,也可以為了同一個目標共同努力。科學家們利用網際網路把普通人的力量匯聚起來,用於解決科學研究上的困難問題。這就是所謂的「公民科學」。
一起仰望星空
早在「公民科學」這一概念誕生前,一些科學領域就已經有了普通民眾的參與,特別是在天文學領域。面對無垠的宇宙,天文學家能做的觀測實在是有限得可憐。因此,業餘天文學家和天文學愛好者一直是天文學領域不可忽視的輔助力量。比如太陽系內的小行星和彗星,有相當一部分就是由天文學愛好者利用自己的設備器材觀測發現的。他們甚至還早於專業天文學家發現了一些重要的天文學現象,比如轉瞬即逝的超新星爆發等等。
除了各自為戰,天文學愛好者還組織起來進行了更系統的觀測活動。早在1911年,美國天文學愛好者就成立了「變星觀測者協會」,觀測並繪製了宇宙中大量恆星的光變曲線。我們今天知道,大部分恆星的亮度都不是恆定的,而是會呈現出周期性變化。多數恆星的亮度變化是其內部機製造成的,比如周期性的膨脹收縮;還有一些恆星的亮度變化是外在原因導致的,比如它的伴星或行星周期性經過它的前方,遮擋了它的光芒。恆星光變曲線的繪製,能夠讓天文學家有機會對恆星進行更深入的研究,甚至是發現地外行星。
不過,天文學發展到今天,天文學愛好者們依靠自己相對簡陋的觀測設備已經很難有所作為了,進一步的發現往往要依賴於大型的專業天文望遠鏡。這些巨大的設備都安裝在那些位於高山之上、遠離都市光汙染的天文臺裡。這些大型天文望遠鏡在巡天觀測的過程中產生了海量的天文觀測數據,但是專業的天文學家力量有限,往往只能分析其中自己感興趣的那一小部分。換句話說,專業天文學家有設備、沒精力;而天文學愛好者有精力、沒設備。於是,一種新的合作模式誕生了:專業天文臺會將大型望遠鏡巡天觀測的數據公布到網際網路上,任何人都可以把這些數據下載到自己的電腦中,對感興趣的空域進行進一步觀察、比較和分析。這就是天文大數據挖掘。
顯然,相較於零散的數據挖掘,有組織的、系統性的數據挖掘會更有成效。2007年,英國牛津大學的天文學家啟動了一個叫做「星系動物園」的計劃,希望能有兩三萬參與者幫助他們依據90萬張星系照片對這些星系進行分類。這件事情如果讓一個訓練有素的研究生來做,即使他一分鐘都不休息,也要幹上好幾年。然而計劃推出後,有十萬餘名志願者參與了工作,僅用175天就完成了分類。而且所有星系平均進行了38次重複分類評估,確保了分類的準確性。在這個計劃的執行過程中,天文愛好者們甚至還發現了一種新的星系類型,後被命名為「豌豆星系」。
疊它!疊它!
有人曾說,和宇宙一樣浩瀚的,是我們的細胞。
早在2003年,生物學家們就自豪地宣布已經初步完成了人類基因組草圖的繪製,這標誌著生物學研究從此步入了後基因組時代。於是,有科學家信心滿滿地說,生物學的下一個目標就是測定人類細胞內所有蛋白質的三維結構。
通過人類基因組計劃我們知道,人類大約有不到2萬個基因。不要以為這2萬個基因自然就編碼了人類的2萬種蛋白質,實際上,問題複雜得多。一方面,基因轉錄成信使RNA之後要進行剪切,於是就可能出現不同的剪切版本;另一方面,即便是從信使RNA翻譯成肽鏈之後,蛋白質還可能發生各種各樣的化學修飾。因此有科學家估計,我們細胞內的蛋白質可能多達上百萬種。
事實上,今天給某個人進行全基因組測序只需要不到一周的時間,可是測定人類所有蛋白質結構的目標卻早已經被科學家們放棄了。數量還只是其中一方面的原因,更大的困難在於,蛋白質的三維結構既無法進行可靠的計算預測,也無法簡單地進行批量測定。基因翻譯出來的一維線性肽鏈是如何摺疊成三維蛋白質結構的,科學家至今對其中的原理仍知之甚少。即便用上了當下最火熱的人工智慧技術,蛋白質三維結構預測的準確率仍然很低。
2008年,華盛頓大學從事蛋白質結構預測研究的團隊開發了一個小遊戲FoldIt,直譯成中文就是「疊它」。通過這個小遊戲,每個普通人都可以加入到蛋白質結構預測的研究中來。
玩這個遊戲的時候,屏幕上會以三維立體的方式顯示出一個像線團一樣的東西。通過操作滑鼠,玩家可以在三維空間中移動或旋轉這個線團,從不同的角度仔細觀察它,也可以拽起線團中的某一段「線」。不過當玩家鬆開滑鼠鍵的時候,這段拽出來的「線」又會自動收縮回去。仔細觀察就會發現,線團已經跟剛才的樣子有點不太一樣了。
很多玩家並不知道,這個簡單的拉拽再回彈的動作就已經完成了一次科學實驗:松鬆散散的線團代表的是一個蛋白質的三維結構,而玩家隨意拉拽的動作相當於提高了結構的勢能,從而讓它有機會越過能量上的勢壘,尋求一個新的更低的整體勢能。FoldIt的目標,就是要尋求一個蛋白質整體能量最低的結構狀態。
對於遊戲玩家來說,他們的目標就是找到某個蛋白質能量最低的結構狀態。如果一個玩家得到的結構對應的能量值能夠登上全球排行榜,甚至成為榜首,那麼他得到的結構,很可能就是這個蛋白質的天然結構狀態。
事實證明,這個遊戲策略是有效的。在全球20多萬名玩家的共同努力之下,FoldIt找到的某些蛋白質的最低能量狀態,已經超過了此前電腦程式所能計算得到的最低能態。
「玩」出來的科學
上述天文學和結構生物學的案例代表了「公民科學」的兩種主要類型:要麼是利用「人多力量大」的優勢,完成以科學家有限的時間和精力無法完成的海量研究工作;要麼是利用人類行為的隨機性和人類創造力上的差異性,實現對更多可能性的嘗試與探索。這兩方面的工作,恰恰是前沿科學研究中的難點與痛點。
在一些人的想像中,科學研究就是做幾個實驗,進行一些觀測,整理一下結果,用公式算一算,便得出新的科學原理。或許,這樣的模式在一兩百年前還能成立,但是在今天卻很難行得通了。隨著科學體系主要框架的建立和完善,尚待發現的新科學原理往往存在於複雜的表象之下,需要海量數據的累積,以及對這些大數據的挖掘和分析。通俗來講,這些工作就是「體力活」,需要投入巨大的工作量,因此特別適合「公民科學家」的參與。
當科學的觸角伸向未知的領域時,科學家們往往無法獲得現有科學原理的有力支持。反過來想,如果一個科研課題可以完全通過現有理論推導出來,那麼它就是「已知」的,而不再屬於「未知」的了。面對「未知」的領域,不斷嘗試往往是一個痛苦但又無法避免的過程。很多年輕的科研人員就是在一次又一次的嘗試失敗之後,放棄了科研這條道路。而「公民科學」能夠讓更多的人貢獻自己的力量,從而在現有理論無法企及的領域,幫助科學家找到通往目標的捷徑。
為了充分調動公眾的積極性,許多科研項目都在嘗試與遊戲相結合。除前述《無主之地3》中的小遊戲以外,還有為細胞的螢光圖像進行分類的遊戲,根據恆星的光譜特徵進行分類的遊戲。這些項目與「星系動物園」在本質上是一樣的,都是請公眾幫忙進行大數據的分類。隨著人工智慧程序識別能力實現跨越式發展,這些分類工作很可能會在未來由人工智慧代勞。
而那些需要利用人類行為的隨機性和發揮人類創造力的科研項目,就不是人工智慧可以解決的了。除FoldIt外,比較成功的項目還有量子物理領域的「量子移動」,它能將遊戲玩家的操作轉化為構建量子計算機的可行方案。畢竟,計算和識別也許可以由程序代勞,但是「玩」永遠只能是意識主體自己的事情。或許正如愛因斯坦所說:「遊戲是研究的最高級形式。」這大概是對「公民科學」的最佳註解。
(作者系北京航空航天大學教授)
來源:2020年6月24日出版的《環球》雜誌 第13期
《環球》雜誌授權使用,其他媒體如需轉載,請與本刊聯繫
本期更多文章敬請關注《環球》雜誌微博、微信客戶端:「環球雜誌」