Google AI入駐計劃,是一項為期12個月的研究培訓項目,希望幫助不同領域的科學家和研究員,掌握機器學習和AI的方法。
最近,該計劃中的常駐生物學家Suhani Vora,與外界分享了Google AI入駐計劃的內部情況。比如他們如何學習機器學習、如何利用AI相關的方法推進研究。
這其中可能有一些值得借鑑的地方。
Q:你是如何把機器學習與基因研究結合起來的?
Suhani Vora:在之前的研究中,我主要圍繞CRISPR / Cas9系統的工程設計,展開基因組研究,雖然我知道通行的生物學方法,是比較有效的基因組編輯工具,但也有一些「端倪」,讓我知道可以把研究推進得更快。
其中一個很重要的環節,是預測新型生物設計中的作用因子。在每個設計周期中,我們使用之前搜集的非常少的數據,並依靠對這些數據的解析,來解釋實驗室各項數據結果。
由於缺乏強大的計算方法來利用大數據,以及幫助設計整個工作流程,我們的研究進展始終受限。
但之後了解到機器學習的原理,毫無疑問,如果能夠將我們的研究與機器學習結合,必然能大大提升效率,所以我們決定將機器學習應用到基因工程研究中。
起步階段,最關鍵的是進一步了解機器學習的原理。於是在Google員工的推薦下,我把Coursera上吳恩達(Andrew Ng)的機器學習課程學習了一遍,有了不少入門知識和樂趣,如果現在讓我推薦入門課程,我想沒有比吳恩達的課程更好的了。
其後,有了基礎知識和樂趣,我又開始學習MIT的機器學習課程,並閱讀基因組研究和深度學習結合的相關論文,這促使我進一步對想做的事情有了更深入的認知,並最終讓我在研究院畢業後能夠進入Google AI入駐計劃。
Q:能介紹下你的工作嗎?
Suhani Vora:我是一名跨學科的深度學習研究員,我利用編程、深度學習,去探索他們對基因組問題的適用性。
舉個例子,就像眾所周知用機器學習模型去做圖像識別一樣,我研究如何用神經網絡自動預測DNA序列的屬性,這其中還會有各種各樣的應用:比如預測DNA突變是否會誘發癌症等。
Q:典型的一天生活是什麼樣的?
Suhani Vora:在每一天的工作中,我基本都是通過編寫代碼來處理新的基因組數據,或在TensorFlow中創建神經網絡來模擬數據,我現在在這些模型上花費不少時間。
我還會花時間與其他成員\TensorFlow團隊成員聊天,以獲知他們的進展。其中還包括了與兩位Google導師會面,Mark DePristo和Quoc Le都是機器學習方面的大咖,他們會定期為我搭建的神經網絡模型給於指導。
Q:你認為機器學習對知識背景有要求嗎?
Suhani Vora:Google AI入駐計劃中,背景太廣泛了。我看到的共同點是:大家都對機器學習有強烈的興趣,或者將機器學習應用到特定的領域。
另外,我認為在線性代數、統計學、計算機科學,以及建模方面的專業背景,會讓整個工作更簡單一些,但並不是意味著不能從現在開始,因為你可以通過MOOCs這樣的在線學習平臺進行學習。
Q:你認為AI能為世界解決什麼樣的問題?
Suhani Vora:我想這與目的有關。取決於我們如何創造AI,以及利用AI為我們做些什麼。目前,深度學習方法已經被廣泛用於圖像識別、自然語言處理、語音識別等領域,我們已經從自動檢測寵物,中英文自動翻譯中受益。
未來,我想在機器人處理和醫學領域,也將出現一批造福人類的AI應用。
量子位AI社群11群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot4入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微信號qbitbot4,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。