我在Google用AI研究基因,入門從吳恩達的課程開始

2021-02-24 量子位
允中 編譯 Google博客 
量子位 出品 | 公眾號 QbitAI

Google AI入駐計劃,是一項為期12個月的研究培訓項目,希望幫助不同領域的科學家和研究員,掌握機器學習和AI的方法。

最近,該計劃中的常駐生物學家Suhani Vora,與外界分享了Google AI入駐計劃的內部情況。比如他們如何學習機器學習、如何利用AI相關的方法推進研究。

這其中可能有一些值得借鑑的地方。

Q:你是如何把機器學習與基因研究結合起來的?

Suhani Vora:在之前的研究中,我主要圍繞CRISPR / Cas9系統的工程設計,展開基因組研究,雖然我知道通行的生物學方法,是比較有效的基因組編輯工具,但也有一些「端倪」,讓我知道可以把研究推進得更快。

其中一個很重要的環節,是預測新型生物設計中的作用因子。在每個設計周期中,我們使用之前搜集的非常少的數據,並依靠對這些數據的解析,來解釋實驗室各項數據結果。

由於缺乏強大的計算方法來利用大數據,以及幫助設計整個工作流程,我們的研究進展始終受限。

但之後了解到機器學習的原理,毫無疑問,如果能夠將我們的研究與機器學習結合,必然能大大提升效率,所以我們決定將機器學習應用到基因工程研究中。

起步階段,最關鍵的是進一步了解機器學習的原理。於是在Google員工的推薦下,我把Coursera上吳恩達(Andrew Ng)的機器學習課程學習了一遍,有了不少入門知識和樂趣,如果現在讓我推薦入門課程,我想沒有比吳恩達的課程更好的了。

其後,有了基礎知識和樂趣,我又開始學習MIT的機器學習課程,並閱讀基因組研究和深度學習結合的相關論文,這促使我進一步對想做的事情有了更深入的認知,並最終讓我在研究院畢業後能夠進入Google AI入駐計劃。

Q:能介紹下你的工作嗎?

Suhani Vora:我是一名跨學科的深度學習研究員,我利用編程、深度學習,去探索他們對基因組問題的適用性。

舉個例子,就像眾所周知用機器學習模型去做圖像識別一樣,我研究如何用神經網絡自動預測DNA序列的屬性,這其中還會有各種各樣的應用:比如預測DNA突變是否會誘發癌症等。

Q:典型的一天生活是什麼樣的?

Suhani Vora:在每一天的工作中,我基本都是通過編寫代碼來處理新的基因組數據,或在TensorFlow中創建神經網絡來模擬數據,我現在在這些模型上花費不少時間。

我還會花時間與其他成員\TensorFlow團隊成員聊天,以獲知他們的進展。其中還包括了與兩位Google導師會面,Mark DePristo和Quoc Le都是機器學習方面的大咖,他們會定期為我搭建的神經網絡模型給於指導。

Q:你認為機器學習對知識背景有要求嗎?

Suhani Vora:Google AI入駐計劃中,背景太廣泛了。我看到的共同點是:大家都對機器學習有強烈的興趣,或者將機器學習應用到特定的領域。

另外,我認為在線性代數、統計學、計算機科學,以及建模方面的專業背景,會讓整個工作更簡單一些,但並不是意味著不能從現在開始,因為你可以通過MOOCs這樣的在線學習平臺進行學習。

Q:你認為AI能為世界解決什麼樣的問題?

Suhani Vora:我想這與目的有關。取決於我們如何創造AI,以及利用AI為我們做些什麼。目前,深度學習方法已經被廣泛用於圖像識別、自然語言處理、語音識別等領域,我們已經從自動檢測寵物,中英文自動翻譯中受益。

未來,我想在機器人處理和醫學領域,也將出現一批造福人類的AI應用。

量子位AI社群11群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot4入群;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進群請加小助手微信號qbitbot4,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

相關焦點

  • 吳恩達deeplearning.ai五項課程完整筆記了解一下?
    自吳恩達發布 deeplearning.ai 課程以來,很多學習者陸續完成了所有專項課程並精心製作了課程筆記,在此過程中機器之心也一直在為讀者推薦優質的筆記。上個月,deep learning.ai 第五課發布,該系列課程最終結課。Mahmoud Badry 在 GitHub 上開源了五項課程的完整筆記,介紹了包括序列模型在內的詳細知識點。
  • 想入門人工智慧? 這些優質的 AI 資源絕對不要錯過
    越來越多的企業都開始對人工智慧進行投資,並在尋找具有AI技能的人才。隨著市場對AI人才的需求不斷增長,許多機構都開始提供相應的培訓課程,而且價格和質量各不相同。與其他所有學習一樣,在投入大量精力和金錢後,你當然不希望發現浪費了時間卻沒學到應獲得的技能。那麼對於想入門人工智慧的人群來說,應該從哪兒開始呢?本文列出了一些優質AI學習資源。
  • 吳恩達創業關你什麼事?
    百度前首席科學家吳恩達幾小時前剛剛在推特上宣布了他的下一個企業Deeplearning.ai,只有一個標誌,一個域名,還有一行「 2017 年8 月」的字樣,預示了發布日期。有趣的是,Deeplearning.ai 的域名似乎已註冊到百度位於矽谷森尼韋爾的研發機構——也就是吳恩達此前工作過的同一個辦公室。
  • 這套1600贊的NLP課程已開放,面向實戰,視頻代碼都有丨資源
    這套課程用的是PyTorch和fast.a庫所有的Python代碼都在Jupyter Notebook中,還有全套視頻與你為伴。服用指南直接看課程裡面有什麼乾貨。1、概覽什麼是NLP2、傳統NLP方法佔整個課程三分之一的篇幅,介紹了使用SVD進行主題建模,通過樸素貝葉斯和邏輯回歸、以及正則表達式進行情感分類。
  • 選機器學習課程怕踩雷?有人幫你選出了top 5優質課
    參考文章:吳恩達 Deeplearning.ai 課程學習全體驗:深度學習必備課程(已獲證書)入門 | 吳恩達 Deeplearning.ai 全部課程學習心得分享資源 | 吳恩達 deeplearning.ai 五項課程完整筆記了解一下?
  • 吳恩達悄然發布 AI 維基,另外他的技術崗已經招滿了-虎嗅網
    虎嗅註:似乎從百度離職之後,吳恩達回歸教育事業老本行,施展更加自如了。本文轉載自量子位,作者問耕。吳恩達又有新動作。wiki首先來說第一個。這個長假期間,吳恩達團隊在deeplearning.ai上悄然發布了一個新項目:AI維基百科。這個維基百科還向學習者們發出號召:一起來貢獻內容。目前這個維基有12個頁面,分別對應:歡迎、概述(神經網絡)、數學(導數、向量)、平臺和工具(Python、深度學習框架)、分類器、激活函數、超參數調整、代價函數等。
  • 302頁吳恩達Deeplearning.ai課程筆記,詳記基礎知識與作業代碼
    原標題:302頁吳恩達Deeplearning.ai課程筆記,詳記基礎知識與作業代碼 機器之心整理 作者:WanZhen 參與:機器之心編輯部 吳恩達的 DeepLearning.ai 已經於 1 月 31 日發布了最後一門課程。
  • 吳恩達演講直指AI落地三大挑戰,並提出解決方案
    隨著人工智慧的不斷發展,大量先進算法以及配套硬體設施不斷湧現,研究人員憑藉新算法等不斷刷新 SOTA 記錄,但是在科研中、論文中實現的高精度性能,很多卻不能應用於實際的生產中。AI 離真正的落地還有多遠?現階段,許多公司和研究團隊正在努力將研究轉化為實際的生產部署。
  • 吳恩達授課,斯坦福CS230深度學習課程資源開放
    機器之心整理參與:劉曉坤、雪、思源近日由吳恩達與 Kian Katanforoosh 指導的 CS230(深度學習)課程已經結束並放出了課程資料。這一門課程結合 Coursera 課外教學與課內教學展示了深度學習的基本概念與完整結構,機器之心簡要介紹了該課程及基本內容。
  • 吳恩達被diss了
    他們最近發布了全球最大的醫學影像數據集MURA,還用這個數據集訓練了一個169層的深度卷積神經網絡模型。發布數據集的同時,順帶也披露出這個AI模型識別肌肉骨骼病變的能力,比放射科醫師還是……差了那麼一點點。
  • 高效「煉丹」必備技能:一文實現深度學習數學原理入門,還有吳恩達...
    下面的深度學習數學基礎詳解,以DLP為例,你讀完後會對它的數學基礎有全面的了解,並且熟悉用數學解釋算法的基本思路。除了DLP,文末還一併為你準備了RNN、CNN數學原理,以及吳恩達老師的AI數學基礎課程。一文實現AI數學基礎入門,還在等什麼?
  • 當AI遇到生物-深度學習在生物研究中的應用案例列表
    ,可以從一個分子開始,生成只在特定的受體被激活的分子序列,例如針對多巴胺2型受體,這個工具生成的序列經過實驗驗證,95%都滿足需求。4)DeepChem,這是一個python庫,應用了LSTM和卷積神經網絡,作為一個可以從小樣本中學習的計算化學工具DeepChem不止可以應用在藥物的研發,還可以用在材料科學,量子化學的研究中。
  • 入門機器學習,照這個課程清單按順序學就對了
    機器之心整理參與:張倩、杜偉入門機器學習是一個循序漸進的過程,優質的學習資源和科學的學習路線缺一不可。在本文中,來自英偉達人工智慧應用團隊的計算機科學家 Chip Huyen 不僅列出了十大優質的免費機器學習課程資源,還將其串成了一條高效的學習路線。
  • 開課程騙錢,寫論文抄襲,AI「網紅名師」人設崩塌
    原 po 打趣說:糟糕,我發現自己將下載的 Siraj 論文副本命名為了「bullshit.pdf」。Siraj Raval 的論文抄襲事件甚至引起了程式設計師大神 Jeff Dean 的關注和轉推。道歉還有用嗎?網紅名師 or 江湖騙子?隨著深度學習逐漸成為熱門領域,越來越多的人正在尋求通過在線課程入門 AI。只要是入門了深度學習的人,估計都知道 Siraj Raval 的大名:他自稱人工智慧教育家,在 YouTube 頻道上推出的視頻也非常「接地氣」。
  • 用谷歌圖片搜索自製深度學習數據集 | 教程
    用谷歌圖片搜索自製深度學習數據集 | 教程 銅靈 編譯整理 就怕前腳剛立志搞個新研究,後腳就發現沒有合適的數據集可用。AI工程師從入門到放棄,可能就是這麼一會的功夫。 別找了,現在深度學習數據集也能自制了。
  • 關於AI學習方法的思考——產品經理入門人工智慧
    也許你已經嘗試的找過書籍資料、網上課程或培訓機構,是不是並沒有發現成熟的AI產品經理入門學習方法?好了,今天這篇文章我將向您分享我(作為產品經理)對入門人工智慧學習方法上的一些思考。我是一名網際網路產品經理,也希望進入AI領域。目前為止,我已經用了2個月的業餘時間學習入門知識,但還不能算是入門,原因就是人工智慧領域的概念過於寬泛,技術門檻較高。
  • 這是23門全世界最好的計算機科學課程
    如果你或者你的朋友想要學習相關課程,這一列表是一個不錯的參考,歡迎收藏轉發~1、Python交互程序設計入門(第 1 部分)來自萊斯大學,Coursera在這門課程中,介紹了編程的基本元素(如表達式、條件和函數) ,然後使用這些元素來創建簡單的交互式應用程式,如數字秒表。