吳恩達聖誕寄語:回顧2020年,這些AI大事件讓我無法忘懷...

2021-01-10 雷鋒網

昨日,吳恩達在聖誕節之際回顧了2020年AI的一些重大發展,包括AI應對新冠疫情、數據集存在種族偏見、對抗虛假信息算法、AlphaFold預測蛋白質三維結構、1750億參數的GPT-3出現等等,並為大家送上節日祝福。

吳恩達寄語:

親愛的朋友們,在過去的十年中,每年我都會飛往新加坡或香港,與我的母親一起慶祝她的12月22日的生日。今年,我們則是通過Zoom線上慶生。 儘管距離遙遠,但我仍然感到很高興,我的家人們可以從美國,新加坡,香港,香港和紐西蘭一起線上聚會,並演唱同步性很差的「Happy Birthday To You」。


我希望我也可以和大家一起在Zoom通話,以祝大家節日快樂,新年快樂!    


節假日期間,我經常想一想重要的人,回顧他們為我或他人所做的事,並默默地表示我對他們的感謝。 這使我感到與他們的聯繫更加緊密。


我覺得在我們遠離社交的假期中思考這一點非常有價值:誰是您生活中最重要的人,您可能出於什麼原因要感謝他們?


無論是面對面的還是在線的,我都希望您能找到屬於自己的方式——在這個假期裡培養於最重要的人之間的關係。


Keep learning!                 

             

2020年回顧

在過去一年,突如其來的傳染性冠狀病毒破壞了人們的正常生活,它所導致的社會裂痕也威脅到了我們的共同利益。

在這一年期間,有大量的機器學習工程師參與其中,設計了用於新冠肺炎(Covid-19)診斷和治療的工具、建立了識別仇恨言論和虛假信息的模型,並指出和強調了整個AI社區偏見的存在。

但是事情也有輕鬆的一面:這一年裡可以將睡衣一鍵轉換成西裝的在家辦公工具、GPT-3語言模型、在AI輔助藝術和表演方面的引人入勝的實驗。

接下來請就讓我們一起探討過去一年我們的艱辛和輝煌。

應對新冠疫情

AI加快了科學家對冠狀病毒疫苗的搜尋,全球的機器學習研究人員爭先恐後地利用AI技術來對抗冠狀病毒。例如:

1、巴黎和坎城市在公交車站、公共汽車和市場中使用計算機視覺評估法規的遵守情況。

2、多哥政府訓練AI模型以識別衛星圖像中的貧困地區,並精準分配救濟金給最需要的人。

3、聊天機器人提供了合成的虛擬朋友,供被疫情封鎖的人們聊天和調情。     

4、視頻會議公司為在線辦公提供AI模型,以過濾背景噪音,並將睡衣變成虛擬的商務正裝。

5、中國研究機構合作開發了可在CT掃描中檢測Covid-19的AI模型,其準確度超過90%。 該模型已在七個國家/地區部署,代碼下載量超過300萬次。     

6、美國生物技術公司Moderna,其疫苗於12月份獲得美國食品藥品監督管理局的批准,它使用機器學習來優化mRNA序列以轉化為可以測試的分子。

此外,AI在治療Covid-19過程中也發揮了重要作用。例如,某非營利組織使用半監督深度學習平臺篩選了14000種候選抗病毒藥物,該系統驗證了有望用於動物試驗的四種化合物。

我的立場:AI不是萬能藥,但這種新型、高傳染性冠狀病毒的問世已經成為人類利用AI對抗傳染病能力的有力試驗。

Deepfake偽造「一切」

當生成對抗網絡滲透到文化、社會和科學領域時,它們正悄悄地在網絡中充斥著無底洞的合成圖像。

如我們所見,Deepfake出現在了主流娛樂活動、商業廣告、政治活動,甚至出現在紀錄片中,它被用來替換當事人的真實面貌以提供隱私保護。

起初,圖像生成器在線前端的大肆使用並沒有引起人們的注意,直到2019年,一張「 This Person Does Not Exis」的逼真合成人像在網上盛傳,具有幽默感的程式設計師們受到啟發開始利用生成式對抗網絡(GAN)模仿現實世界的細節,如下:

1、經過訓練的Google Earth 可以使「This City Does Not Exist」產生大大小小定居點的鳥瞰圖。

            

2、「This Horse Does Not Exist」 可以生成各種各樣的姿勢、品種和形態的馬。

      

3、 「This Pizza Does Not Exist」,與真實的披薩相比,可能會缺少一些奶酪和醬汁的光澤感。

4、生成的不存在的中國山水畫,欺騙了眾多藝術愛好者。

       論文連結:https://arxiv.org/pdf/2011.05552.pdf

關於GAN的發展、應用和風險等問題,我曾經對Lan Goodfellow進行了簡單的訪談。Lan Goodfellow表示,他在GAN那篇論文中就列舉了很多未來可能的研究方向,但沒有想過域到域的轉換(Domain-to-domain Translation),比如CycleGAN。

關於GAN的用途,Lan Goodfellow認為,將GAN應用在醫學領域會更有意義,比如為牙科患者設計個性化的牙冠,以及設計藥物等等。最後,談到GAN輸出中包含的偏見,Lan Goodfellow表示:「隨著GAN生成人臉越來越逼真,GAN可以通過為其他機器學習算法生成訓練數據,來抵消訓練數據中的偏見。

如果你使用的語言在數據中代表性不高,則可以對其進行過度採樣。但是,我希望還有其他方法可以解決數據集中代表性不足的問題。」

訪談更多內容參見以下連結:https://blog.deeplearning.ai/blog/the-batch-gan-special-issue-ian-goodfellow-for-real-detecting-fakes-including-minorities-synthesizing-training-data-applying-virtual-make-up

數據集存在種族偏見

深度學習的基本數據集開始受到廣泛關注。

由於數據集的編譯、標記和使用方式的不同,導致其在模型訓練過程中會對社會邊緣化群體產生偏見。研究人員的審查促進了AI的改革,同時也加深了人們對AI所隱含的社會偏見的認識。今年涉及的典型案例包括:

1、知名計算機視覺數據集ImageNet被迫下架。ImageNet的創建者李飛飛及其同事對數據集進行了重新梳理,並刪除了WordNet詞彙資料庫帶來的種族主義、性別歧視和其他貶義標籤。   


2、一項研究發現,即使使用未經標記的ImageNet數據進行訓練,其模型也可能由於數據多樣性不足而引起偏差。

3、麻省理工學院計算機科學與人工智慧實驗室撤回了Tiny Images數據集,原因是有外部研究人員發現該資料庫充斥著性暗示、種族歧視等大量不良標籤。

4、用於訓練StyleGAN的數據集FlickrFaces-HQ(FFHQ)同樣缺乏足夠的多樣性。基於StyleGAN模型訓練的PULSE算法將美國黑人總統巴拉克·歐巴馬(Barack Obama)的肖像畫變成了白人。


(PULSE將提高低解析度照片轉化為高解析度的圖像)

在PULSE事件出現後,Facebook首席科學家Yann LeCun和當時Google AI倫理負責人Timnit Gebru之間展開了一場辯論,爭論的焦點在於:機器學習中的社會偏見是出自AI數據集,還是AI系統?      

LeCun的立場是:模型在訓練「存在偏見的數據集」之前不存在偏見,也就是模型本身不存在偏見,而且有偏見的數據集是可以修改的。 Gebru則表示:正如我們在信中所說的,這種偏見是在社會差異的背景下產生的,要消除AI系統的偏見,必須解決整個領域的差異。隨後,在關於偏見的進一步分歧中,Gebru和Google分道揚鑣。

我的立場:確保數據集中的偏見在任務開始時被刪除,這項重要的工作才剛剛開始。

更多信息:過去一年中有關減少技術偏見的研究報告。

https://blog.deeplearning.ai/blog/the-batch-ais-progress-problem-recognizing-masked-faces-mapping-underwater-ecosystems-augmenting-feature

對抗虛假信息算法

全球新冠疫情和有爭議的美國大選掀起了一場虛假信息風暴,大型AI科技公司均受到了影響。

面對來自公眾日益增加的壓力——阻止煽動性謊言,Facebook、Google的YouTube部門以及Twitter在爭相更新其推薦引擎。據了解,紀錄片Netflix對他們進行了嚴厲的痛斥;美國國會議員對他們展開了調查;民意測驗顯示,他們已經失去了大多數美國人的信任。

這幾家公司嘗試通過各種算法和策略解決虛假信息問題,例如:

1、在發現了數百個包含AI生成的虛假頭像的用戶個人資料後,Facebook嚴厲打擊了被認為有誤導性的操縱媒體,並徹底禁止了Deepfake視頻。該公司繼續開發深度學習工具,以檢測仇恨言論,導致偏見的模因以及有關Covid-19的錯誤信息。

2、YouTube開發了一個分類器來識別違規內容:包括仇恨言論、陰謀論、醫學錯誤信息以及其它惡意視頻。

3、Facebook和Twitter關閉了他們認為是擾亂國家宣傳活動的帳戶。

4、這三家公司在含有美國大選誤導性信息內容中均添加了免責聲明。 Twitter採取了最嚴格的政策,直接舉報了唐納·川普總統的虛假推文。

不過,他們顯然沒有做出觸及底線的更改,而且其改革可能也不會持續很久,因為他們的政策有的已經鬆懈,有的已經發生了適得其反的效果。比如:

我的立場:目前在這場貓和老鼠的遊戲中,尚無明確的方法能夠贏得那些造謠者或虛假內容傳播者,但是貓在這場遊戲中必須保持領先的地位,否則將會失去公眾的信任,或者遭到監管機構的調查。           

AlphaFold預測蛋白質三維結構

AI在醫學制度上阻礙的減少,為深度學習在醫療設備和治療中的廣泛應用奠定了基礎。

前不久,DeepMind的AlphaFold模型在短短幾個小時內就確定了蛋白質的三維結構,其對研發新型藥物的承諾和對生物學的洞察迅速引起了人們的關注。據了解,醫療機構已經採取了行動將此類技術納入了主流醫學實踐中。

以下制度上的轉變提高了醫療AI的知名度,也讓它越來越受到認可。

1、美國最大的醫療保險公司已同意向某些使用了機器學習設備的醫生提供補償。

2、美國食品藥品監督管理局(FDA)批准了幾種新的基於AI的治療方法和設備,例如心臟超聲檢查系統。

3、一個跨學科的國際醫學專家小組介紹了兩個協議:Spirit和Consort,該協議旨在確保基於AI的臨床試驗能夠遵循最佳實踐,同時,便於外部評審人驗證試驗成果並進行報告。

我的立場:AI在醫學中的應用要求醫生和醫院重新組織其工作流程,這在一定程度上延緩了AI應用的進度。一旦FDA和醫療保障制度變得更加明朗,臨床醫生就會獲得更大的動力去做出改變以適應它們。

更多信息:Deeplearning AI醫療專刊包括深度學習在診斷、預防和治療方面的應用,以及AI醫學教父Eric Topol的獨家專訪。

https://blog.deeplearning.ai/blog/the-batch-ai-for-medicine-special-eric-topols-planetary-health-system-discovering-drugs-diagnosing-heart-disease-predicting-infections-alexa-for-doctors

GPT-3解鎖寫作新方式

自然語言處理的神經網絡體積越來越大,功能也越來越豐富、有趣。例如GPT-3可以用來寫作畫圖敲代碼玩遊戲等,被網友們玩出了50多種新用法。

GPT-3是OpenAI打造的包含1750億參數的文本生成器,它展示了自然語言處理方面的持續進步。同時,它展現了機器學習領域的廣泛趨勢:模型參數呈指數增長,無監督學習成為主流,且越來越普遍。   

    

1、GPT-3的寫作能力比上一代GPT-2更加強大,以至於用它來撰寫博客文章和Reddit評論時,成功欺騙了很多人類讀者。另外,也有很多人以不同的方式展現了GPT-3的創造性,例如撰寫哲學文章、與歷史人物對話。 

圖註:AI生成的哲學文章

2、語言模型促進了商業工具的發展,例如幫助Apple自動更正功能區分不同語言;讓Amazon的語音小助手Alexa能夠跟隨對話內容切換;更新機器人律師,對非法稱呼美國公民的電話銷售商提起訴訟。

3、OpenAI的GPT-2訓練Pixel數據生成iGPT,iGPT通過填充部分模糊的內容以生成怪異的圖像。

我的立場:語言模型顯然越大越好,但它還不止於此。 iGPT預示著在圖像和文字上訓練的模型,至少在OpenAI的工作中,它可能比2020年的巨型語言模型更聰明、更怪異。

更多信息:NLP特刊包括有關如何消除偏見,以及對NLP先驅Noam Shazeer的獨家採訪。

https://blog.deeplearning.ai/blog/the-batch-nlp-special-issue-powerful-techniques-from-amazon-apple-facebook-google-microsoft-salesforce


引用來源:

https://blog.deeplearning.ai/blog/the-batch-biggest-ai-stories-of-2020-covid-triage-fun-with-gans-disinfo-whack-a-mole-gpt-superstar-imagenet-recall-fda-approvals

雷鋒網雷鋒網雷鋒網(公眾號:雷鋒網)                

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 吳恩達:2020 年,這些 AI 大事件讓我無法忘懷……
    作者 | 吳恩達 編譯 | 陳大鑫、貝爽 編輯 | 青暮 轉自 | AI科技評論 日前,吳恩達在聖誕節之際回顧了2020年AI的一些重大事件,包括AI應對新冠疫情、數據集存在種族偏見、對抗虛假信息算法、AlphaFold
  • 吳恩達寄語:6大主題回顧AI圈兒的2020
    [ 導讀 ]吳恩達端著咖啡杯,為您"回顧"了人工智慧的2020,AI大戰疫情、無處不在的GAN、語言模型不斷壯大……我們整理了The Batch上,我們在2020年看到的一些AI主題和故事,看看AI如何改變、影響過去這一年的?即使2020有太多遺憾,2021,Keep Learning!
  • 吳恩達在Coursera開新課了! 「全民AI」強勢來襲
    離開百度之後,他推出了以機器學習為核心的在線課程: Deeplearning.ai,隨後又推出面向製造業的Landing.ai,目標是「通過AI技術重振製造業。」吳恩達是2017年11月AI Frontiers會議的主題發言人,今年推出了AI Fund——一個價值1.75億美元的孵化器項目,專門支持小型專業團隊利用機器學習解決關鍵問題。
  • 吳恩達全新課程上線!給商務人士和高管的AI指引課
    據海外科技媒體VentureBeat報導,吳恩達在電話採訪中稱:「人工智慧正在影響著每個行業,對這些不同角色的人來說,了解人工智慧知識如何指引他們的業務非常重要。」 「這門課程適合非技術人員,我希望[它]能夠教會我們.每一個人如何為他們的行業以及他們自己的職業使用人工智慧。」
  • 吳恩達全新Coursera課程「全民AI」重磅上線!
    這門課程不會包含任何複雜繁重的技術內容,吳恩達親自操刀授課,專門針對沒有 AI 經驗的學習者,幫助他們更好地了解技術,或技術可能對其業務產生影響的方式。更多乾貨內容請關注微信公眾號「AI 前線」(ID:ai-front)
  • 機器之心專訪吳恩達,深度學習課程項目Deeplearning.ai正式發布
    但是,即使像谷歌和百度這樣的公司也無法覆蓋這一領域的全部。所以,我認為讓深度學習社區發展壯大的最好方式就是創造更好的深度學習課程,讓越來越多的人接觸深度學習。據我所知,我之前的機器學習課程——也是全世界最熱門的機器學習課程,目前已經惠及了超過 180 萬人。而在 Deeplearning.ai,我們致力於讓更多人能夠獲得有關機器學習的課程。
  • 吳恩達重磅回歸,成立創業公司Deeplearning.ai
    這一消息的發布震驚業內,當時各方人士也紛紛猜測吳恩達何去何從,甚至臆測吳恩達離開百度的原因。經過近三個月的沉寂,吳恩達終於透露出了最終去處:創業!更多有關 Deeplearning.ai 的信息將會在 8 月份公布。昨天,前百度首席科學家吳恩達突然宣布了他的下一步計劃:Deeplearning.ai。
  • 專訪|吳恩達:AI寒冬不會再來,但一些公眾情緒需要糾正
    「AI人才缺口巨大,很長時間內都無法填補。」這是吳恩達對人工智慧教育的基本判斷。他給出的解決方法是網絡課堂,並參與創始了著名的線上學習平臺coursera。而他本人的斯坦福機器學習課程在coursera上長期位列熱門榜單,六年多來註冊學生數以百萬計。「AI老師,多多益善。我從斯坦福了解到一件事:即使斯坦福也沒有足夠的AI教授。」吳恩達說道。
  • 吳恩達發布一本全新電子書《轉型成為 AI 企業快速指南》
    這份 AI 轉型指南是自吳恩達創業創辦 Deeplearning.ai 、Landing.ai 、AI Fund 三大創業項目,分別關注深度學習教育、深度學習賦能傳統行業、AI 創投以來的最新動態。他希望從多種角度幫助學生、AI 創業者、開發者以及傳統企業了解如何在這個 AI 時代獲得成功,除了自己創業之外,不斷公開分享自己的經驗和見解能夠幫助到更多的人。
  • Drive.ai宣布融資5000萬美元,吳恩達進入董事會
    *吳恩達與妻子Carol Reiley吳恩達高徒創辦的Drive.aiDrive.ai創辦於2015年,總部位於矽谷山景城,其成員主要由斯坦福、伯克利大學等人工智慧研究人員構成。Drive.ai主要專注於無人駕駛軟體技術的研發,運用深度學習技術讓車輛實現識別、規劃與控制。
  • 零基礎,吳恩達「全民AI」課程開放預註冊,課程大綱公布
    「現在,AI正在影響著每個行業,對所有這些在不同行業中扮演不同角色的人來說,了解AI知識,更好地掌控自己業務是非常重要的,這門課程適合非技術人士,我希望每一個人都能通過這門課程,將AI納入自己的行業和職業規劃之中。
  • 你(也)是吳恩達的學生麼?
    ——Preety Purohit還有人側面反映了這門課的影響力之大——非常感謝您教授的深度學習系列課程,我學到了很多。並且我的每個同事都在通過這門課學習人工智慧。——Yang Liu這些經驗非常有用寶貴。每當我走過我的公司,我總能發現8-10個人在看這些講座。
  • 離開百度後,吳恩達宣布Drive.ai將推出無人駕駛打車服務
    品途商業評論(ID:pintu360)訊 美國當地時間5月7日,矽谷無人車創業公司Drive.ai宣布將於2018年7月在德克薩斯州弗裡斯科市提供自動駕駛汽車服務。公司總裁卡羅爾·萊利(Carol Reiley)是8位創始人之一,另外她還有一個身份就是AI大牛吳恩達的妻子;公司CEO是Sameep Tandon,在史丹福大學讀書時師從吳恩達。2017年6月,Drive.ai獲得5000萬美元B輪融資,同時宣布已離職百度的吳恩達加入Drive.ai董事會任董事。
  • 傳統工廠將是 AI 的下一個戰場,吳恩達的新公司 landing.ai 已與富士康達成合作
    吳恩達說道。 吳恩達這次並未透露 landing.ai 會通過何種具體技術解決方案來幫助富士康,或者其他傳統製造業廠商來改進他們的生產線。但他表示,很可能是視覺檢測相關技術,landing.ai 的研究團隊已經開發出了一種全新的算法,僅通過少量圖片訓練,就能讓機器識別電子元件和相機鏡頭中的瑕疵。
  • 吳恩達和網易合作免費開放deeplearning.ai課程!
    值得一提的是,8月上旬當吳恩達宣布啟動deeplearning.ai項目時,迎來了全球科技媒體的矚目。他曾在接受國內媒體採訪時明確表態,由於Deep Learning的內容需要通過Coursera平臺學習,可能會讓很多國內用戶無法接觸,所以會尋找機會將課程內容引入國內。僅僅20餘天時間,這個願望就得以實現,網易成為了吳恩達方面在國內的官方合作夥伴。
  • 重磅 | 吳恩達Coursera新課已經上線,開啟全民 AI 時代!
    說起吳恩達「Andrew Ng」,相信大家都非常熟悉了。作為人工智慧的大 IP,吳恩達一直致力於人工智慧的推廣和普及,爭取讓每個人都能感受人工智慧的魅力。自去年8月開始,吳恩達在 Coursera 上開設了由 5 門課組成的深度學習專項課程,掀起了一股人工智慧深度學習熱潮。這裡附上deeplearning.ai的官網:還沒結束!大牛是停不下腳步的。
  • 吳恩達旗下Drive.ai自動駕駛車輛德州路測,全程無駕駛員幹預
    離開百度之後,吳恩達的各項新事業也逐漸風聲水起,教育平臺Deeplearning.ai, 賦能傳統製造業的Landing.ai,AI Fund 基金,當然還有個自動駕駛項目Drive.ai。今日消息,吳恩達旗下的初創公司Drive.ai繼上周宣布在今年7月份在美國德克薩斯州對公眾開放無人駕駛叫車接送服務後,最近又對外公布了一段無人駕駛路測的視頻,在這段時長4分多鐘的視頻中,Drive.ai的無人駕駛車全程駕駛座上並沒有人,處於真正意義上的無人駕駛狀態。
  • Geoffrey Hinton、Andrew Moore、吳恩達等人總結 2017 AI 大事件
    因此,當 2017 年即將過去的時候,外媒 Axios 對人工智慧圈內的一些知名人物進行了一次採訪,看看在他們的眼裡,今年最重要的人工智慧大事件都是些什麼吧。雷鋒網(公眾號:雷鋒網) AI 科技評論把他們的呈現介紹如下。Rodney Brooks,Rethink Robotics 公司創始人對我來說,今年最重要的人工智慧時間,其實是我在電視上看到的一個廣告。
  • 吳恩達Deeplearning.ai課程學習全體驗:深度學習必備課程
    吳恩達最近推出的 deeplearning.ai 課程就是這樣的存在。 該課程一在 coursera 上發布,我立即註冊並花了四個晚上觀看其中的講座、參加考試、完成編程作業並通過了課程。 深度學習從業者和機器學習工程師通常會把大量時間花費在 Keras 與 TensorFlow 這樣的抽象工作中。
  • 吳恩達成立投資基金AI Fund,募資1.75億美元孵化AI創企
    驅動中國2018年1月31日消息   昨日晚間,百度前人工智慧業務負責人吳恩達發布一份公開信,宣布成立AI Fund投資基金,該基金將致力於促進更多人工智慧領域項目快速發展