吳恩達聖誕寄語:回顧2020年,這些AI大事件讓我無法忘懷……

2020-12-26 雷鋒網

昨日,吳恩達在聖誕節之際回顧了2020年AI的一些重大發展,包括AI應對新冠疫情、數據集存在種族偏見、對抗虛假信息算法、AlphaFold預測蛋白質三維結構、1750億參數的GPT-3出現等等,並為大家送上節日祝福。

吳恩達寄語:

親愛的朋友們,在過去的十年中,每年我都會飛往新加坡或香港,與我的母親一起慶祝她的12月22日的生日。今年,我們則是通過Zoom線上慶生。 儘管距離遙遠,但我仍然感到很高興,我的家人們可以從美國,新加坡,香港,香港和紐西蘭一起線上聚會,並演唱同步性很差的「Happy Birthday To You」。我希望我也可以和大家一起在Zoom通話,以祝大家節日快樂,新年快樂!節假日期間,我經常想一想重要的人,回顧他們為我或他人所做的事,並默默地表示我對他們的感謝。 這使我感到與他們的聯繫更加緊密。 我覺得在我們遠離社交的假期中思考這一點非常有價值:誰是您生活中最重要的人,您可能出於什麼原因要感謝他們?無論是面對面的還是在線的,我都希望您能找到屬於自己的方式——在這個假期裡培養於最重要的人之間的關係。Keep learning!

2020年回顧

在過去一年,突如其來的傳染性冠狀病毒破壞了人們的正常生活,它所導致的社會裂痕也威脅到了我們的共同利益。

在這一年期間,有大量的機器學習工程師參與其中,設計了用於新冠肺炎(Covid-19)診斷和治療的工具、建立了識別仇恨言論和虛假信息的模型,並指出和強調了整個AI社區偏見的存在。

但是事情也有輕鬆的一面:這一年裡可以將睡衣一鍵轉換成西裝的在家辦公工具、GPT-3語言模型、在AI輔助藝術和表演方面的引人入勝的實驗。

接下來請就讓我們一起探討過去一年我們的艱辛和輝煌。

應對新冠疫情

AI加快了科學家對冠狀病毒疫苗的搜尋,全球的機器學習研究人員爭先恐後地利用AI技術來對抗冠狀病毒。例如:

1、巴黎和坎城市在公交車站、公共汽車和市場中使用計算機視覺評估法規的遵守情況。

2、多哥政府訓練AI模型以識別衛星圖像中的貧困地區,並精準分配救濟金給最需要的人。

3、聊天機器人提供了合成的虛擬朋友,供被疫情封鎖的人們聊天和調情。

4、視頻會議公司為在線辦公提供AI模型,以過濾背景噪音,並將睡衣變成虛擬的商務正裝。

5、中國研究機構合作開發了可在CT掃描中檢測Covid-19的AI模型,其準確度超過90%。 該模型已在七個國家/地區部署,代碼下載量超過300萬次。

6、美國生物技術公司Moderna,其疫苗於12月份獲得美國食品藥品監督管理局的批准,它使用機器學習來優化mRNA序列以轉化為可以測試的分子。

此外,AI在治療Covid-19過程中也發揮了重要作用。例如,某非營利組織使用半監督深度學習平臺篩選了14000種候選抗病毒藥物,該系統驗證了有望用於動物試驗的四種化合物。

我的立場:AI不是萬能藥,但這種新型、高傳染性冠狀病毒的問世已經成為人類利用AI對抗傳染病能力的有力試驗。

Deepfake偽造「一切」

當生成對抗網絡滲透到文化、社會和科學領域時,它們正悄悄地在網絡中充斥著無底洞的合成圖像。

如我們所見,Deepfake出現在了主流娛樂活動、商業廣告、政治活動,甚至出現在紀錄片中,它被用來替換當事人的真實面貌以提供隱私保護。

起初,圖像生成器在線前端的大肆使用並沒有引起人們的注意,直到2019年,一張「 This Person Does Not Exis」的逼真合成人像在網上盛傳,具有幽默感的程式設計師們受到啟發開始利用生成式對抗網絡(GAN)模仿現實世界的細節,如下:

1、經過訓練的Google Earth 可以使「This City Does Not Exist」產生大大小小定居點的鳥瞰圖。

2、「This Horse Does Not Exist」 可以生成各種各樣的姿勢、品種和形態的馬。

3、 「This Pizza Does Not Exist」,與真實的披薩相比,可能會缺少一些奶酪和醬汁的光澤感。

4、生成的不存在的中國山水畫,欺騙了眾多藝術愛好者。

論文連結:https://arxiv.org/pdf/2011.05552.pdf

關於GAN的發展、應用和風險等問題,我曾經對Lan Goodfellow進行了簡單的訪談。Lan Goodfellow表示,他在GAN那篇論文中就列舉了很多未來可能的研究方向,但沒有想過域到域的轉換(Domain-to-domain Translation),比如CycleGAN。

關於GAN的用途,Lan Goodfellow認為,將GAN應用在醫學領域會更有意義,比如為牙科患者設計個性化的牙冠,以及設計藥物等等。最後,談到GAN輸出中包含的偏見,Lan Goodfellow表示:「隨著GAN生成人臉越來越逼真,GAN可以通過為其他機器學習算法生成訓練數據,來抵消訓練數據中的偏見。

如果你使用的語言在數據中代表性不高,則可以對其進行過度採樣。但是,我希望還有其他方法可以解決數據集中代表性不足的問題。」

訪談更多內容參見以下連結:https://blog.deeplearning.ai/blog/the-batch-gan-special-issue-ian-goodfellow-for-real-detecting-fakes-including-minorities-synthesizing-training-data-applying-virtual-make-up

數據集存在種族偏見

深度學習的基本數據集開始受到廣泛關注。

由於數據集的編譯、標記和使用方式的不同,導致其在模型訓練過程中會對社會邊緣化群體產生偏見。研究人員的審查促進了AI的改革,同時也加深了人們對AI所隱含的社會偏見的認識。今年涉及的典型案例包括:

1、知名計算機視覺數據集ImageNet被迫下架。ImageNet的創建者李飛飛及其同事對數據集進行了重新梳理,並刪除了WordNet詞彙資料庫帶來的種族主義、性別歧視和其他貶義標籤。

2、一項研究發現,即使使用未經標記的ImageNet數據進行訓練,其模型也可能由於數據多樣性不足而引起偏差。

3、麻省理工學院計算機科學與人工智慧實驗室撤回了Tiny Images數據集,原因是有外部研究人員發現該資料庫充斥著性暗示、種族歧視等大量不良標籤。

4、用於訓練StyleGAN的數據集FlickrFaces-HQ(FFHQ)同樣缺乏足夠的多樣性。基於StyleGAN模型訓練的PULSE算法將美國黑人總統巴拉克·歐巴馬(Barack Obama)的肖像畫變成了白人。

(PULSE將提高低解析度照片轉化為高解析度的圖像)

在PULSE事件出現後,Facebook首席科學家Yann LeCun和當時Google AI倫理負責人Timnit Gebru之間展開了一場辯論,爭論的焦點在於:機器學習中的社會偏見是出自AI數據集,還是AI系統?

LeCun的立場是:模型在訓練「存在偏見的數據集」之前不存在偏見,也就是模型本身不存在偏見,而且有偏見的數據集是可以修改的。 Gebru則表示:正如我們在信中所說的,這種偏見是在社會差異的背景下產生的,要消除AI系統的偏見,必須解決整個領域的差異。隨後,在關於偏見的進一步分歧中,Gebru和Google分道揚鑣。

我的立場:確保數據集中的偏見在任務開始時被刪除,這項重要的工作才剛剛開始。

更多信息:過去一年中有關減少技術偏見的研究報告。

https://blog.deeplearning.ai/blog/the-batch-ais-progress-problem-recognizing-masked-faces-mapping-underwater-ecosystems-augmenting-feature

對抗虛假信息算法

全球新冠疫情和有爭議的美國大選掀起了一場虛假信息風暴,大型AI科技公司均受到了影響。

面對來自公眾日益增加的壓力——阻止煽動性謊言,Facebook、Google的YouTube部門以及Twitter在爭相更新其推薦引擎。據了解,紀錄片Netflix對他們進行了嚴厲的痛斥;美國國會議員對他們展開了調查;民意測驗顯示,他們已經失去了大多數美國人的信任。

這幾家公司嘗試通過各種算法和策略解決虛假信息問題,例如:

1、在發現了數百個包含AI生成的虛假頭像的用戶個人資料後,Facebook嚴厲打擊了被認為有誤導性的操縱媒體,並徹底禁止了Deepfake視頻。該公司繼續開發深度學習工具,以檢測仇恨言論,導致偏見的模因以及有關Covid-19的錯誤信息。

2、YouTube開發了一個分類器來識別違規內容:包括仇恨言論、陰謀論、醫學錯誤信息以及其它惡意視頻。

3、Facebook和Twitter關閉了他們認為是擾亂國家宣傳活動的帳戶。

4、這三家公司在含有美國大選誤導性信息內容中均添加了免責聲明。 Twitter採取了最嚴格的政策,直接舉報了唐納·川普總統的虛假推文。

不過,他們顯然沒有做出觸及底線的更改,而且其改革可能也不會持續很久,因為他們的政策有的已經鬆懈,有的已經發生了適得其反的效果。比如:

今年6月,《華爾街日報》報導說,一些Facebook高管已經停止使用部分監管工具。該公司後來撤銷了在選舉期間使用的修改算法,因為它促進了某些新聞源的知名度。Facebook不夠誠意的做法已經導致了一些員工辭職。YouTube採用的算法成功減少了虛假信息內容創作者的訪問量。但它也增加了某些經常傳播同樣可疑信息的大型實體的訪問量,例如福布斯新聞。我的立場:目前在這場貓和老鼠的遊戲中,尚無明確的方法能夠贏得那些造謠者或虛假內容傳播者,但是貓在這場遊戲中必須保持領先的地位,否則將會失去公眾的信任,或者遭到監管機構的調查。

AlphaFold預測蛋白質三維結構

AI在醫學制度上阻礙的減少,為深度學習在醫療設備和治療中的廣泛應用奠定了基礎。

前不久,DeepMind的AlphaFold模型在短短幾個小時內就確定了蛋白質的三維結構,其對研發新型藥物的承諾和對生物學的洞察迅速引起了人們的關注。據了解,醫療機構已經採取了行動將此類技術納入了主流醫學實踐中。

以下制度上的轉變提高了醫療AI的知名度,也讓它越來越受到認可。

1、美國最大的醫療保險公司已同意向某些使用了機器學習設備的醫生提供補償。

2、美國食品藥品監督管理局(FDA)批准了幾種新的基於AI的治療方法和設備,例如心臟超聲檢查系統。

3、一個跨學科的國際醫學專家小組介紹了兩個協議:Spirit和Consort,該協議旨在確保基於AI的臨床試驗能夠遵循最佳實踐,同時,便於外部評審人驗證試驗成果並進行報告。

我的立場:AI在醫學中的應用要求醫生和醫院重新組織其工作流程,這在一定程度上延緩了AI應用的進度。一旦FDA和醫療保障制度變得更加明朗,臨床醫生就會獲得更大的動力去做出改變以適應它們。

更多信息:Deeplearning AI醫療專刊包括深度學習在診斷、預防和治療方面的應用,以及AI醫學教父Eric Topol的獨家專訪。

https://blog.deeplearning.ai/blog/the-batch-ai-for-medicine-special-eric-topols-planetary-health-system-discovering-drugs-diagnosing-heart-disease-predicting-infections-alexa-for-doctors

GPT-3解鎖寫作新方式

自然語言處理的神經網絡體積越來越大,功能也越來越豐富、有趣。例如GPT-3可以用來寫作畫圖敲代碼玩遊戲等,被網友們玩出了50多種新用法。

GPT-3是OpenAI打造的包含1750億參數的文本生成器,它展示了自然語言處理方面的持續進步。同時,它展現了機器學習領域的廣泛趨勢:模型參數呈指數增長,無監督學習成為主流,且越來越普遍。

1、GPT-3的寫作能力比上一代GPT-2更加強大,以至於用它來撰寫博客文章和Reddit評論時,成功欺騙了很多人類讀者。另外,也有很多人以不同的方式展現了GPT-3的創造性,例如撰寫哲學文章、與歷史人物對話。

圖註:AI生成的哲學文章

2、語言模型促進了商業工具的發展,例如幫助Apple自動更正功能區分不同語言;讓Amazon的語音小助手Alexa能夠跟隨對話內容切換;更新機器人律師,對非法稱呼美國公民的電話銷售商提起訴訟。

3、OpenAI的GPT-2訓練Pixel數據生成iGPT,iGPT通過填充部分模糊的內容以生成怪異的圖像。

我的立場:語言模型顯然越大越好,但它還不止於此。 iGPT預示著在圖像和文字上訓練的模型,至少在OpenAI的工作中,它可能比2020年的巨型語言模型更聰明、更怪異。

更多信息:NLP特刊包括有關如何消除偏見,以及對NLP先驅Noam Shazeer的獨家採訪。

https://blog.deeplearning.ai/blog/the-batch-nlp-special-issue-powerful-techniques-from-amazon-apple-facebook-google-microsoft-salesforce

引用來源:

https://blog.deeplearning.ai/blog/the-batch-biggest-ai-stories-of-2020-covid-triage-fun-with-gans-disinfo-whack-a-mole-gpt-superstar-imagenet-recall-fda-approvals

雷鋒網雷鋒網雷鋒網

相關焦點

  • 吳恩達:2020 年,這些 AI 大事件讓我無法忘懷...
    日前,吳恩達在聖誕節之際回顧了2020年AI的一些重大事件,包括AI應對新冠疫情、數據集存在種族偏見、對抗虛假信息算法、AlphaFold預測蛋白質三維結構
  • 2020 年,這些 AI 大事件讓我無法忘懷...
    ,吳恩達在聖誕節之際回顧了2020年AI的一些重大事件,包括AI應對新冠疫情、數據集存在種族偏見、對抗虛假信息算法、AlphaFold預測蛋白質三維結構、1750億參數的GPT-3出現等等,並為大家送上節日祝福。
  • 吳恩達:天下武功唯快不破,我的成功可以複製
    重要的是,這支基金的投資的第一個項目,就是吳恩達自己創辦的Landing.ai。另外,還有兩個投資項目沒有公布。量子位猜測,其中應該包括吳恩達夫人的新項目。前不久,吳恩達夫人從他倆主導創立的無人車公司Drive.ai總裁位置退下,開始新的創業。在Techcrunch的報導中,吳恩達表示AI Fund跟傳統的基金不一樣。更像是Betaworks模式。
  • 與吳恩達並肩戰鬥,她是 AI 界的女超人!|人物誌
    人工智慧大牛、Coursera聯合創始人、Google大腦組建者之一、前百度首席科學家……       吳恩達的夫人Carol Reiley,也是人工智慧界的女強人!約翰·霍普金斯大學雙料博士,Drive.ai聯合創始人,福布斯Top 50 WomenInTech,Top 25 AI領域傑出女性,更被評為矽谷最有影響力的女人之一!
  • 吳恩達離開百度因早有二心?是誰「挖」走了首席科學家?
    Moeednc2011年,吳恩達創建了谷歌的深度學習團隊,領導傳說中的「谷歌大腦」項目,也就是著名的「讓貓識照片」。2014年,在當時的百度深度學習研究院(IDL)常務副院長餘凱推動下,吳恩達加盟百度,並創立了百度在矽谷的研究院。近一年,吳恩達在國內活動頻繁。Moeednc人員重構在預料之中,不過「我以為會是張亞勤,沒想到是吳恩達」。
  • 與吳恩達並肩戰鬥,她是顏值爆表的AI科學家!
    吳恩達的夫人Carol Reiley,也是人工智慧界的女強人!       熱愛科技的Carol,在2014年宣布和吳恩達訂婚的戒指都是3D列印的!2015年,她聯合斯坦福人工智慧實驗室的團隊,創辦Drive.ai。
  • Adam Coates離職,吳恩達招人,「散落天涯」的百度AI研究力量
    值得一提的是,百度深度學習實驗室隸屬於百度研究院,而百度研究院的前負責人吳恩達,是 Coates 在博士期間的導師,共同發表了多篇機器學習方法方面的 NIPS、ICML 文章。而今年年初離開百度的吳恩達,在 8 月宣布成立教育項目 deeplearning.ai。
  • 吳恩達新書《Machine Learning Yearning》完整中文版(附下載)
    關於寫這本書的原因,吳恩達這樣解釋:AI,機器學習和深度學習正在逐漸改變越來越多的行業。我寫這本書《Machine Learning Yearning》的目的就是教會大家如何構建自己的機器學習項目。這本書的目的不是教你機器學習算法理論,而是教你如何使用這些算法。一些技術AI課程會給你錘子工具,而這本書就是讓你學會如何使用這些錘子工具。如果你致力於成為AI技術領導者並渴望為你的團隊找到正確的方向。
  • 吳恩達發布迄今為止「最複雜神經網絡」,取名 Nova Ng!
    2月7日,吳恩達的大女兒Nova Ng誕生,體重6斤整,剛剛,吳恩達發推慶祝女兒誕生,並在Medium上專門撰文,稱女兒為「第一代AI原住民」,文中對AI和世界的未來做了一番展望,字裡行間都是對女兒滿滿的愛與祝福。還記得吳恩達今年年初在Twitter上發布的「要當爹」的消息嗎?當時他在Twitter表示,自己第一個女兒預計將於2月來到這個世界,並附上了妻子的照片:
  • 沈向洋回答吳恩達:我預見的2021
    黑天鵝事件頻發的2020年,雖說坎坷不斷,但也讓AI的應用、落地空前加速。即將踏入新年之際,AI該邁出怎樣的下一步?近日,小冰公司董事長、清華大學雙聘教授沈向陽,應史丹福大學吳恩達教授的邀請,便對這一問題,基於小冰,基於「AI助力藝術」,發表了他的「預見」。
  • 回顧 2020 年 GitHub 的大事件,你知道多少?
    發生的大事件,回顧一下今年 GitHub 給我們帶來了那些驚喜。在 2020 年 2 月 12 日,GitHub CLI beta 版本 cli 發布。而在 2020 年 cli 更是從 0 開始直接破萬,目前星標 2w+。2、GitHub 收購 npm
  • 吳恩達靈魂發問:AI社區最亟待解決的問題是什麼?
    吳恩達靈魂發問:AI社區最亟待解決的問題是什麼? 2020-08-03 17:58 來源:澎湃新聞·澎湃號·湃客
  • 回顧2020年娛樂圈大事件,每一件都發人深省
    轉瞬之間,2020年就要過去,新的一年即將來臨。」回顧2020這一年,疫情就像張巨大的灰網,將我們牢牢禁錮住,無處可逃,人們的抽泣聲此起彼伏,壓抑又難熬。而時代的一粒灰,落在每個人身上,就是一座沉重的山,壓得人喘不過氣來。彼時,娛樂圈也發生了不少大事件,令網友們直呼:「吃瓜年年有,今年格外多。」
  • AI大神吳恩達的宣言:女兒將成為第一代AI原住民!
    前段時間,人工智慧界大神吳恩達(Andrew Ng)迎來大喜事!吳恩達和妻子Carol E. Reiley的女兒出生了,寶寶的名字叫Nova Ng。一大票人工智慧圈的風雲人物向吳恩達夫婦送上了祝福。▲Google AI的掌門人Jeff Dean第一時間送上祝福
  • 第五人格:2020莊園「大事件」回顧!這些故事,萌新都沒聽過?
    不知不覺間2020年很快就要過去了,之前也有很多玩家詢問趣遊君,在2020年中莊園玩家圈子都發生了什麼重要的大事件。這個問題還是挺有趣的,因為隨著時間的推移,很多過去的事情都會被玩家慢慢的遺忘,但是好在我們有記筆記的習慣,這也跟我們做自媒體這個職業有關係。
  • 從百度出走的「AI大牛」
    12月28日,王勁對外回應百度對其的起訴稱:「我到今天為止沒有收到任何法院傳票和法院給我的任何信息。」此前,百度以侵犯商業秘密為由,將王勁及其成立的AI創業公司景馳科技起訴至北京智慧財產權法院。  王勁並不是唯一從百度出走的AI科學家。從百度出走的AI人才們,他們或者自立門戶,或者被高薪挖角。
  • 一文回顧:2020年在我們身邊發生的健康大事件!
    2020,關鍵詞當然是 「新冠 」,與此同時也是全世界大變局,作為醫生,我也來跟大家聊一聊,我眼中的2020,健康大事件吧! 1.新冠疫情——你的生活改變了多少?
  • 吳恩達、李飛飛、沈向洋:2021年的人工智慧會是這個樣子
    在今年的最後一天,吳恩達邀請了沈向洋、李飛飛等人工智慧的頂級學者,讓大牛們對 2021 年的 AI 技術發展進行了一次展望。在人才不斷流向業界、常規架構算力進入瓶頸期的今天,作為一名從業者應該看到什麼?他們是這樣說的……新的一年近在咫尺,吳恩達分享了自己對人工智慧在接下來一年中發展的三個願望:縮短概念證明與生產之間的差距。
  • 吳恩達旗下公司發布AI社交距離監控工具
    近日,吳恩達創立的AI公司Landing AI發布了一款社交距離檢測工具,幫助疫情期間不得不工作的人,確保他們在工作場所的社交距離,該工具可以通過分析攝像頭拍攝的實時視頻流來檢測人們是否保持安全距離。2014年,被冠以「谷歌大腦之父」的吳恩達加入百度,負責Baidu Brain計劃,此次加盟被認為是中國網際網路公司迄今為止引入的最重要的外援。2017年,吳恩達離開百度,創立了 Landing AI。Landing AI對此次開發軟體的技術方法進行了詳細的介紹,搭配攝像機的軟體技術包含三個主要步驟:校準、檢測和測量。
  • 2020日本演藝圈大事件回顧:嵐活動終止,永遠懷念春馬
    2020年對日本演藝圈來說是不平靜的一年。回顧今年日本演藝圈悲多於喜:嵐年底活動終止、志村健因COVID-19離世、三浦春馬和竹內結子相繼結束生命、山下智久宣布退出傑尼斯...。日劇女神石原聰美、戶田惠裡香閃電公布喜訊,幸福宣言讓人忍不住跟著微笑,卻也令許多粉絲心碎一地。小編集結日本演藝圈年度11大事件,現在就一起來回顧令人百感交集的2020年吧!