AI學會「搞」科研登Nature,知乎網友:不忍直視的水

2021-01-09 機器之心Pro

機器之心報導

機器之心編輯部

人工智慧可以在複雜的圍棋遊戲中輕鬆戰勝人類,但它們可以幫助我們做出科學發現嗎?美國能源部勞倫斯伯克利國家實驗室最近發表在《自然》雜誌上的一篇論文引起了人們的廣泛關注。研究人員表示,人工智慧在自動閱讀 300 萬篇材料學領域的論文之後發現了全新的科學知識。

在人們的普遍印象裡,論文上了 Nature,那結論自然也就八九不離十了。然而對於熟悉人工智慧的人來說,該研究有些奇怪的是:論文中模型使用的技術是「

詞嵌入

」——既不是卷積神經網絡,也不是循環神經網絡等更複雜的模型。這麼簡單的模型,真的可以幫助我們找到成百上千研究者多年來從未找到的新材料嗎?

這篇文章發表之後引來了機器學習社區的大量反對意見,人們紛紛對這樣的「灌水」行徑表示不忍直視。

讓我們先看看論文是怎麼說的:

AI 學會「看論文」了,研究還上了 Nature

該論文的作者來自伯克利國家實驗室能量存儲與分布式資源部門(Energy Storage & Distributed Resources Division)科學家 Anubhav Jain 領導的團隊,他們收集了 330 萬篇已發表的材料科學論文的摘要,並將它們饋入到一個名為

word2vec

的算法中。通過解釋詞間的關係,該算法能夠提前數年給出新熱電材料的預測,在目前未知的材料中找出有應用潛力的候選材料。

這篇名為《Unsupervised Word Embeddings Capture Latent Knowledge from Materials Science Literature》的論文發表在 7 月 3 日的 Nature 上。

論文地址:https://www.nature.com/articles/s41586-019-1335-8

論文一作 Vahe Tshitoyan 是伯克利國家實驗室博士後研究員,現就職於谷歌。此外,同屬伯克利國家實驗室的科學家 Kristin Persson 和 Gerbrand Ceder 也參與了此項研究。

Gerbrand Ceder 表示:「該論文認為,對科學文獻進行文本發掘可以發現隱藏的知識,單純的文本提取可以建立基本科學知識。」

論文一作 Tshitoyan 表示,該項目的動機是人們很難完全弄明白數量過多的已發表研究。所以,他們想到機器學習是否能夠以無監督的方式利用所有集體知識(collective knowledge)。

King - queen + man = ?

該團隊整理了 1922 年至 2018 年間發表在 1000 多個期刊上的 330 萬篇論文摘要(是的,AI 讀論文只看摘要)。Word2vec 從這些摘要中提取了大約 50 萬個不同的單詞,並將每個單詞轉化為 200 維的向量或者包含 200 個數字的數組。

Jain 表示:「重要的不在於數字,而是利用這些數字觀察單詞之間的關係」。例如,你可以利用標準向量數學做向量減法。其他研究者已經證明,如果你要在非科學文本資源上訓練該算法,並從『king 減去 queen』中提取向量,則可以得到與『man 減去 woman』相近的結果。

同樣地,當在材料科學文本中進行訓練時,該算法僅根據摘要中單詞的位置以及它們與其他單詞的共現關係就可以學習科學術語和概念的含義。例如,正如該算法可以解「king-queen + man」方程式一樣,它能夠計算出方程式「ferromagnetic(鐵磁的)—NiFe(鎳鐵)+ IrMn(銥錳)」的答案是「antiferromagnetic」(反鐵磁的)。

左:Word2vec 的元素表徵(投影到二維空間);右:門捷列夫元素周期表。圖源:Berkeley Lab

如上圖所示,當元素周期表中的化學元素投影到二維空間時,Word2vec 甚至可以學習它們之間的關係。

提前數年預測新材料

那麼,如果 Word2vec 那麼聰明,它能預測新的熱電材料嗎?一種好的熱電材料可以高效地將熱能轉換為電能,而且是用安全、充足、易生產的原料製成的。

該算法根據詞向量與單詞「熱電」的相似性對每種化合物進行排序,研究者選取了該算法最為推薦的熱電材料。然後,他們通過計算來驗證算法的預測結果。

他們發現,在算法預測出的前 10 位熱電材料中,所有預測都計算出了略高於已知熱電元件的功率因數(衡量電氣設備效率高低的一個係數,該值越高效益越好);前三位材料的功率因數高於 95% 的已知熱電學元件。

接下來,他們測試了該算法是否適用於「過去」的預測實驗,即只給它 2000 年之前的摘要。結果再次給人驚喜,算法給出的排名靠前的預測結果很多都出現在了後來的研究中,這一數字是隨機選擇結果的四倍。例如,利用 2008 年之前的數據訓練得到的預測結果有 5 個,其中三個已經被發現,而其餘的兩個非常稀有或含有有毒物質。

研究者說:「該研究表明,如果該算法能夠早點應用,一些材料早在幾年前就可以被發現了。」

隨著研究的進行,研究者正在發布由算法預測出的前 50 位熱電材料。他們還將發布研究中用到的詞嵌入,以幫助其他人發現更好的材料。此外,他們還在開發一個更加強大的智能搜尋引擎,幫助研究者利用更加有效的方法搜索摘要。

遭遇機器學習社區嘲諷

人工智慧真的可以自動發現新材料嗎?這篇論文一經發表便在社交網絡上引發了熱烈的討論。目前為止,該帖子已經有 14 萬的瀏覽量。

材料學的同學們首先表示驚訝:AI 代替科研人員,我們都會失業嗎?熟悉機器學習的人們看完論文之後回過神來,則開啟了「嘲諷模式」。

在知乎上,新加坡國立大學博士、騰訊算法工程師「霍華德」表示:看完這篇 paper 後,我的內心久久不能平復,好久沒看到這麼爛的 paper 了!

也有人建議其他領域的學者在使用機器學習方法做自己的研究前要先打好基礎。「到處挖坑蔣玉成」表示:我真心建議文章通訊作者和審稿人都去學學 CS224n…這文章的立意還挺不錯的,但是實際的實現也太水了,完全不配發 Nature。

機器學習社區的人們仔細分析了這篇論文:

該論文中,作者用 t-SNE 將詞向量投影到二維空間,並發現同族元素聚集在了一起。「霍華德」表示,同族元素在上下文當然容易提及,它們只是共現關係而已。此外,作者聲稱可以直接用詞向量預測化合物,並表示預測結果與理論計算的絕對誤差非常小,但理論能算出來東西,用神經網絡做擬合的意義真的很大嗎?

在這裡,作者連神經網絡適用的基本場景都弄不清,對於 Formation Energy 的計算有完善的量子力學理論做支撐,對於這樣能夠精準建模的問題,用傳統的物理學第一性理論來計算更好,更加可靠!

最後,作者用餘弦相似度計算了和 thermoelectric 最接近的單詞,然後在其中的 326 位和 345 位發現了兩種材料 Li2CuSb 和 Cu3Nb2O8,然後宣稱他們的算法能夠預測潛在的新型熱電材料。在讀者看來,這是一種「令人窒息」的操作。因為 thermoelectric 和兩種材料之所以餘弦相似度接近,根本原因是有人在文章裡同時提到過 thermoelectric 和 Li2CuSb、Cu3Nb2O8,這僅僅是共現關係而已。

所以結論來了:所謂能夠預測潛在的新型熱電材料的 AI 算法屬於無稽之談,材料學研究者們的生存並沒有因此受到威脅——因為這篇論文沒有提出任何能讓 AI 看懂論文的算法。

也有研究材料的學者在知乎上表示,為了蹭大數據、機器學習、深度學習的熱度,很多領域的研究都在做相關的工作。「聲嘶力竭」介紹了自己的經歷:剛開始接觸和學習 AI 相關技術,本以為可以利用這個工具做出多麼偉大的工作,但是自己真正做了之後,才感覺「這不就是個高維特徵空間的統計工具嘛,為什麼被吹得這麼玄幻?」

機器學習不能這麼亂用

論文上了《自然》、《科學》雜誌,卻仍然經不起人們的推敲,這種事最近在機器學習社區已經發生了不是一兩次了。

在「人工智慧搞科研」研究之前,是「深度學習預測地震」。去年 8 月,《Nature》上發表了一篇題為《Deep learning of aftershock patterns following large earthquakes》的火爆論文。該論文由哈佛和谷歌的數據科學家聯合撰寫,論文一作所屬單位是哈佛大學地球與行星科學系。

該論文展示了如何利用深度學習技術預測餘震。研究者指出,他們利用神經網絡在預測餘震位置方面的準確率超越了傳統方法。

但很快,這一方法就遭到了深度學習從業者的質疑。一位名叫 Rajiv Shah 的數據科學家表示,論文中使用的建模方法存在一些根本性的問題,因此實驗結果的準確性也有待考究。這名數據科學家本著嚴謹的精神在通過實驗驗證之後聯繫了原作和《Nature》,卻沒得到什麼積極的回覆。

於是,Rajiv Shah 經過半年時間,研究了論文作者公開的代碼,隨後在 medium 上發表文章揭露論文中存在的根本性缺陷以及《Nature》的不作為,後來這件事又在 Reddit 上引起了廣泛的討論。

人們除了批評 Nature 之外,也對深度學習、AI 技術被濫用的情況表示擔憂。隨著機器學習逐漸成為熱門學科,越來越多其他領域的學者開始使用新方法來解決問題,有些獲得了成果,有些則因為實驗和數據的錯誤方式而導致了不嚴謹的結果。

更令人擔憂的是,有時候有缺陷的研究還可以得到人們的認可。

這篇深度學習預測餘震的論文登上了 Nature,還成為了 TensorFlow 2.0 新版本上宣傳文章中提到的案例——然而卻被機器學習社區從業者們詬病。

頂級期刊的事,怎麼能說胡編亂造呢?然而這一次,人工智慧學者們真的有點忍不住了。

參考內容:

https://techxplore.com/news/2019-07-machine-learning-algorithms-uncover-hidden-scientific.html

https://www.nature.com/articles/s41586-019-1335-8

https://www.zhihu.com/question/333317064/answer/738462156

相關焦點

  • 知乎熱議:楊輝團隊公開否認抄襲,網友:避重就輕仍謊稱「首創」
    「採用其它方法」混淆視聽,複製相似實驗結果。 楊輝聲稱付向東教授做報告時用的是小分子抑制劑的方法,但付教授的論文中毫無對小分子抑制劑的展示,根本研究路徑還是shRNA和ASO,也就是楊輝在nature論文中的方法。
  • 知乎網友:「鬼都會上網了!」
    在去年十月份,知乎上被議論得最多的答案,恐怕是一個ID為「帥哥協會會長」的網友的回答了。回答所在的提問2017年10月31日,「帥哥協會會長」在「現代醫學已經發展到了什麼恐怖的水平」下作出了一個回答。原因為何?因為他直接提到自己「腦袋掉了又接上」。
  • 詭異五彩不忍直視
    「五彩霓虹燈!」臺灣彰化一名林姓網友今日行經和美鎮竹社路段時,驚見一隻蝸牛的身體顏色並不尋常,細看後發現裡頭竟有「5種顏色」在眼睛、呼吸孔、觸角以及本體上「無限旋轉」,驚悚又詭異的畫面,讓人雞皮疙瘩掉滿地。
  • 網友翻出一張與《天線寶寶》的合影,畫面太「溫馨」,不忍直視!
    隨著當年喜歡看《天線寶寶》的孩子們都長大了,四位代表著紅紫黃綠的主角:小波、丁丁、拉拉和迪西依然保持著可愛的樣子,不僅是少兒們喜愛的對象,更是成為了許多成年網友惡搞的對象,比如不少成年網友在聊天時,就特別喜歡使用《天線寶寶》的逗趣表情包!
  • 不忍直視!800度高溫的鋁水澆在小米Note上...
    中文科技資訊專業發布平臺 不忍直視800度高溫的鋁水澆在小米Note上...
  • 兩千萬年後的人類,長這個樣子真是不忍直視
    兩千萬年後的人類,長這個樣子真是不忍直視時間:2018-03-15 23:31   來源:今日頭條   責任編輯:毛青青 川北在線核心提示:原標題:兩千萬年後的人類,長這個樣子真是不忍直視 兩千萬年後的人類,長這個樣子?
  • 《學霸去哪兒》歌曲走紅大學 網友:不忍直視
    近日,《爸爸去哪兒》在熱播,網友重新填詞翻唱的《學霸去哪兒》在大學校園裡走紅。詼諧調侃的歌詞,易於傳唱的旋律,使它成為校園熱門話題。   熱歌重新填詞翻唱   通過搜索發現,整首歌非常短小,只有一分鐘,是由一個男生獨唱的。
  • 在知乎,已經沒有「社會化營銷」團隊了
    「在知乎,已經沒有「社會化營銷」團隊了,改為「內容營銷」團隊。」原生廣告,給用戶多一點點真誠去年3月19日,知乎在自己的日報平臺上刊出了廣告合作欄目——「這裡是廣告」,第一篇是《這裡是廣告·我們來聊聊你這輩子用過的那些電腦》,文風隨意毫無違和感,知友們一邊盤點著自己用過的電腦,一邊稱讚知乎發的「良心廣告」,其實背後的廣告主就是英特爾。
  • 知乎最冷知識:當吃貨遇上外星人
    比如「頭被砍掉的一剎那,是頭覺得身體掉了,還是身體覺得頭掉了」、「怎樣尿得遠?有哪些技巧」、「如果地球上的氧氣突然增加一倍,會發生怎樣的變化」。怎麼樣?是不是科普中帶些驚悚、貼近生活又很不正經呢?這些問題,絕對不是個人杜撰,而是來自於一群腦洞大出天際的知乎網友。當然,問題只是「引線」,而爆點卻隱藏在那些一本正經的「解答」中。吃一小勺電子會怎麼樣?
  • 浸泡鱷魚屍體賣神水 現場砍公雞腿畫面血腥不忍直視(圖)
    浸泡鱷魚屍體賣神水現場砍公雞腿畫面血腥不忍直視(圖)  浸泡鱷魚屍體賣神水:為證實這些藥材的真假,攤販好邀請市民現場近距離觸摸撈出的動物屍體,據觀察觸摸的市民講,確實為死去的動物屍體。
  • 意念加AI算法「復原」每個手指,智能義肢登上Nature子刊封面
    機器之心報導參與:張倩、杜偉、李澤南使用「意念」控制機械,讓肢體缺失的殘疾人過上正常人的生活,這聽起來像是出現在電影中的場景。用 AI 算法解碼「意念」在此前,科學家們對於機械臂控制研究很多,但充其量也只能控制單個手指,而且其研究成果也僅限於在四肢健全的人群中實現離線的「義肢控制」。EPFL 提出的新系統,在神經學上的關鍵理念是對來自現有運動神經的信號進行解碼,這些運動神經旨在為手指發出活動的信號。
  • 知乎:源自社區又服務於社區的 AI 技術
    機器之心原創作者:邱陸陸「知乎希望利用 AI 技術打造一個智能社區。」每次知乎的技術負責人公開談及人工智慧技術,「智能社區」都是一個繞不開的詞彙。然而「智能社區」也是一個相對陌生的概念:如今研究者與工程師們明確了深度神經網絡在語音、圖像和自然語言數據上的作用,並將它們進行逐一的細化和延展成了種種「智能應用」。
  • 騰訊AI 王者「絕悟」升級了
    但受到練習時間與精力限制,很少有人能精通所有英雄,但「絕悟」做到了。 那麼,王者再進化,將有多強? 騰訊技術團隊的長期目標不僅是讓「絕悟」學會所有英雄的技能,而且每個英雄都要達到頂尖水平,可以根據陣型排列組合打出制勝局。 但難點就在於,「絕悟」的不同英雄會共享一個模型參數,從零學會單個陣容易如反掌,但面對多英雄組合時就難如登天。對戰中,因為地圖龐大且信息不完備,不同的 10 個英雄組合有不同的策略規劃、技能應用、路徑探索及團隊協作方式,這將使決策難度幾何級增加。
  • 不忍直視!美女拍了朵雲走紅:形狀不可描述...
    不忍直視!美女拍了朵雲走紅:形狀不可描述...有不明真相的網友表示:這是上帝有反應了嗎?據氣象專家介紹,這其實是一種塔狀積雨雲,預示著風暴的到來,不算特別稀罕的現象。
  • 沒毛的大猩猩,就像沒穿衣服的人,女遊客:不忍直視!
    沒毛的大猩猩,就像沒穿衣服的人,女遊客:不忍直視!來源:動物大觀察 原標題:沒毛的大猩猩,就像沒穿衣服的人,女遊客:不忍直視
  • 中文字「丼」怎麼念?網友:這麼多年都錯了
    中文字博大精深,一個字卻有不同的讀音,近日一名網友在臉書中表示,自己要去買「牛丼」當晚餐來吃,卻因為把這字「丼」唸成「ㄉㄢˇ」,遭店員糾正,一旁高中生還竊笑他,讓他直言真的快被國文搞瘋了,不少網友也紛紛在貼文底下留言,引發熱議。
  • 看法國知乎上的網友最喜歡的法語單詞是什麼?
    上法國版「知乎」—— Quora.fr去看看法國人最喜歡的法語詞是哪些?違反憲法地 這是法語單詞裡最長的詞,一個網友以前被老師讓我們罰抄寫這個詞。其實這個單詞其實很簡單,拆開來秒秒鐘就記住了,就25個字母,5部分。
  • 網友大呼不忍直視(圖)
    近日,NASA中文貼出了一張地球的素顏照,照片中,地球長滿了「青春痘」,樣子有點怪異,不少網友驚呼太醜,簡直「不忍直視」。  地球「素顏照」遭吐槽  昨天,記者在網上看到,微博網友@NASA中文發出的這張被稱為地球「素顏照」的圖片,被網友四處轉發。
  • 大白鯊捕食海豹兇殘瞬間 畫面不忍直視
    只見大白鯊一躍而起,一口咬住逃生的海豹,拼命撕扯,最後可憐的海豹屍骨無存,讓人不忍直視。
  • 騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁
    但受到練習時間與精力限制,很少有人能精通所有英雄,但「絕悟」做到了。那麼,王者再進化,將有多強?據了解,「絕悟」一年內掌握的英雄數從 1 增加到 100+,王者榮耀英雄池也實現了完全解禁,不但掌握了所有英雄的全部技能,能應對高達 10 的 15 次方的英雄組合數變化,甚至還「自帶軍師」,可做出最佳的英雄博弈策略選擇,綜合自身技能與對手情況等多重因素,派出最優英雄組合。