機器學習是鍊金術?

2021-01-21 酷玩實驗室



本文轉載自公眾號:量子位

id:QbitAI

誰能想到,NIPS這種頂會都能風波乍起。

Ali Rahimi(阿里·拉希米),因為2007年發表的一篇論文,獲得今年的「Test of Time」最具時間價值大獎。當然,阿里作為最佳論文作者理所應當的登臺演講。

起初,這個演講主要介紹之前的研究成果。阿里說從很多方面來講,我們的狀況都比10年前好多了。在技術上,取得了很大的進步,街上跑著自動駕駛汽車,人工智慧可以幹很多事情……基於機器學習技術,能產生出幾十億美元的公司。

後來,火藥味逐漸濃烈起來,阿里朝著整個深度學習界開了一槍,他說:

但某些方面更糟糕了。

空氣中飄蕩著一種自鳴得意的感覺,我們會說「人工智慧是新的電力」。(安德魯老師最愛的說法)

我想換個比方:機器學習已經成了鍊金術。

鍊金術挺好的,鍊金術沒毛病,它自有它的地位,鍊金術「管用」。


鍊金術帶來了冶金、紡織、現代玻璃製造工藝、醫療等等領域的發明。但同時,鍊金術還相信水蛭能治病,廉價金屬能變成金子。

從當年的鍊金術到現在的物理、化學,到我們現在對宇宙的認識,科學家們要消解掉2000年的鍊金術理論。

如果你要做個照片分享系統,用「鍊金術」就行。但我們現在所做的遠遠超出了這個範圍,我們所做的系統用在醫療領域,用在社交媒體上,甚至能影響大選。

我希望我所生活的世界裡,這些系統都建立在嚴格、周密、可驗證的知識之上,而不是基於「鍊金術」。

我有點懷念十年前NIPS上質疑各種想法夠不夠嚴謹的「學術警察」,希望他們回來。

(不關心技術細節的可以跳過下面的例子)

舉個例子,不知道你有沒有經歷過這樣的情況:從零開始搭建、訓練了一個神經網絡,然後發現它不管用的時候,總覺得是自己的錯。這種狀況我大約每三個月就要經歷一次,我想說,這不是你的錯,是梯度下降的錯。

比如說這個最簡單的深度神經網絡,兩層線性網絡:

左邊是我的模型,右邊是損失函數,底下是不同參數設置下梯度下降的過程。有時候loss一開始下降得很快,後來就不動了。你可能會覺得遇到了局部最小值,或者鞍點,loss和0相差還很遠。

換一個下降的方向,很快就能優化到最低。

你可能會覺得這個例子不自然,或者說梯度下降在更大的神經網絡上表現得不錯,我的回答是:第一,很多人都被梯度下降坑過;第二,我們把自己的工具用在簡單的例子上,從中學習知識,然後應用到更複雜的場景,這正符合我們建立知識的方式。

梯度下降帶來的痛苦是真實存在的。

上個月,我的朋友Boris給我發了封郵件:

周五,另一個組有人改動了TensorFlow內部的默認捨入模式,從「舍到0」改成了「四捨五入到偶數」。

我們的訓練就崩潰了,誤差從<25%飆升到了~99.97%。

這樣的郵件我收到過不少,網上也有人在討論類似的問題。

會發生這種情況,是因為我們把脆弱的優化技巧用到了我們不理解的loss上, 我們的解決方案在本來就已經很神秘的技術上增加了更多神秘性。

Batchnorm是加速梯度下降的一種方法,把Batchnorm插入到深度神經網絡的層中,梯度下降的速度就會更快。

我不排斥使用一些自己不懂的技術,比如說我是坐飛機來的,並不完全清楚它的工作原理,但知道有整個航空界都在研究這項技術就很安心了。

而對於Batchnorm的工作原理,我們只知道它的功能是「reducing internal covariate shift」。

可是為什麼這樣就能加速梯度下降了?有沒有相關的理論或者實驗?你甚至都不清楚internal covariate shift是什麼,就不想要一個定義嗎?

Batchnorm已經成了構建深度神經網絡的一個基礎工具,但我們對它幾乎一無所知。

想想過去一年裡你為了刷競賽榜單而做的實驗、嘗試的新技術;再想想過去一年裡你為了解釋奇怪現象、尋找其根源而做的努力。前者,我們做得很多,後者,我們應該再多做一些。簡單的實驗和理論是幫我們理解複雜系統的基礎。

我們還有一件事可以做。現在,所有商用硬體上運行的成熟計算引擎都是梯度下降的變體,處理著數百億的變量。

想像一下,如果我們有能在標準商用硬體上運行,處理數百億變量線性解算器或者矩陣分解引擎,想像一下這樣我們能做出多好的優化算法,用多好的模型來做實驗,當然,這在數學上和系統上都很難,但這正是我們要解決的問題。

我對這個圈子有真摯的愛,這也是為什麼我會站在這兒,號召大家更嚴格精確,別那麼像鍊金術師。

希望我們可以共同努力,將機器學習從「鍊金術」變成「電力」。

完整演講,參見下面這段視頻:


LeCun:實名反對

一石激起千層浪,阿里的演講引發了熱烈的討論。

深度學習專家、前谷歌大腦成員Denny Britz說:「對很多人來說,這是NIPS的高光時刻。深度學習就像鍊金術,我們不知道發生了什麼。我們需要在這個領域更加嚴謹。如果你知道背後沒有可靠的科學理論,你會坐上飛機麼?」

當然也有人立刻拋出不同意見。比如號稱「三巨頭」之一的Yann LeCun。他在Facebook上發表了一篇「長篇大論」進行了闡釋。

原文概要如下:

阿里發表了一個有趣的演講,但我壓根不同意他說的話。他的核心思想是說:機器學習(ML)現在的實踐,類似於「鍊金術」(他的原話)。

這是種侮辱,是的。但是不要擔心:他是錯的。

阿里抱怨目前ML使用的許多方法,缺乏(理論上)的理解,尤其是在深度學習領域。理解是好事,這也是NIPS群體中很多人追求的目標。

但另一個更重要的目標是發明新的方法、新的技術,以及新的技巧(tricks)。

翻看科學技術發展的歷史,工程實踐總是先於理論理解出現:透鏡和望遠鏡先於光學理論,蒸汽機先於熱動力學,飛機先於空氣動力學,無線電和數據通信先於信息理論,計算機先於計算機科學。

因此只是因為目前理論工具還沒趕上實踐,就批評整個ML群體(還是個相當成功的群體)在搞「鍊金術」,這是一個非常危險的行為。

為什麼說危險?因為正是這種態度,曾讓ML群體拋棄神經網絡超過10年,儘管有充分的證據表明他們在很多情況下效果很好。具有非凸損失函數的神經網絡不能保證收斂。所以人們連嬰兒帶洗澡水一起潑掉了。

只是因為可以進行理論研究就固守一套方法,而且還忽視另一套從經驗上來說更好的方法,僅僅是因為還沒有從理論上理解它?

是的,我們需要更好的理解我們所用的方法。但是,正確的態度應該是嘗試去解決問題,而不是因為還沒解決就跑去羞辱整個群體。

致阿里:你每天也在用這些方法,如果你對如何理解他們不滿意,請動手研究深度學習的理論,而不是抱怨其他人沒做,更不是建議NIPS世界只用「理論正確」的方法。這是錯的。

阿里隨後跟帖回覆:

Yann,感謝你深思熟慮的反饋。你最後的讓我進行理論研究的建議,正是Moritz Hardt一年前曾對我說的話。只是一小群人很難取得進步,老實說,我被這個任務的規模壓得喘不過氣來。這次的演講也是尋求更多人的幫助。

我呼籲簡單的實驗和簡單的定力,以便我們都可以毫無困惑的傳達見解。你可能已經非常擅長建立深度模型,在這方面你的經驗可能比幾乎任何人都多。但是想像一下新手會有怎樣的困惑,一切看起來都像魔術。大家談論的都是整個模型如何工作,而不是每一個小部分在幹什麼。

我認同鍊金術的方法很重要。這讓我們加速向前,解決了眼前的問題。我對那些能迅速建立起直覺以及可工作系統的人懷有最深的敬意。你和我在Google的許多同事都有這樣令人印象深刻的技能,但你們只是少數。

我呼籲你們不但授人以魚,而且還授人以漁,讓大家都能達到你的生產力水平。我所期望的「嚴謹」是:簡單的實驗,簡單的定理。

LeCun再回覆:

簡單和通用理論很好。

熱力學的原則,讓我們免於浪費時間去尋找永動機。在ML領域我們已經有這樣的理論,適用於所有的學習機器,包括神經網絡。

但是很有可能不會有專注於神經網絡的「簡單」定理,原因類似於我們沒有納維-斯託克斯方程或者三體問題的解析解。

背景交代

Ali Rahimi,去年5月加入Google,目前擔任Member of Technical Staff(這個職位類似於主任工程師)。2005-2011年期間,他供職於英特爾擔任研究員。

這次被NIPS 2017評為最佳時間檢驗獎的論文《Random Features for Large-Scale Kernel Machines》,就是他在英特爾期間發表的。

1997年,阿里在UC Berkeley獲得學士學位,隨後在MIT獲得碩士和博士學位。

如果你對他感興趣,可以看看他的個人主頁。在欣賞了他的女友、兄弟和女朋友們的照片後,我感覺這也是一個「逗逼型」科學家。

主頁地址:https://keysduplicated.com/~ali/Personal.html

鍊金術又是啥?

根據維基和百度百科,鍊金術(Alchemy)的目標,是想把「賤金屬」煉製成「貴金屬」,比方把鉛變成黃金。(當然還有煉丹,想造出長生不老藥)。包括牛頓也曾研究過這門技術。不過現代化學證明,這種方法是行不通的。

OMT

以上,就是這次NIPS大會上關於真理標準的大討論。


酷玩實驗室經授權轉載

如需轉載,請聯繫原作者。

分享給朋友或朋友圈請隨意


相關焦點

  • 為什麼科學家牛頓痴迷於鍊金術?答案原來是這樣——解密鍊金術
    然後說幹就幹,這場財富夢成為了鍊金術的原生動力啦。也就是重明鳥今天給大家分享的內容——神秘的鍊金術的發跡史。不過據說後來鍊金術已經不煉黃金啦,而是煉一些其他不可描述的東西,咳咳……鍊金術源遠流長的歷史。
  • 艾薩克·牛頓與鍊金術
    由於今天是牛頓逝世周年紀念日,它似乎更仔細地看看牛頓對鍊金術的迷戀通過鏡頭的瑞星最新獲得的牛頓。為什麼牛頓要尋找點金石?牛頓寫了大約100萬字關於鍊金術。根據福爾克爾的說法,「許多人不知道牛頓的鍊金術,但它是非常重要的,因為它佔據了他的大部分智力注意力。」
  • 為什麼科學家痴迷於鍊金術,原因原來是這樣——解密神秘的鍊金術
    然後說幹就幹,這場財富夢成為了鍊金術的原生動力啦。也就是重明鳥今天給大家分享的內容——神秘的鍊金術的發跡史。甚至,這種化腐朽為神奇的能力還為工匠獲得了神的地位,在這種情況下,鍊金術誕生了。在這種背景下,人們對鍊金術的可能性產生了懷疑,而17世紀英國化學家波義耳建立了嚴格的近現代元素理論,為鍊金術的沒落敲響了喪鐘。
  • EM算法是鍊金術嗎?
    報導見:NIPS機器學習鍊金術之爭看到上面兩篇,使我想到:EM算法是鍊金術嗎?我近兩年碰巧在研究用以改進EM算法的新算法:http://survivor99.com/lcg/CM/Recent.html,對EM算法存在的問題比較清楚。
  • 備受委屈的鍊金術
    他在今年(2011年)於華盛頓召開的美國科學發展協會會議上指出,現代人將「鍊金術士」等同於「江湖騙子」的原因之一。儘管如此,普林西比博士的工作也提醒了現代科學家們,即便是至高無上的理論也應當時常加以懷疑。這是因為所有的鍊金術士都發現,在結果中發現你想得到的遠比發現真正的現象容易。
  • 《魔獸世界懷舊服》高級鍊金術在哪學 高級鍊金術學習攻略
    導 讀 魔獸世界懷舊服高級鍊金術在哪學?
  • 魔獸世界懷舊服鍊金術配方一覽 魔獸世界懷舊服鍊金術配方位置坐標
    魔獸世界懷舊服鍊金術配方是什麼?鍊金術配方在哪?想必有不少的小夥伴們都想知道吧,下面是魔獸世界懷舊服鍊金術配方出處匯總,感興趣的小夥伴們一起來看看吧。   魔獸世界懷舊服鍊金術配方在哪?需要完成任務才能看見他)  多重抗性藥水(300):黑石塔上層的蓋斯出這個配方  精煉智慧藥水(300):斯坦索姆的巴納扎爾出這個配方  超級能量藥水(300):通靈學院萊斯•霜語出這個配方  泰坦藥水(300):黑石塔上層達基薩斯將軍出這個配方  極效活力藥水(300):目前只有熔火之心出這個配方  關於魔獸世界懷舊服鍊金術配方出處就簡單的介紹到這了
  • 觀點| NIPS 2017經典論文獎獲得者機器學習「鍊金術」說引熱議,Le...
    機器之心報導 參與: 路雪、劉曉坤、李澤南 去年的 NIPS 曾因 GAN 引發了一場風波 ,而今年的 NIPS 同樣有著不同思想的碰撞,而這場機器學習「鍊金術」討論竟是從大會頒獎典禮上開始的。谷歌研究員,MIT 博士 Ali Rahimi 獲得了今年 NIPS Test of Time 大獎,他在頒獎時上做了一番演講,主要介紹之前的研究成果,他在演講中還打了個比方「機器學習是鍊金術」,但這一言論遭到了 Yann LeCun 的反駁。在這篇文章中我們將看到不同思想的碰撞。
  • 長城證券推出 「長城鍊金術」APP
    【深圳商報/讀創訊】(見習記者 尤藝樵)5月9日,長城證券在深圳發布了新一代交易客戶端產品——「長城鍊金術」APP。「長城鍊金術」是長城證券金融科技的首個重磅產品,旨在為長城證券用戶打造一個集開放社交與智能服務於一體的一站式金融終端。
  • 牛頓晚年到底因為什麼原因沉迷於鍊金術?
    牛頓在一生中為科學貢獻許多,但是就是這樣因為著名的物理學家卻不知道因為什麼原因導致晚年沉迷於鍊金術和神學這些虛無縹緲的東西。牛頓一生中最重要的應該就是在1665到1667年這三年之中,當時牛頓所居住的倫敦因為瘟疫瀰漫的原因,導致了牛頓無奈之下只好回到自己的家鄉,就是在家鄉的這三年裡面,牛頓寫出來一生中最重要的科學理論。直到後來擔任劍橋大學的終生教授後,牛頓才慢了下來。
  • 鍊金術:名畫裡的化學史
    近代化學就是從古代鍊金術中脫胎而來的。本文作者林鳳生的解讀,重現了各個時代的畫家們用自己敏銳的觀察記錄下的化學科學史上彌足珍貴的場景和瞬間。此外,古希臘的先哲思想也對鍊金術的產生起到推波助瀾的作用。亞里斯多德認為:自然界裡一切物體包括金屬在內都是活的有機體,在它們內在靈氣的帶動下,都有生長的趨勢。賤金屬有向貴金屬轉化的渴望,不過這種轉化很慢,人類可以加速這個過程。阿拉伯的鍊金術士賈比爾·伊本·哈揚,被奉為鍊金術裡的祖師。
  • 牛頓為何晚年沉迷於鍊金術?其實原因很簡單!
    牛頓為何晚年沉迷於鍊金術?其實原因很簡單!艾薩克·牛頓是英國偉大的物理學家、數學家和天文學家,提出過萬有引力定律、力學三大定律、白光由各色光組成的理論,並開創了微積分學,等等。對於牛頓的大名,中小學生們都耳熟能詳。在《100位傑出人物》一書中,艾薩克·牛頓被列為最具影響力人物之第二,排在穆罕默德之後,耶穌基督之前。
  • 魔獸世界懷舊服鍊金術配方位置匯總
    魔獸世界懷舊服鍊金術配方在哪?魔獸世界懷舊服不同鍊金術配方在不同的位置可以獲取。想必有不少的小夥伴們都想知道吧,下面是魔獸世界懷舊服鍊金術配方出處匯總,感興趣的小夥伴們一起來看看吧。
  • 牛頓為何沉迷於「鍊金術」三十年?到底給他帶來了什麼成果?
    二十世紀,牛頓生前手稿被拍賣、研究,牛頓形象的另一面漸漸被挖掘出來,通過手稿中那些負面故事,讓世人知道了,原來牛頓痴迷於鍊金術,這令學界大為震驚,因為牛頓代表著理性與現實,而鍊金術則被認為是江湖勾當。近代科學的奠基人物為何痴迷於鍊金術?這個疑問英國作家麥可.懷特也有,為了得到一個合理說明牛頓行為的解釋,他在反覆研究現有資料後,在《最後的鍊金術:牛頓傳》給出這樣一個說法:鍊金術起源於古希臘時代,過程是為了尋找一種石頭——哲人石,它具有神奇的功能,能夠將石頭點綴成黃金。
  • 《怪物獵人世界冰原》帝王金鍊金術怎麼玩 帝王金鍊金術玩法攻略
    帝王金鍊金術,玩家需要先把活動任務中的大師絢輝龍任務完成之後才能開放,不完成的話鍊金婆婆這裡覺醒的鍊金術還是只有冥赤龍的鍊金術一個 在開啟之後,玩家可以使用上位和M位的絢輝龍素材進行鍊金,每100pt會出一個帶有灼熱的武器,這個鑑定出的帝王金武器的概率要比金色的鍊金術要高,也就是說這個只貴100pt就能更高概率獲得帝王金武器,這個收益更高。 需要消耗鍊金點數和1個太古龍骨。注意:一次鍊金3個帶有灼熱的武器會消耗1個太古龍骨,一次鍊金1個帶有灼熱的武器也會消耗1個太古龍骨。
  • 《天國:拯救》鍊金術全配方+簡單操作步驟
    是不是有很家都不清楚呢,別急,現在就由小編為大家帶來貼吧玩家「華冥有音」分享的天國拯救鍊金術配方及簡單操作步驟,不清楚的小夥伴趕緊來看看吧! 鍊金術配方+簡單操作步... 天國拯救鍊金配方是什麼?怎麼鍊金?
  • 牛頓曾痴迷於鍊金術?——鍊金術與現代科學
    另一位鍊金術士,帕拉塞爾蘇斯,同時也是中世紀歐洲著名醫生,他敢於挑戰當時的傳統,賦予了鍊金術另一個具有決定性的意義他認為,鍊金術的目的並不在於發現製造金子的方法,而在於用它配製出治療疾病的藥。他提出硫、汞、鹽三元質的說法,認為人的疾病系由這三元質比例失調所致。他利用其豐富的用藥知識,主張努力尋找各種疾病的有針對性的藥物,反對濫用複方,強調自然的治療能力,反對有害的治療方法。他別致的醫學思想對當時和後世都有著重要的影響。
  • 《怪物獵人:世界》冰原覺醒的鍊金術攻略 使用方法分享
    《怪物獵人:世界》冰原覺醒的鍊金術使用方法 在覺醒的鍊金術中,玩家可以消耗調查點數來將一些冥赤龍的素材來鍊金成蘊藏龍力的凝塊耗時差不多要35分鐘左右,而這個覺醒的鍊金術只要把素材給鍊金了,一次就能拿3把武器,效率要高多了。 玩家只需要把素材達成指定的pt數就能直接隨機獲得3把冥赤龍的武器。值得一提的是,一個地脈源結晶體,也就是龍玉,正好可以換300pt也就是3把武器。反正做完一套赤龍後,再打出來的素材也都是溢出的,不如全去鍊金了換武器。
  • 魔獸世界懷舊服鍊金術配方是什麼 鍊金術配方大全
    懷舊服鍊金術配方方位一覽  冰霜之油(200):布洛金,奧特蘭克山脈46,49  地精火箭燃油(210):由工程師製造出捲軸  抗魔藥水(210):打怪爆  次級石盾藥水(215):作任務「[37]盧希恩的藥水」能夠得到配方  點金石(225,275):鍊金師匹斯特蘇格,加基森
  • 歐洲中世紀時期的鍊金術是不是巫術?它也是現代科學的搖籃
    歐洲古代化學歐洲中世紀,即從公元5世紀西羅馬帝國滅亡到公元15文藝復興這段時期。可是,雖然封建教皇已經落幕了,但是有些東西的還是從教皇繼承到了各國皇帝身上,鍊金術就是其中之一。甚至可以說,很多科學成就的初衷都是為了「鍊金」,為了煉就長生不老藥之類的魔法石。首先,介紹一下歐洲鍊金史。其實要是刨根問底地去深究,歐洲的鍊金術應該起源於阿拉伯國家。歐洲的鍊金傳統來自於一個歷史上最神秘的組織,叫做「紅玫瑰十字會」。