【導讀】1月22日,統計學家Venkat Raman發布了一篇比較有意思的博文,作者探討了到2118年,即未來一百年中機器學習中一些算法可能的興衰存亡。具體分析了「回歸」算法和「神經網絡」兩種算法未來的走勢。作者引經據典,主要藉助林迪效應(Lindy effect)分析算法的生命周期。本文的有趣之處不在於它給出我們一個確切的結論,而是作者能為自己的分析提供佐證。
作者homepage:https://medium.com/
Which Machine Learning Algo will continue to be in use in year 2118?
你認為哪個機器學習算法會在2118年繼續使用?
你的腦海會浮現什麼答案呢? 隨機森林(Random forest),SVM,K-means,KNN甚至深度學習的其他變種?
一些人可能會笑了,問:「你到底能如何預測的,預測未來100年的事情是很瘋狂的事?」
▌究竟是什麼讓你認為「回歸」將在2118年繼續使用呢?
答案是林迪效應(Lindy effect)。我是受林迪效應的啟發進行預測的。
那麼,下一個問題,什麼是林迪效應?
▌林迪效應
維基百科定義了林迪效應:
使用時間越久,越不容易消失。比如一樣東西,人們已經使用了十年,可能還會繼續使用十年;已經使用了一百年,還會繼續使用一百年。
林迪效應是一個概念、一些技術或想法等,提出一個很難消失事物的未來預期壽命與他們現在的年齡成正比,所以每一個額外的生存期都意味著其有著更長的剩餘壽命。
我最喜愛的作家之一Nassim Taleb在他著名的書Antifragile寫道:從無序的事物定義了林迪效應,例子如下:
如果一本書已經印刷了四十年,我可以期待它繼續出版另一個四十年,如果它還能存活十年,那麼預計它還會存在五十年的時間。 這就是說,一般來說,長期存在的東西不像人一樣「老化」,而是繼續生存下去。 如果每年沒有消失,額外的預期壽命增加一倍。 這是一個非常魯棒的指標。 一件物品的未來存在的時間與其壽命成正比!
我極力推薦讀一下他的關於林迪效應的文章『An Expert called Lindy』。
https://medium.com/incerto/an-expert-called-lindy-fdb30f146eaf
▌那麼為什麼「回歸」會存活那麼久
是因為它已經存活了這麼久。回歸(最小二乘法)這個概念最初是由Carl Friedrich Gauss和Adrien-Marie Legendre在1800年提出的。 他們用它來確定太陽周圍的行星和其他物體的軌道。
「回歸」這個詞是弗朗西斯·高爾頓(Francis Galton)所創造的,用來形容這樣一種現象:高個子的父親較大概率擁有相對較矮的兒子,而較矮的父親較大概率擁有相對較高的兒子。
很明顯回歸已經存在有200多年了! 所以根據林迪效應,回歸將會持續存在200年。 所以保守估計,回歸在2118年會繼續使用。
▌回歸長壽背後的秘密是什麼?
舉例來說,2016年Kdnuggets調查報告如下
事實上,在2011年的Kdnuggets進行的另一項調查中,回歸結果排名第二,離第一很接近。 所以根據林迪效應,它已經成為5年來的榜首!
回歸仍然是廣泛使用的機器學習算法。 人們正在使用回歸或繼續使用回歸,因為
▌「它有效」的方面
很多不同領域的人們都在使用回歸,因為它在它們工作中起到重要作用。 通過使用回歸,人們可以計算投資回報。 例如,在市場營銷中,市場混合模型(Market Mix Modeling)背後的動力是回歸。 它仍然是一種流行的技術,許多快速消費品公司都相信MMM的結果。 其他領域也一樣。
▌那麼神經網絡及其變體它們會在2118年使用嗎?
到目前為止,從林迪效應來看,神經網絡(AI)結果並不是很好。 它已經經歷過AI寒冬。 神經網絡及其變體的壽命在20世紀受到「AI寒冬」的阻礙。 這樣的中斷對於技術或者算法的長久性來說不是一個好兆頭。
但是,在過去的十年裡,AI相關的進步使得其應用前景不斷壯大。 而我作為一名永遠的學生,將繼續熱衷於最新的AI突破。 所以一個安全的賭注可能是我們可以看到神經網絡及其變種再生存10 - 20年,希望Elon Musk表達的「奇異(Singularity)」不會導致另一個AI冬天。
▌是什麼阻礙機器學習算法突破林迪效應?
你真的需要用機器學習?殺雞焉用牛刀:機器學習算法的錯誤應用和過度使用,將阻礙機器學習突破林迪效應。 我遇到過很多人們不必要的使用機器學習算法的情況,因為有時候簡單的基礎方法就能起作用,為了趕時髦卻非要用機器學習方法。 Rama Ramkrishnan先生在他的文章中很好地說明了這一點。
https://towardsdatascience.com/first-create-a-common-sense-baseline-e66dbf8a8a47
此外,數據科學相關工作的爆發式流行也是另外一個隱患。 目前機器學習算法已經變成數據科學家手中的一個萬金油,不論什麼任務都被拿來使用(機器學習像數據科學家手中的錘子, 一切都看起來像一個釘子)。 錯誤或過度地應用機器學習算法,都會導致人們在機器學習不靈在有些任務不靈的時候,因自己心中過高的期望而產生心理落差,這時候人們自己將導致「AI的冬天」。但目前為止「回歸」可能笑道最後,甚至一直到2118年。
如果你喜歡我的文章,可以在文章下面進行評論。
你可以聯繫我
http://www.linkedin.com/in/venkat-raman-Analytics
https://twitter.com/venksaiyan
https://analyticsloka.blog/blog/
原文連結:
https://towardsdatascience.com/which-machine-learning-algo-will-continue-to-be-in-use-in-year-2118-59d0461160f3
人工智慧領域主題知識資料查看獲取:【專知薈萃】人工智慧領域26個主題知識資料全集(入門/進階/論文/綜述/視頻/專家等)
請PC登錄www.zhuanzhi.ai或者點擊閱讀原文,註冊登錄專知,獲取更多AI知識資料!
請掃一掃如下二維碼關注我們的公眾號,獲取人工智慧的專業知識!
請加專知小助手微信(Rancho_Fang),加入專知主題人工智慧群交流!
點擊「閱讀原文」,使用專知