機器之心報導
參與:杜偉、小舟
或許 Jürgen Schmidhuber 無休止的論戰可以告一段落了!
自 2018 年圖靈獎授予 Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun 三位深度學習先驅之後,LSTM 之父 Jürgen Schmidhuber 就此在社交網絡上展開了一波又一波的論戰,極力肯定和推廣長短期記憶網絡(LSTM)在人工神經網絡和深度學習領域的巨大作用。
如今,LSTM 終於獲得了學界的認可。
近日,奧地利人工智慧高級研究所(IARAI)宣布其創始人、LSTM 提出者和奠基者 Sepp Hochreiter 教授獲得了 IEEE CIS 2021 年神經網絡先驅獎(Neural Networks Pioneer Award),以表彰他對長短期記憶網絡(LSTM)的發展做出的卓越貢獻。
曾獲 2016 年神經網絡先驅獎的 Jürgen Schmidhuber 也表達了對 Sepp Hochreiter 教授的祝賀。
該獎項開始於 1991 年,由 IEEE 計算智能協會(CIS)每年頒發一次,主要授予那些對神經網絡領域的早期概念和持續性發展做出突出貢獻的學者。具體而言,該獎項主要表彰以下兩種類型的開創性貢獻:(1)根本性理解和(2)工程應用。
該獎項被公認為神經網絡領域的最高榮譽。
獲獎者可以是個人,也可以是不超過 3 人的團體,獲獎者通過發明新技術、取得創新性技術發展、實現新產品或者管理創新性產品設計或生產流程,進而對神經網絡的理論、技術和應用發展做出貢獻。
在歷屆 IEEE 神經網絡先驅獎獲得者中,我們可以看到很多熟悉的大佬,例如 2018 年圖靈獎得主、深度學習三巨頭 Yoshua Bengio(2019)、Yann LeCun(2014)和 Geoffrey Hinton(1998)。
此外,獲獎者中也不乏華人。2014 年,時任香港中文大學教授的 Jun Wang 與 Yann LeCun 共同獲得了當年的神經網絡先驅獎,以表彰其在神經動力優化方面做出的突出成就。
圖源:https://www.erg.cuhk.edu.hk/erg/node/81
接下來,我們具體來看本年度 IEEE 神經網絡先驅獎獲得者 Seep Hochreiter 在神經網絡領域都做了哪些突出貢獻。
Sepp Hochreiter 個人簡介
1967 年,Sepp Hochreiter 出生於德國米爾多夫,是一位計算機科學家。從 2006 年到 2018 年,他領導了生物信息研究所。2018 年以來,他又領導了約翰 · 克卜勒林茨大學(JKU)的機器學習研究所。2017 年,他成為林茨理工學院(LIT)AI 實驗室的負責人,該實驗室致力於推進人工智慧的研究。
Sepp Hochreiter 在機器學習、深度學習和生物信息學領域都做出了巨大的貢獻。Sepp Hochreiter 在 1997 年與 Jürgen Schmidhuber 聯合發表了長短期注意(LSTM)的論文,被認為是機器學習發展史上的一座裡程碑。深度學習的基礎就是基於 Sepp Hochreiter 對梯度消失和梯度爆炸的分析構建的。
在谷歌學術上,Seep Hochreiter 的 LSTM 論文被引量已經近 35000。
LSTM 是一種特殊的循環神經網絡(RNN),Sepp Hochreiter 在 1991 年分析了隨時間反向傳播(BPTT)帶來的梯度爆炸和梯度消失問題。1997 年,Sepp Hochreiter 與 Jürgen Schmidhuber 在 LSTM 論文中引入 CEC 單元解決 BPTT 帶來的梯度爆炸和消失問題。之後又有許多研究者對其進行了改進和普及。
LSTM 單元基本結構,圖源:https://en.wikipedia.org/wiki/Long_short-term_memory
此外,Sepp Hochreiter 提出了平滑的極小值(flat minima)作為學習人工神經網絡的首選解決方案,以確保有較低的泛化誤差。他還為神經網絡提出了新的激活函數以改進學習,比如指數線性單元(ELU)。Sepp Hochreiter 在強化學習和支持向量機(SVM)方面也做出了貢獻。
參考連結:
https://www.iarai.ac.at/news/sepp-hochreiter-receives-ieee-cis-neural-networks-pioneer-award-2021/
https://cis.ieee.org/getting-involved/awards/past-recipients#NeuralNetworksPioneerAward