萬眾期待:Hinton團隊開源CapsNet源碼

2021-01-18 專知

【導讀】前幾天,Hinton團隊的膠囊網絡論文第一作者Sara Sabour將其源碼在GitHub上開源,其實,該論文「Dynamic Routing Between Capsules」早在去年10月份就已經發表,直到今日,其官方實現終於開源。此前,Hinton一再強調,當前的反向傳播和CNN網絡存在很大的局限性,表明AI的下一代研究方向是「無監督學習」。因此,CapsNet應運而生,雖然傳統神經網絡很大程度上是在Hinton的理論基礎上創建的,但Hinton卻絲毫沒有手下留情,聲稱要把反向傳播等深度學習方法推倒重來。



近日,深度學習之父Geoffrey Hinton的膠囊網絡論文「Dynamic Routing Between Capsules」的源碼在GitHub上公布,目前,其Star數達到486,Fork數達到14407。早在去年10月份,該論文就已經發表,但其源碼一直未公布,此前也有人根據其論文實現過其他版本,直到前幾天,該論文第一作者Sara Sabour終於將其在GitHub上開源,可謂萬眾期待!


GitHub:


https://github.com/Sarasra/models/tree/master/research/capsules



膠囊網絡的paper及連結:


Dynamic Routing Between Capsules. Sara Sabour, Nicholas Frosst, Geoffrey E Hinton

https://arxiv.org/abs/1710.09829



膠囊網絡(Capsule Networks, CapsNet)


膠囊網絡是Hinton等人在論文「Dynamic Routing Between Capsules」中提出的網絡結構,它提出了理論上能更好地替代卷積神經網絡的方案,是當前計算機視覺領域的最新技術。


首先來看一下傳統神經網絡的神經元。在物質世界中,這是一組細胞,以信號作為輸入,並發出一些信號作為輸出,只要它足夠興奮。雖然這是一個簡單直白的解釋,但這最終是對「神經網絡」機器學習概念的充分體現。在這裡,神經元是一個數學單位,它接受一個輸入,並使用一系列函數給出輸入的輸出。我們學習權重來確定在訓練階段哪個特定的輸入可能比使用反向傳播的輸入更重要。我們可以堆疊這些神經元,使得一層神經元的輸出成為另一層神經元的輸入。所有類型的神經元都取自從這個基本概念,包括遞歸神經網絡和卷積神經網絡。

 

膠囊的概念:像基本的神經元一樣,它們也代表了一個認知思想的符號數位化。大腦的高層做了更多的演繹、理解和高層次特徵的計算,大腦的特定部分在他們處理的領域或主題上有明確的含義。我們並不是將所有維度的數據都放在整個大腦中,而是「餵食(feed in)」較低級別的特徵,以供大腦的高層部分處理,從而將認知負荷從較高級別的處理中移除。如果較低級別的功能與大腦某些較高級別的部分不相關,則不應將其發送到那裡。它的信號至少應該有所減弱。

 

如果膠囊被用於處理姿勢識別問題中。當訓練一個模型對人的姿勢進行識別時,往往會因為方向而存在問題:當人轉個方向可能會在識別的時候遇到問題。為了解決這一問題,膠囊試圖通過讓「符號數學大腦(symbolic mathematical brain)」(即網絡)的更高級別部分來處理複雜特徵的識別和姿勢認證,而較低級別部分用來處理「子」特徵。一個較高級別的膠囊可以識別出一張臉部特徵,而這是基於較低級別的膠囊是以一個相一致的方向來對嘴巴和鼻子進行識別的。

然而,傳統的CNN只是依賴大量的數據,其中將該目標可能擁有的所有姿勢都包含在內。

 

如果用膠囊代替神經元。較低級別的膠囊通過識別該目標的較簡單的子部分來做一個該目標可能是什麼的「弱賭注」,然後一個更高級別的膠囊會採取這些低級別的賭注,並試圖看看它們是否同意。如果它們中有足夠多的同意,那麼這個目標就是Y,這可能是非常巧合。而這就是這些膠囊網絡運行方式的本質。

 

我們如何路由這些較低級別的膠囊,把它們送到正確的、更高級別膠囊中呢?Hinton等人也在其論文中詳細介紹了其路由算法,感興趣的讀者可以仔細閱讀其論文,這裡不做詳細描述。


https://arxiv.org/abs/1710.09829

 

反向傳播存在的問題


我們知道,反向傳播也是Geffrey Hinton及其同事在1986年發表的論文「Learning representations by back-propagating errors」上提出的,自此之後,反向傳播成了所有深度學習技術的基礎。

 

但是,去年9月份,Hinton在多倫多接受採訪時就表示要放棄反向傳播,那麼,反向傳播到底存在什麼問題呢?

 

首先,反向傳播在生物學上很難成立。反向傳播需要進行準確地求導、進行矩陣轉置等,這種功能的系統從來沒有在解剖學上得到證實。所以,反向傳播更像是為訓練多層神經網絡而發展起來的算法。反向傳播還需要進行小心翼翼地優化,這是個高度非凸的問題,依賴於繁雜的調參過程。

 

其次,反向傳播計算出來的梯度不能保證是學習的正確方向。很多時候,研究者找到的所謂的最優解,往往只是看上去可行的,並不是問題最終的最優解。Hinton認為,要想讓神經網絡能夠自己變得智能,必須進行「無監督學習」,「我認為這意味著需要放棄反向傳播。」

 

卷積神經網絡


不可否認,CNNs是當前計算機視覺中最先進的技術。CNN 是通過積累各層的特徵集進行工作的,它的工作方式是首先從尋找邊緣開始,然後是形狀,繼而是實際對象。但這種工作方式,把所有這些特徵的空間關鍵信息都丟失了。所以,CNN在探索特徵(視角,大小,方位)之間的空間關係方面效果較差。CNN 在以不同的方向查看圖像時,也很容易混淆比如,在我們倒轉或部分旋轉圖片時,CNN的性能會大幅下降。

 

參考連結:


https://arxiv.org/abs/1710.09829

https://github.com/Sarasra/models/tree/master/research/capsules


-END-

專 · 知

相關焦點

  • 【開源夏令營專訪】HackRF.net:全世界的射頻工程師們,團結起來
    隨著軟體無線電平臺的出現,越來越多的安全分析團隊將有機會對現有的無線安全系統中的薄弱環節進行全面、長期的安全評估。有趣的項目以下項目的介紹及演示都可以在http://hackrf.net上找到。CSDN:目前,HackRF在國內外的發展情況如何?兩者之間有什麼不同?
  • 仿微信的IM聊天時間顯示格式(含iOS/Android/Web實現)[圖文+源碼]
    相關文章《用於IM中圖片壓縮的Android工具類源碼,效果可媲美微信 [附件下載]》《高仿Android版手機QQ可拖拽未讀數小氣泡源碼 [附件下載]》《Android聊天界面源碼:實現了聊天氣泡、表情圖標(可翻頁) [附件下載]》《高仿Android版手機QQ首頁側滑菜單源碼 [附件下載]》《分享java
  • 2010年8大熱門SNS社交網絡開源系統
    SNS因為Facebook的成功而風靡全球,本文整理出2010年開源中國社區最活躍的8大開源SNS系統。1. ConcourseConnectConcourseConnect是一個採用Java語言開發的,基於PostgreSQL資料庫的SNS社會化網絡平臺。
  • 華為深度學習框架MindSpore正式開源:自動微分不止計算圖
    今年的華為開發者大會 HDC 2020 上,除了昇騰、鯤鵬等自研晶片硬體平臺之外,最令人期待的就是深度學習框架 MindSpore 的開源了。今天上午,華為 MindSpore 首席科學家陳雷在活動中宣布這款產品正式開源,我們終於可以在開放平臺上一睹它的真面目。
  • 中國科技雲「第二屆中國開源科學軟體創意大賽」報名通知
    2019年,首屆中國開源科學軟體創意大賽的舉辦在業內反響強烈,各科研院所、高校團隊以及企業公司團隊代表積極報名參賽。大賽本著公平、公開、公正的原則,通過專家評審團嚴格的把關與評審,最終篩選出優秀的高分開源作品十餘款。2020年,期待已久的第二屆中國開源科學軟體創意大賽正式啟動!
  • 直播帶貨app源碼用Java語言來開發有哪些好處?
    而直播帶貨APP源碼的開發十分的重要,且在目前來看,最常用的還是Java語言,那麼相比較於其他語言開發,Java語言的直播帶貨系統有什麼優勢呢?下面就由小編為大家介紹吧。 一、源碼獨立性 Java開發直播帶貨APP源碼可以給企業自主搭建的權利,無需通過第三方平臺交易,不再依賴第三方平臺的流量。
  • 程式設計師為教師妻子開發專屬應用;2020 最佳開源項目出爐;中國構建全...
    與此同時,知名的開源組織 GitNation 也頒布了今年的 JavaScript 年度開源項目。潘建偉團隊重大突破再登 Nature:中國建成全球首個星地量子通信網絡!  ,中國科學技術大學潘建偉團隊在量子通信網絡工程上又迎來重大突破。  據新華社報導,32年前,人類歷史上首次量子通信在實驗室誕生,傳輸了32釐米。而今,中國人將這個距離擴展了 1400 多萬倍,實現了從地面到太空的多用戶通信。
  • 我的世界:玩家最期待的五個傳送門,第五個穿越時空,萬眾期待!
    下面就讓我們一起來看看世界中玩家最期待的五個傳送門,第五個穿越時空,萬眾期待!第一個,天堂傳送門。在我的世界中地獄一般被稱為下界,而天堂則被稱為天域,關於天域,在世界中已經是一個老生常談的話題了。其實在很早以前,Notch就提出了關於天域的設想,但是後來由於末地的建造,以及他本人的離開等多種原因,天域也就永遠成了一個設想。
  • 我的世界玩家最期待的傳送門,穿越時空萬眾期待
    我的世界玩家最期待的傳送門,穿越時空萬眾期待我的世界是一款非常經典的沙盒類遊戲,同時這款遊戲也是自由度非常高的,在我的世界地圖裡面,玩家是可以主宰一切的,同時世界也不僅僅是玩家所在的世界,同時還有末地和下界等多個維度的平行世界,如果你想進入這些世界探險的的話就必須要藉助一樣東西
  • 微信小程序中如何使用WebSocket實現長連接(含完整源碼)
    (說明:本文完整源碼請從文末附件下載,52im.net/thread-1703-1-1.html)2、相關文章《新手入門貼:史上最全Web端即時通訊技術原理詳解》《Web端即時通訊技術盤點:短輪詢、Comet、Websocket、SSE》《新手快速入門:WebSocket簡明教程》《WebSocket詳解(一):初步認識WebSocket技術》《WebSocket詳解(二
  • 穀米萬物科技-北鬥GPS定位器(全球首款開源軟體)
    萬物在線平臺,是行業第一家將北鬥GPS定位器硬體設計方案進行公開,嵌入式程序源碼進行開源的平臺。
  • 萬眾期待!Google或於今晚發布iOS版谷歌地圖
    萬眾期待!事情變化也如谷歌期待的那樣,蘋果3D地圖上線後即被頻繁爆出的缺陷,這時候,谷歌不僅沒有同情,反而施以口誅筆伐。Google公司董事長施密特此前在日本的Google Maps發布會上,明確指出:「要是蘋果公司繼續使用Google地圖,就不會出現這麼糟糕的局面。難道要Google再逼蘋果換回來?駟馬難追。」
  • Can we stop the polar ice caps from melting?
    Whether or not humankind can keep the polar ice caps from melting is a subject of great debate in which both side
  • NeuralNLP-NeuralClassifier:騰訊開源深度學習文本分類工具
    Hierarchical Multi-label Text Classification ToolkitGithub連結,點擊閱讀原文可以直達:https://github.com/Tencent/NeuralNLP-NeuralClassifier以下是來自騰訊開源的官方報導
  • Vuetify - 廣受歡迎的 Material Design 風格的開源 UI 框架
    vuetify 鮮豔的配色Material Design 風格組件值得嘗試/選擇的理由所有組件遵從 Material Design 設計規範,UI 體驗非常優秀,能夠媲美蘋果但又完全不同的設計採用移動優先的設計,無論在手機、平板或 PC 電腦上都有完美的適配極其豐富詳細的上手文檔和免費的視頻教程,社區活躍,全職團隊維護,長期提供支持,每周發版在
  • Linux Deepin新增首都在線鏡像站、開源中國鏡像站鏡像服務
    今日很榮幸的告訴大家,Linux Deepin新增首都在線鏡像站和開源中國鏡像鏡像服務! 目前首都在線鏡像站目前只支持Http協議,其地址如下:http://mirrors.yun-idc.com/deepin/ 此外,該鏡像服務還提供ISO下載服務,Linux Deepin ISO地址:http://mirrors.yun-idc.com/deepin-cd/ 開源中國鏡像站鏡
  • 扒一扒開源世界有哪些licenses?
    實際上,在上世紀七、八十年代,就已經有相當一部分開源許可證被發布出來,供開源軟體選擇使用。我們所講的開源license,則集中在Copyleft和Permissive兩類情況中,具化來講,可以理解為:Copyleft:衍生代碼必須開源,且採用相同的開源license;Permissive:衍生代碼不必開源,可採用不同的開源license;所以,作為代碼的生產者,無論是個人抑或是公司
  • 張堯學否認自然科學一等獎涉嫌抄襲 方舟子稱其盜用開源軟體
    2015年2月4日,2日中午,網名為kranesun的it工程師在知名開原始碼軟體(由散布在全世界的編程者隊伍所開發,其源碼可以被公眾使用的軟體)平臺github貼出中國工程院院士、清華大學教授、中南大學校長張堯學的照片,並發帖稱張及其科研團隊的上述獲獎項目實為「遠程桌面項目」(remote-desktop-client),且涉嫌抄襲國外it工程師上傳的開原始碼軟體
  • 科普貼:那些知名的大型開源會議(一)
    在開源界,每年都會有好幾場大型的開源會議在世界各地舉行。如果你是一個有著廣泛興趣的開源愛好者,這一年大大小小的會議可夠你忙的了。這不,5月24~25日 GNOME.Asia亞洲峰會2014就要在北京召開了。
  • 適合Java新手的開源項目集合——在 GitHub 學編程
    在開源的世界裡,有著無數的 Java 項目等待你去發現探索,讓我們一起跟著本篇文章去看看有哪些開源項目吧?興趣是最好的老師,HelloGitHub 就是幫你找到編程的樂趣。>JavaScript 篇本期是 Java 篇 希望這篇文章能讓大家找到 GitHub 上適合自己學習的 Java 開源項目。