2018 年神經信息處理系統大會NIPS(Conference and Workshop on Neural Information Processing Systems)近日在加拿大蒙特婁成功召開。作為神經計算和機器學習領域的兩大頂級會議之一(另一個為ICML),NIPS自1987 年誕生至今已有 31 年的歷史,一直以來都受到學術界和產業界的高度關注。今年,NIPS參會人數更是飆升至近 9000 人,論文投稿量也創造了歷史新高,共收到 4856 篇投稿,最終錄取 1011 篇論文。在NIPS2018 上,優必選研究院有兩篇論文被收錄。
此外,今年 10 月在韓國首爾落幕的多媒體領域的國際頂級會議ACM MM(ACM Multimedia)上,優必選研究院同樣也有論文被錄取,此次入選的論文如下:
一、NIPS 2018
論文一: Learning Versatile Filters for Efficient Convolutional Neural Networks
本文介紹用於構建高效卷積神經網絡的通用濾波器。考慮到在經濟有效的硬體上運行高效深度學習技術的需求,人們開發出了許多方法來了解緊湊型神經網絡。其中,大多數方法旨在以不同的方式精簡濾波器,例如,研發小型濾波器、稀疏濾波器或二值化濾波器。相反,我們從加法的角度來對待濾波器。一系列的二級濾波器可以源自於主濾波器。這些二級濾波器全都在主濾波器中繼承,不佔用更多的存儲空間,但是一旦在計算中展開,它們就可以通過整合從不同感受域提取的信息來顯著增強濾波器的性能。除空間通用濾波器外,我們還從通道的角度研究通用濾波器。新技術通常用於升級現有卷積神經網絡 (CNN) 中的濾波器。基準數據集和神經網絡的實驗結果表明,使用我們的通用濾波器構建的 CNN 能夠實現與原始濾波器相當的精確度,但需要的內存和 FLOPs 更少。
論文二:Dual Swap Disentangling
學習可解釋的解纏表示是一項至關重要又具有挑戰性的任務。在本文中,我們提出了一種弱半監督方法,稱為雙交換解纏 (DSD),用於使用標記數據和未標記數據進行解纏。與依賴於樣本組上的完整注釋的傳統弱監督方法不同,我們只需要配對樣本上的有限注釋來指示其顏色等共享屬性。我們的模型採取雙自動編碼器結構的形式。為了使用標記的對進行解纏,我們遵循「編碼-交換-解碼」過程,其中我們首先交換對應於共享屬性的編碼部分,然後解碼所獲得的混合碼以重構原始輸入對。對於未標記的對,我們在指定的編碼部分上執行兩次「編碼-交換-解碼」過程,並執行最終輸出以估計輸入對。通過隔離部分編碼並來回交換它們,我們強制實現未標記樣本編碼的維數模塊性和可移植性,這也就等於鼓勵在標記對的指導下解纏。這種為半監督設置量身定製的雙重交換機制是非常有效的。對來自廣泛領域的圖像數據集的實驗表明,我們的模型具有最先進的解纏性能。
二、ACM MM 2018
論文一:Comprehensive Distance-Preserving Autoencoders for Cross-Modal Retrieval
在本文中,我們提出了一種採用綜合距離保持自動編碼器 (CDPAE) 的新穎方法,以解決無監督的跨模態檢索問題。先前的無監督方法主要依賴於共存並屬於相同對象的跨媒體空間提取的成對表示距離。但是,除成對距離之外,CDPAE 還考慮從交叉媒體空間提取的異構表示距離以及從屬於不同對象的單個媒體空間提取的均勻表示距離。CDPAE 由四個部分組成。首先,去噪自動編碼器用於保留來自表示的信息並減少冗餘噪聲的負面影響。其次,提出了一個綜合的距離保持公共空間來探索不同表示之間的相互關係。這旨在保持公共空間內的表示之間的各自距離,使它們能與其原始媒體空間中的距離相一致。第三,定義了一種新穎的聯合損失函數,用於同時計算去噪自動編碼器的重構損耗和綜合距離保持公共空間的相關損失。最後,提出了一種無監督的跨模態相似性度量,以進一步提高檢索性能。這是通過基於 kNN 分類器計算兩個媒體對象的邊際概率來實現的。CDPAE 在四個公共數據集上進行測試,具有兩個跨模態檢索任務「按文本查詢圖像」和「按圖像查詢文本」。與八種最先進的跨模態檢索方法相比,實驗結果表明 CDPAE 優於所有無監督方法,並且與受監督方法相比也更具優勢。