機器之心報導
參與:杜偉、小舟、魔王
使用非線性周期函數構建的神經架構效果優於 ReLU?斯坦福的一項研究做出了嘗試。
這個非線性激活函數效果比 ReLU 還好?近日,史丹福大學的一項研究《Implicit Neural Representations with Periodic Activation Functions》進入了我們的視野。這項研究提出利用周期性激活函數處理隱式神經表示,由此構建的正弦表示網絡(sinusoidal representation network,SIREN)非常適合表示複雜的自然信號及其導數。
Geoffrey Hinton 轉發了這項研究,並表示該項目的講解視頻或許有助於理解網格單元。
研究人員在項目主頁上展示了 SIREN 的效果,例如 SIREN 和 ReLU 在處理視頻時的不同表現:
具備像素坐標和時間坐標的 SIREN 可以用於參數化視頻。上圖展示了 SIREN 使用真值像素值進行直接監督,其參數化視頻的效果大大超過基於 ReLU 的多層感知機。
接下來,我們來看研究人員提出 SIREN 的動機和詳細細節。
由神經網絡參數化的隱式定義、連續可微的信號表示已經成為一種強大的範式。與常規表示相比,它具備很多優點。
但是,當前用於隱式神經表示的網絡架構無法對信號進行精細建模,也無法表示信號的時空導數。但實際上,對於許多被隱式定義為偏微分方程的解的物理信號而言,這是十分必要的。
近日,史丹福大學的一項研究提出利用周期性激活函數進行隱式神經表示,即正弦表示網絡(sinusoidal representation network,SIREN),並展示了它們非常適合表示複雜的自然信號及其導數。
論文地址:https://arxiv.org/pdf/2006.09661.pdf項目主頁:https://vsitzmann.github.io/siren/研究者分析了 SIREN 激活統計數據,提出了一種有原則的初始化方案,並展示了圖像、波場、視頻、聲音及其導數的表示。
此外,研究者還展示了如何利用 SIREN 來解決具有挑戰性的邊值問題,比如特定的程函方程(Eikonal equation)、泊松方程(Poisson equation)、亥姆霍茲方程(Helmholtz equation)以及波動方程。
最後,研究者將 SIREN 與超網絡相結合,來學習 SIREN 函數空間的先驗知識。
SIREN 概述
研究者將研究重點放在了能夠滿足以下方程式的函數 Φ:
該研究旨在解決公式 (1) 中的問題。研究者將該問題看作一個可行性問題,即找出函數 Φ 滿足 M 約束集合
,其中每一個 M 將函數 Φ 及其導數與量 a(x) 關聯起來:
於是,該問題可以寫成損失函數的形式,即懲罰域 _m 上每個約束的偏差:
研究者將函數 Φ_θ 參數化為全連接神經網絡,並使用梯度下降解決優化問題。
用於隱式神經表示的周期激活函數
該研究提出了一種簡單的神經網絡架構 SIREN 來處理隱式神經表示。SIREN 使用正弦作為周期激活函數:
有趣的是,SIREN 的任意導數都是 SIREN,就像正弦的導數是餘弦,即相移正弦。因此,SIREN 的導數繼承了 SIREN 的特性,使得研究者使用「複雜」信號監督 SIREN 的任意導數。
該研究將展示,SIREN 可以通過對激活分布的控制進行初始化,這可以使研究者創建深層架構。
此外,SIREN 的收斂速度遠遠超過基線架構,例如它在一塊現代 GPU 上擬合單張圖像數百次僅需數秒,同時圖像保真度還更高,如下圖 1 所示:
激活分布、頻率,以及合理的初始化機制
該研究展示了一種有助於高效訓練 SIREN 的合理初始化機制。其核心思想是:保存網絡中的激活分布,使得初始化的最終輸出不依賴於層數。注意:構建 SIREN 需要精心挑選均勻分布權重,否則準確率和收斂速度都會很糟糕。
我們先來看使用均勻分布輸入 x U(1, 1) 的單個正弦神經元的輸出分布。該研究提出的初始化機制使用 ADAM 優化器在所有實驗中均實現了快速、穩健的收斂。
SIREN 效果如何
在實驗部分,研究者將 SIREN 與 ReLU、TanH、Softplus、ReLU P.E 等網絡架構的效果進行了比較。結果顯示,SIREN 的性能顯著優於所有這些基準方法,收斂速度明顯加快,並且成為唯一一個準確表示信號梯度的架構,從而使其可用於解決邊值問題。
下面我們來看 SIREN 在處理泊松方程、亥姆霍茲方程、波動方程,以及利用符號距離函數表示形狀和學習隱函數空間等五個方面的具體表現。
解決泊松方程問題
研究者表示,通過監督 SIREN 的導數,他們可以解決基於泊松方程的圖像問題。實驗結果顯示,SIREN 同樣是唯一一個能夠準確快速擬合圖像、梯度和拉普拉斯域的架構。
SIREN 與其他幾種基準方法的展示效果圖如下所示:
就具體細節來說,下圖 3 展示了使用 SIREN 方法的擬合效果以及圖像無縫融合到梯度域(gradient domain)的效果。
圖 3:泊松圖像重建和泊松圖像編輯。
利用符號距離函數表示形狀
如下圖 4 所示,該研究提出的周期性激活函數顯著增加了物體的細節以及可用神經 SDF 表示的場景複雜度,並且僅使用單個五層全連接神經網絡即實現了整個房間的參數化表示。
圖 4:SIREN 與 ReLu 基準方法的形狀表示細節展示。
解決亥姆霍茲方程問題
以下動圖為利用 SIREN、ReLU 和 TanH 基準架構解決不均勻 Helmholtz 問題的效果展示:
研究者利用 SIREN 解決不均勻亥姆霍茲方程問題,並與基於 ReLU 和 Tanh 等的網絡架構進行了比較,具體細節如下圖 5 所示:
學習隱函數空間
下圖 6 展示了基於不同數量的像素觀察結果進行的測試時重建。以下所有修復結果均使用相同的模型和相同的參數值生成。
下表 1 給出了與 [50] 的定量比較,表明對 SIREN 表示的泛化至少與對圖像的泛化同樣有效。
解決波動方程問題
在時間域中,SIREN 成功地解決了波動方程問題,而基於 Tanh 的網絡架構卻未能找出正確的解。兩者的實現動圖展示如下:
利用 SIREN 與基於 Tanh 網絡架構解決波動方程初始值問題的細節如下: