
論文一:
標題:Neural Ordinary Differential Equations,神經常規微分方程

論文摘要:介紹了一種新的深度神經網絡模型。我們使用神經網絡參數化隱藏狀態的導數,而不是一個具體指定的離散隱藏層的序列。運用黑盒微分方程求解器(blackbox differential equation solver)來計算網絡的輸出。這些連續深度模型具有恆定不變的儲存成本,可以根據輸入調整其評估策略,並且可以明顯地以精度換取速度(這裡只指數值的精度)。我們證明了非連續深度(continuous-depth)殘差網絡和連續時間潛在變量模型的性質。我們還構建了連續正則化流,這是一個可以通過最大似然進行訓練的生成模型,而無需對數據維度進行分區或排序的生成模型。

對於訓練來說,我們將回答這樣一個問題:如何在不訪問任何常規微分方程(ODE)求解器內部操作的情況下,可伸縮地反向傳播(允許在更大的模型中對常規微分方程進行端到端訓練)?
論文二:

論文標題:Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering,開箱即用:用圖卷積網絡進行推理,用於實際的視覺問答
論文摘要:
準確地回答關於給定圖像的問題,需要結合一些觀察和一些常識。雖然這對人類來說易如反掌,但是用常識進行推理仍然是機器在算法上需要應對的挑戰。最近為了在這個方向上推進研究發展,提出了一項新的「基於事實」的視覺問題回答(FVQA)任務,大量的人工精心收集驗證的事實(facts),用來連接一組事物,例如這一組事物可能是兩個關係,或者是兩個可能的答案。
對於給定的一套問答圖片,採用深度網絡技術對大量的事實進行連續的簡化,直到最後剩下的一組(含兩個事物)中的一個被預測為答案。我們注意到,一個連續的過程,如果一次考慮一個事實,這會形成一個局部決策,這個決策是次優的。
與此相反,我們開發了一個對象圖(entity graph),並使用一個圖卷積網絡,通過共同考慮所有對象來「推理」出正確的答案。在具有挑戰性的視覺問題回答(FVQA)數據集,我們的方法顯示,可以提高約7%的準確性(與前沿技術水平比較) 。
該論文作者均來自於伊利諾伊大學香檳分校。(完)
親愛的數據
出品:譚婧
美編:陳泓宇