目錄
用於行人重識別的三元組在線實例匹配丟失
用於DSTC8 AVSD挑戰的帶指針網絡的多模式Transformer
PointAugment:一種自動增強的點雲分類框架
尋找稀疏、可訓練的神經網絡
有序神經元:將樹結構集成到遞歸神經網絡中
用於行人重識別的三元組在線實例匹配丟失
論文名稱:Triplet Online Instance Matching Loss for Person Re-identification
作者:Li Ye /Yin Guangqiang /Liu Chunhui /Yang Xiaoyu /Wang Zhiguo
發表時間:2020/2/24
論文連結:https://paper.yanxishe.com/review/12688?from=leiphonecolumn_paperreview0304
推薦原因
這篇論文要解決的是行人重識別問題。
在線實例匹配(OIM)損失函數和三元組(Triplet)損失函數是行人重識別問題的主要方法。但這兩個損失函數都有缺點,OIM損失對所有樣本均等對待,沒有關注困難樣本,三重損失以複雜且繁瑣的方式來處理批處理樣本,因此收斂速度很緩慢。針對這些問題,這篇論文提出了三元組在線實例匹配(TOIM)損失函數,該函數能著重於困難樣本並能有效地提高行人重識別模型的準確性。TOIM結合了OIM損失和Triplet損失的優點,並簡化了批處理過程,從而使收斂更快。
用於DSTC8 AVSD挑戰的帶指針網絡的多模式Transformer
論文名稱:Multimodal Transformer with Pointer Network for the DSTC8 AVSD Challenge
作者:Le Hung /Chen Nancy F.
發表時間:2020/2/25
論文連結:https://paper.yanxishe.com/review/12687?from=leiphonecolumn_paperreview0304
推薦原因
這篇論文要解決的是視聽場景感知對話(Audio-Visual Scene-Aware Dialog,AVSD)問題。
視聽場景感知對話要求對話代理生成自然語言響應以解決用戶查詢並進行對話。這是一項具有挑戰的任務,因為其包含多模態視頻功能,例如包括文本、視覺和音頻特徵。對話代理還需要學習用戶話語和系統響應之間的語義依賴,以便與人類進行連貫對話。這篇論文介紹該團隊向第八屆對話系統技術挑戰賽(Dialogue System Technology Challenge)提交的AVSD參賽作品,採用了點積方式來結合輸入視頻的文本和非文本特徵,通過在每個生成步驟中採用指針網絡指向來自多個源序列的Tokens,進一步增強對話代理的生成能力。
PointAugment:一種自動增強的點雲分類框架
論文名稱:PointAugment: an Auto-Augmentation Framework for Point Cloud Classification
作者:Li Ruihui /Li Xianzhi /Heng Pheng-Ann /Fu Chi-Wing
發表時間:2020/2/25
論文連結:https://paper.yanxishe.com/review/12686?from=leiphonecolumn_paperreview0304
推薦原因
這篇論文被CVPR 2020接收,要解決的是點雲分類的問題。
這篇論文提出了一個名為PointAugment的點雲分類框架,當訓練分類網絡時,該框架會自動優化和擴充點雲樣本以豐富數據多樣性。與現有的2D圖像自動增強方法不同,PointAugment具有樣本感知功能,並採用對抗學習策略來共同優化增強器網絡和分類網絡,學習生成最適合分類器的增強樣本。PointAugment根據形狀分類器和點位移來構造可學習的點增強函數,並根據分類器的學習進度精心設計損失函數以採用增強樣本。PointAugment在改善形狀分類和檢索中的有效性和魯棒性得到了實驗的驗證。
尋找稀疏、可訓練的神經網絡
論文名稱:THE LOTTERY TICKET HYPOTHESIS: FINDING SPARSE, TRAINABLE NEURAL NETWORKS
作者:Jonathan Frankle /Michael Carbin
發表時間:2019/3/3
論文連結:https://paper.yanxishe.com/review/12586?from=leiphonecolumn_paperreview0304
推薦原因
核心問題:一個標準的剪枝技術能夠自然地發現子網絡結構,這些子網絡的初始化能夠幫助網絡更有效地訓練。
創新點:本研究提出一種 lottery ticket hypothesis:對於那些包含子網絡 結構的密集、隨機初始化前饋網絡,當單獨訓練這些子網絡時,通過相似的訓練迭代次數能夠取得與原始網絡相當的測試性能。而
研究意義:實驗結果表明,在 MNIST 和 CIFAR-10 數據集上,子網絡的規模始終比幾種全連接結構和卷積神經網絡小10%-20%。當規模超過這個範圍時,子網絡能夠比原始網絡有更快的學習速度和更好的測試精度表現。
有序神經元:將樹結構集成到遞歸神經網絡中
論文名稱:ORDERED NEURONS: INTEGRATING TREE STRUCTURES INTO RECURRENT NEURAL NETWORKS
作者:Yikang Shen /Shawn Tan /Alessandro Sordoni /Aaron Courville
發表時間:2019/5/8
論文連結:https://paper.yanxishe.com/review/12585?from=leiphonecolumn_paperreview0304
推薦原因
核心問題:標準的 LSTM 結構允許不同的神經元跟蹤不同時間維度信息,但它對於層級結構建模中的各組成沒有明確的偏向。
創新點:本文提出神經元排序策略來添加一個歸納偏置量,當主輸入向量和遺忘門結構確保給定的神經網絡更新時,後續跟隨的所有神經元也將隨之更新。
研究意義:這種集成樹結構的新穎循環神經網絡 ON-LSTM在四種不同的 NLP 任務:語言建模、無監督解析、目標句法評估和邏輯推理上都取得了良好的表現。
論文作者團隊招募
為了更好地服務廣大 AI 青年,AI 研習社正式推出全新「論文」版塊,希望以論文作為聚合 AI 學生青年的「興趣點」,通過論文整理推薦、點評解讀、代碼復現。致力成為國內外前沿研究成果學習討論和發表的聚集地,也讓優秀科研得到更為廣泛的傳播和認可。
我們希望熱愛學術的你,可以加入我們的論文作者團隊。
加入論文作者團隊你可以獲得
1.署著你名字的文章,將你打造成最耀眼的學術明星
2.豐厚的稿酬
3.AI 名企內推、大會門票福利、獨家周邊紀念品等等等。
加入論文作者團隊你需要:
1.將你喜歡的論文推薦給廣大的研習社社友
2.撰寫論文解讀
雷鋒網雷鋒網雷鋒網