清華大學張長水等最新《少樣本學習FSL》2020綜述論文,30頁pdf414篇參考文獻

2021-03-01 專知

少樣本學習(FSL)在機器學習領域具有重要意義和挑戰性。成功地從很少的樣本中學習和歸納的能力是區分人工智慧和人類智能的一個明顯的界限,因為人類可以很容易地從一個或幾個例子中建立他們對新穎性的認知,而機器學習算法通常需要數百或數千個監督樣本來保證泛化能力。儘管FSL的悠久歷史可以追溯到21世紀初,近年來隨著深度學習技術的蓬勃發展也引起了廣泛關注,但迄今為止,有關FSL的調研或評論還很少。在此背景下,我們廣泛回顧了2000年至2019年FSL的200多篇論文,為FSL提供了及時而全面的調研。在本綜述中,我們回顧了FSL的發展歷史和目前的進展,原則上將FSL方法分為基於生成模型和基於判別模型的兩大類,並特別強調了基於元學習的FSL方法。我們還總結了FSL中最近出現的幾個擴展主題,並回顧了這些主題的最新進展。此外,我們重點介紹了FSL在計算機視覺、自然語言處理、音頻和語音、強化學習和機器人、數據分析等領域的重要應用。最後,我們對調查進行了總結,並對未來的發展趨勢進行了討論,希望對後續研究提供指導和見解。

地址:

https://www.zhuanzhi.ai/paper/ffc99a53aeb6629e21b9a42db76b9dd1

概述:

人類智能的一個令人印象深刻的特點是能夠從一個或幾個例子中迅速建立對新概念的認知。許多認知和心理學證據[184,224,371]表明,人類可以通過很少的圖像[23]識別視覺物體,甚至兒童也可以通過一次偶見就記住一個新單詞[35,51]。雖然從很少的樣本中支持人類學習和歸納能力的確切原因仍是一個深刻的謎,但一些神經生物學研究[285,29,157]認為,人類顯著的學習能力得益於人腦中的前額葉皮層(PFC)和工作記憶,特別是PFC特有的神經生物學機制與大腦中存儲的以往經驗之間的相互作用。相比之下,最先進的機器學習算法都需要大量數據,尤其是最廣為人知的深度學習[186],它將人工智慧推向了一個新的高潮。深度學習作為機器學習發展的重要裡程碑,在視覺[172,319,120]、語言[231,318]、語言[127]、遊戲[308]、人口學[97]、醫學[74]、植物病理學[100]、動物學[252]等廣泛的研究領域都取得了顯著的成就。一般來說,深度學習的成功可以歸結為三個關鍵因素:強大的計算資源(如GPU)、複雜的神經網絡(如CNN[172]、LSTM[129])和大規模數據集(如ImageNet[287]、Pascal-VOC[75])。然而,在現實的應用場景中,比如在醫學、軍事、金融等領域,由於隱私、安全、數據標註成本高等因素,我們無法獲得足夠的標籤訓練樣本。因此,使學習系統能夠有效地從很少的樣本中進行學習和歸納,成為幾乎所有機器學習研究人員所期待的藍圖。

從高層次上看,研究少樣本學習的理論和現實意義主要來自三個方面。首先,FSL方法不依賴於大規模的訓練樣本,從而避免了在某些特定應用中數據準備的高昂成本。第二,FSL可以縮小人類智能和人工智慧之間的差距,是發展通用人工智慧的必要之旅[191]。第三,FSL可以實現一個新興任務的低成本和快速的模型部署,而這個任務只有幾個暫時可用的樣本,這有利於闡明任務早期的潛在規律。


少數樣本學習(FSL),又稱小樣本學習、少樣本學習或一次性學習,可以追溯到21世紀初。儘管該研究已有近20年的歷史,在理論和應用層面上都具有重要意義,但到目前為止,相關的調查和綜述還很少。在本文中,我們廣泛調查了從21世紀頭十年到2019年幾乎所有與FSL相關的科學論文,以詳細闡述一個系統的FSL調研。我們必須強調,這裡討論的FSL與zero-shot learning (ZSL)正交[346],這是機器學習的另一個熱門話題。ZSL的設置需要與概念相關的側面信息來支持跨概念的知識遷移,這與FSL有很大的不同。據我們所知,到目前為止,只有兩份與fsl相關的預先列印的綜述論文[305,349]。與他們相比,本次綜述的新穎之處和貢獻主要來自五個方面:


(1) 我們對2000年至2019年的200多篇與FSL相關的論文進行了更全面、更及時的綜述,涵蓋了從最早的凝固模型[233]到最新的元學習方法的所有FSL方法。詳盡的闡述有助於把握FSL的整個發展過程,構建完整的FSL知識體系。

(2) 根據FSL問題的建模原則,我們提供了一種可理解的層次分類法,將現有的FSL方法分為基於生成模型的方法和基於判別模型的方法。在每個類中,我們根據可一般化的屬性進一步進行更詳細的分類。

(3) 我們強調當前主流目前的方法,例如,基於目前的元學習方法,和分類成五大類,他們希望通過元學習策略學習學習,包括Learn-to-Measure Learn-to-Finetune, Learn-to-Parameterize,學會調整和Learn-to-Remember。此外,本調查還揭示了各種基於元學習的FSL方法之間潛在的發展關係。

(4) 總結了最近在普通FSL之外出現的幾個外延研究課題,並回顧了這些課題的最新進展。這些主題包括半監督FSL、無監督FSL、跨域FSL、廣義FSL和多模態FSL,它們具有挑戰性,同時也為許多現實機器學習問題的解決賦予了突出的現實意義。這些擴展主題在以前的綜述中很少涉及。

(5) 我們廣泛總結了現有FSL在計算機視覺、自然語言處理、音頻和語音、增強學習和機器人、數據分析等各個領域的應用,以及目前FSL在基準測試中的表現,旨在為後續研究提供一本手冊,這是之前綜述中沒有涉及到的。

本文的其餘部分組織如下。在第2節中,我們給出了一個概述,包括FSL的發展歷史、我們稍後將使用的符號和定義,以及現有FSL方法的分類建議。第3節和第4節分別詳細討論了基於生成模型的方法和基於判別模型的方法。然後,第5節總結了FSL中出現的幾個擴展主題。在第6節中,我們廣泛地研究了FSL在各個領域的應用以及FSL的基準性能。在第8節中,我們以對未來方向的討論來結束這次綜述。


使學習系統能夠從很少的樣本中學習對於機器學習和人工智慧的進一步發展至關重要。本文對少樣本學習(FSL)進行了全面的研究。特別地,我們回顧了FSL的發展歷史和當前的進展,並且通過一個簡潔易懂的分類對所有的FSL方法進行了分組。深入分析揭示了主流的基於元學習的FSL方法之間的潛在開發關係。系統總結了FSL的幾個新出現的外延研究課題、現有的FSL在各個領域的應用、當前的基準數據集和性能,以及幾個潛在的研究方向。希望通過本次綜述,促進對FSL相關知識的掌握,促進FSL研究領域的協同發展。

專知便捷查看

便捷下載,請關注專知公眾號(點擊上方藍色專知關注)

專知,專業可信的人工智慧知識分發,讓認知協作更快更好!歡迎註冊登錄專知www.zhuanzhi.ai,獲取5000+AI主題乾貨知識資料!歡迎微信掃一掃加入專知人工智慧知識星球群,獲取最新AI專業乾貨知識教程資料和與專家交流諮詢!點擊「閱讀原文」,了解使用專知,查看獲取5000+AI主題知識資源

相關焦點

  • 什麼是小樣本學習?這篇綜述文章用166篇參考文獻告訴你答案
    機器之心報導參與:魔王什麼是小樣本學習?它與弱監督學習等問題有何差異?其核心問題是什麼?來自港科大和第四範式的這篇綜述論文提供了解答。小樣本學習是其中一個解決方案。來自香港科技大學和第四範式的研究人員綜述了該領域的研究發展,並提出了未來的研究方向。這篇綜述論文已被 ACM Computing Surveys 接收,作者還建立了 GitHub repo,用於更新該領域的發展。
  • 文獻綜述論文寫作
    也可指這一科學活動過程中生產的產品-綜述論文 (review paper)。不管是發表在著名科學雜誌,由學科領域專家撰寫的綜述文章;還是研究生按照培養方案要求,為開展研究工作,熟悉研究領域的狀況和最新研究進展,而學習寫作的學位論文綜述,均包括4個方面的內容:導言;研究進展;未來展望和結束語。
  • 論文寫作之如何搞定文獻綜述
    一、什麼是文獻綜述文獻綜述是對某一學科、專業或專題的大量文獻進行整理篩選、分析研究和綜合提煉而成的一種學術論文,是高度濃縮的文獻產品。文獻綜述反映當前某一領域中某分支學科或重要專題的歷史現狀、最新進展、學術見解和建議,它往往能反映出有關問題的新動態、新趨勢、新水平、新原理和新技術等等。文獻綜述是針對某一研究領域分析和描述前人已經做了哪些工作,進展到何程度,要求對國內外相關研究的動態、前沿性問題做出較詳細的綜述,並提供參考文獻。作者一般不在其中發表個人見解和建議,也不做任何評論,只是客觀概括地反映事實。
  • 畢業論文的文獻綜述怎麼寫
    學術研究論文的主要重點就是提出新的論點,並且研究論文很可能包含文獻綜述作為其組成部分之一。在研究論文中,你可以使用文獻作為其基礎,並為你的新見解提供理論支持。但文獻綜述的重點是在不增加新貢獻的情況下總結、整理他人的觀點和思想,以及對其進行進行客觀的敘述和評論。
  • 我整理了三百多篇論文,得出了寫文獻綜述的這些經驗
    文獻綜述的目的最終的碩士畢業論文裡,文獻綜述的部分是不可或缺的,而讓我們這些「研究者」寫文獻綜述的目的在於總結和整理前人的關於某一個問題的研究成果,然後說明自己的這篇論文的研究在這個基礎上有什麼創新或者意義,又或者說是另外的一種研究方法的更新。
  • 【復旦大學】最新《預訓練語言模型》2020綜述論文大全,50+PTMs分類體系,25頁pdf205篇參考文獻
    近日,復旦大學邱錫鵬等學者發布了自然語言處理處理中預訓練模型PTMs的綜述大全,共25頁pdf205篇參考文獻,從背景知識到當前代表性PTM模型和應用研究挑戰等,是絕好的預訓練語言模型的文獻。第二代PTMs主要學習上下文詞嵌入,如CoVe[113]、ELMo[122]、OpenAI GPT[130]、BERT[32]等。這些學習過的編碼器仍然需要在上下文中通過下遊任務來表示單詞。此外,還提出了各種預訓練的任務,以學習PTMs的不同目的。這篇綜述的貢獻可以總結如下:1.
  • 文獻綜述類論文寫作秘籍
    然而,在國、內外各種刊物層出不窮、文章不勝其數的情況下,我們很可能搜索到多達數百篇有時甚至上千篇的相關文獻,以至於無從著手閱讀、分析。我們建議首先應該重點搜集和閱讀有代表性的文獻,特別是對相關研究產生重大影響的種子論文(seminal paper),然後再搜集和閱讀次要一些的文獻。那麼,如何查找代表性文獻呢?請教導師當然是最簡單、有效的途徑。
  • 綜述類論文寫作技巧
    「摘要」與「Abstract」這兩詞通常黑體或突出,大致用四至八行描述你總體論文內容及展望前景。關鍵詞通常三五個。 3.引言部分可長可短,對於中文論文,比較少超過一頁的,通常都是半頁或三分之二頁,佔整個論文的權重就比較適宜。 4.前言是綜述性學術論文開頭的一段文字。
  • 獨家| 信號處理頂會 ICASSP 開幕,俞棟張長水周彤榮升 IEEE Fellow
    ICASSP 2018 共收到 2830 篇論文投稿,這個數目是 ICASSP 歷次會議中的第二多。投稿中屬於 Machine Learning for Signal Processing(用於信號處理的機器學習)類別的論文投稿有 368 篇,是僅次於 Speech Processing(語音處理)類別的第二大類,佔全部投稿的 13%,這也與大會主題相對應。會議最終接收論文 1406 篇,接收率 49.7%。
  • 淺談文獻綜述類科技論文的特徵及作用
    文獻綜述按照敘述性質和文體不同,可以分為大綜述和小綜述。大綜述一般是就某個領域的文獻做出的全面總結,屬於三次文獻的特殊文體,是與調查報告和研究報告並列的一種的綜述性文章。小綜述屬於一次和三次文獻的混合體。通常,學位論文的導論部分或課題開題報告屬於此類文獻綜述,碩士與博士學位論文和課題開題的寫作必須要經歷這一過程。
  • 護理論文參考文獻著錄的常見問題
    參考文獻係指作者為撰寫論文或論著而引用的期刊、圖書或其他資料的有關文獻。作為一篇學術論文,參考文獻是必不可少的。它不僅反映了作者對他人科研成果的尊重,也對論文內容起到支持、佐證和揭示其信息來源的作用,並且是評估論文水平和衡量作者吸收利用信息能力的指標。
  • 文獻研究法與文獻綜述
    不論是有目標地查找還是漫無目標地查找,對所關心的文獻總可以運用到追溯法,即利用所找到文獻中,在文章或專著的末尾所附的參考文獻目錄,追溯查找有關文獻,這種「滾雪球」般的方法,往往可以事半功倍的效果,對於前人加工的綜述性文章進行追溯,效率更高。當然,前提是你找到了與你選題一致的綜述文章,實踐證明,一篇與你選題相近的符合要求的高質量的綜述文章,真不是那碰巧讓你碰到。
  • 怎麼寫文獻綜述?
    所以這裡U鹽君嘔心瀝血總結了一份【傻瓜式的文獻綜述寫作方式】,學會了之後事半功倍,再也不用毫無頭緒地看論文啦!但是為了更好地理解這篇文章,請在這之前閱讀我們前一期英文論文的閱讀方法:如何10分鐘讀完一篇英文文獻 或者研究生們剛開始看英文文獻是怎麼看的?​
  • 如何開始你的第一篇英文論文:系統性文獻綜述論文寫作與發表
    ,採用標準化的文獻選取和分析技術,比傳統文獻綜述法更易掌握,也更具有客觀性。系統性文獻綜述論文現也備受SSCI與SCI國際期刊青睞。主講人:Dr.Xi,海外知名大學博士後,具有文獻綜述法,用戶研究(問卷法和實驗法)和數據分析(定量和定性數據分析)的豐富經驗。擁有多個個人獨立科研基金項目於,並曾主持多項國際學術會議。其論文發表於國際SSCI&SCI高水平學術期刊,目前擔任多個JCR一區/二區審稿人。
  • 關於文獻綜述,這篇文章說透了!
    何為文獻綜述呢?文獻綜述是在確定了選題後,在對選題所涉及的研究領域的文獻進行廣泛閱讀和理解的基礎上,對該研究領域的研究現狀(包括主要學術觀點、前人研究成果和研究水平、爭論焦點、存在的問題及可能的原因等)、新水平、新動態、新技術和新發現、發展前景等內容進行綜合分析、歸納整理和評論,並提出自己的見解和研究思路的一種不同於畢業論文和研究論文的文體。
  • 寫文獻綜述的二十八個要點
    由於綜述是三次文獻,不同於原始論文(一次文獻),所以在引用材料方面,也可包括作者自己的實驗結果、未發表或待發表的新成果。5.綜述的內容和形式靈活多樣,無嚴格的規定,篇幅大小不一,大的可以是幾十萬字甚至上百萬字的專著,參考文獻可數百篇乃至數千篇;小的可僅有千餘字,參考文獻數篇。一般醫學期刊登載的多為3000~4000字,引文15~20篇,一般不超過20篇,外文參考文獻不應少於1/3。
  • 文獻綜述怎麼寫?這篇文章說的透徹!
    然而,在國、內外各種刊物層出不窮、文章不勝其數的情況下,我們很可能搜索到多達數百篇有時甚至上千篇的相關文獻,以至於無從著手閱讀、分析。我們建議首先應該重點搜集和閱讀有代表性的文獻,特別是對相關研究產生重大影響的種子論文(seminal paper),然後再搜集和閱讀次要一些的文獻。那麼,如何查找代表性文獻呢?請教導師當然是最簡單、有效的途徑。
  • 醫學論文的參考文獻的注意事項
    參考文獻是指為撰寫或編輯論文和著作而引用的有關文獻信息資源。引用參考文獻時,應按照它們在正文中出現的順序,在正文後用阿拉伯數字標記。原則上,所有必要的參考文獻,作者都應該引用,並進行標註。應選擇引用的論文參考文獻。
  • 最新《知識蒸餾》2020綜述論文,30頁pdf,雪梨大學
    來自雪梨大學的學者發布了《知識蒸餾》的綜述論文,值的關注。https://arxiv.org/abs/2006.05525近年來,深度神經網絡在工業和學術界取得了巨大的成功,特別是在視覺識別和神經語言處理方面的應用。深度學習的巨大成功,主要歸功於其巨大的可擴展性,既有大規模的數據樣本,也有數十億的模型參數。
  • 怎樣寫文獻綜述?
    綜述性論文是通過對各種觀點的比較說明問題的,讀者如有興趣深入研究,可按參考文獻查閱原文。因此,必須嚴肅對待。 文獻綜述的寫作要求 1文獻綜述的格式 文獻綜述的格式與一般研究性論文的格式有所不同。