什麼是小樣本學習?這篇綜述文章用166篇參考文獻告訴你答案

2020-12-25 機器之心Pro

機器之心報導

參與:魔王

什麼是小樣本學習?它與弱監督學習等問題有何差異?其核心問題是什麼?來自港科大和第四範式的這篇綜述論文提供了解答。

數據是機器學習領域的重要資源,在數據缺少的情況下如何訓練模型呢?小樣本學習是其中一個解決方案。來自香港科技大學和第四範式的研究人員綜述了該領域的研究發展,並提出了未來的研究方向。

這篇綜述論文已被 ACM Computing Surveys 接收,作者還建立了 GitHub repo,用於更新該領域的發展。

論文地址:https://arxiv.org/pdf/1904.05046.pdf

GitHub 地址:https://github.com/tata1661/FewShotPapers

機器學習在數據密集型應用中取得了很大成功,但在面臨小數據集的情況下往往捉襟見肘。近期出現的小樣本學習(Few-Shot Learning,FSL)方法旨在解決該問題。FSL 利用先驗知識,能夠快速泛化至僅包含少量具備監督信息的樣本的新任務中。

這篇論文對 FSL 方法進行了綜述。首先,該論文給出了 FSL 的正式定義,並釐清了它與相關機器學習問題(弱監督學習、不平衡學習、遷移學習和元學習)的關聯和差異。然後指出 FSL 的核心問題,即經驗風險最小化方法不可靠。

基於各個方法利用先驗知識處理核心問題的方式,該研究將 FSL 方法分為三大類:

數據:利用先驗知識增強監督信號;

模型:利用先驗知識縮小假設空間的大小;

算法:利用先驗知識更改給定假設空間中對最優假設的搜索。

最後,這篇文章提出了 FSL 的未來研究方向:FSL 問題設置、技術、應用和理論。

論文概覽

該綜述論文所覆蓋的主題見下圖:

我們選取介紹了該綜述論文中的部分內容,詳情參見原論文。

什麼是小樣本學習?

FSL 是機器學習的子領域。

我們先來看機器學習的定義:

電腦程式基於與任務 T 相關的經驗 E 學習,並得到性能改進(性能度量指標為 P)。

基於此,該研究將 FSL 定義為:

小樣本學習是一類機器學習問題,其經驗 E 中僅包含有限數量的監督信息。

下圖對比了具備充足訓練樣本和少量訓練樣本的學習算法:

FSL 方法分類

根據先驗知識的利用方式,FSL 方法可分為三類:

FSL 方法解決少樣本問題的不同角度。

基於此,該研究將現有的 FSL 方法納入此框架,得到如下分類體系:

數據

此類 FSL 方法利用先驗知識增強數據 D_train,從而擴充監督信息,利用充足數據來實現可靠的經驗風險最小化。

如上圖所示,根據增強數據的來源,這類 FSL 方法可分為以下三個類別:

模型

基於所用先驗知識的類型,這類方法可分為如下四個類別:

算法

根據先驗知識對搜索策略的影響,此類方法可分為三個類別:

文章最後從問題設置、技術、應用和理論四個層面探討了小樣本學習領域的未來發展方向。

相關焦點

  • 怎麼讀文獻、管理文獻、寫綜述?這篇文章講了!
    對於我,更適合「好記性不如爛筆頭」,這也適合我的德國同事們。他們把文獻用A4紙列印出來,在重要的語句上用高亮筆劃出。讀完之後抄錄到A5紙上,訂到原來的文獻上,作為精選。這個摘錄是對你真正有用的知識點,其他大部分文章都是鋪墊,或者是已經在你記憶中了。「高亮筆劃出+讀書筆記」能夠有效的幫助記憶。
  • 論文如何閱讀英文文獻?3分鐘了解學術大佬不會告訴你的5個秘密!
    讀文獻有不同的讀法,但最重要的就是自己總結概括這篇文獻到底說了什麼,否則就是白讀。譬如讀的時候好像全都明白,一合上就什麼都不知道了,這是讀文獻的大忌,既浪費時間,也沒有養成良好的習慣,導致以後不願意讀文獻。
  • 幾篇綜述帶你迅速入門環狀RNA研究
    RNA的綜述,為小夥伴們打開新世界的大門。Ashwal-Fluss [1], R.和Zhang, Y. [2]兩位大牛的研究為我們理解circRNA的產生機制打下了堅實的基礎,而這篇綜述則能夠讓你最快速地了解先前研究的結論,為你提供巨人之肩。
  • 如何高效整理外文文獻
    通過參考綜述檢索:如果有與自己課題相關或有切入點的綜述,可以根據相應的參考文獻找到那些原始的研究論文。注意文章的參考價值:刊物的影響因子、文章的被引次數能反映文章的參考價值。但要注意引用這篇文章的其它文章是如何評價這篇文章的。
  • 閱讀英文文獻的訣竅,就在這裡!
    知道已經做出什麼,自己要做什麼,還有什麼問題沒有解決。對於國內文獻一般批評的聲音很多。但它是你迅速了解你的研究領域的入口在此之後,你再看外文文獻會比一開始直接看外文文獻理解的快得多。2有針對的選擇文獻針對你自己的方向,找相近的論文來讀,從中理解文章中回答什麼問題,通過哪些技術手段來證明
  • 知乎23W圍觀:三天後交文獻綜述,沒頭緒寫不出,咋辦?
    Literature Review在很多學術小白覺得都是牛人才做的事,其實很簡單的,不要想那麼複雜;但也有少數同學覺得寫文獻綜述特別簡單,認為只要把別人的觀點複製粘貼就可以了。小曼在這建議你千萬不要有這種想法,這是不對的。
  • Nature分享:如何寫好綜述論文?
    我的建議是接受「綜述文章並不是教科書」這一點:你的文章應該對主題有更集中的討論,跳過一些話題是可以的,這樣就不會分散讀者的注意力。 學生們也應該考慮編輯的截止日期,尤其是受邀撰寫的綜述,確保文章討論的範圍不要太廣,以免耽誤寫作。
  • Endnote插入參考文獻的保姆級教程
    這倒不是什麼難事,最煩人的是參考文獻的插入。一篇博士論文下來,參考論文不說300篇,也有那麼一二百篇吧,一個一個加豈不是愁死人。同學們不用怕,今天用endnote插入參考文獻的保姆級教程來啦,基本能夠滿足我的需求,希望也能滿足大家的需求喲!內容主要分為兩部分:第一部分,如何插入參考文獻;第二部分,如何通過endnote和word修改參考文獻,滿足不同期刊及畢業論文的格式要求。
  • 微信話題標籤功能怎麼用?35.8萬篇文章告訴你
    通過對話題收錄的文章數統計分析,發現目前80.9%的話題中收錄的文章數都在20篇以下,有242591個話題中僅收錄了一篇文章,佔比44.5%。由此可見,20篇文章以內的話題是大多數公眾號的選擇。單個話題中最多收錄1264篇文章,為公眾號上海海上搜救志願者創建的「上海海上搜救志願者」話題。
  • 三年級暑假閱讀能力提升,課外閱讀訓練三篇附參考答案
    今天給大家分享三年級暑假課外閱讀第四練三篇短文。各位同學可以先做一下,在參考答案看看自己做的效果如何。( )(4)這個故事告訴我們什麼道理?A. ( ) B. ( ) C. ( ) D. ( )5.人們需要學習野菊花的什麼精神?
  • 論文查重降重有什麼訣竅?過來人偷偷告訴你!
    畢業論文最大的問題不是寫不出來,網上寫論文的方法提綱不計其數,大家都可以去學習。難的是好不容易寫出來,或者拼湊完了,但是查重率過高,無法達到學校的要求。為了防止大家臨陣慌亂,我們帶來了這篇文章:論文查重降重有什麼訣竅?過來人偷偷告訴你!
  • 深度學習行人重識別綜述與展望,TPAMI 2021 最新文章
    這裡先總結該綜述的幾個主要貢獻點:綜述:全面調研了近年來深度學習在 Re-ID 領域的進展,囊括了近幾年三大視覺頂會上的大部分文章(如有遺漏,請諒解)。主要包括 Closed-world Re-ID 與 Open-world Re-ID 的研究進展,常用數據集和評價指標的概述,並分析了現有方法的不足和改進點。
  • 看完這兩篇文章,我無語了!因為正文真的是……
    我們希望本文可以作為化學教育、科普資料,並希望為營銷提供有用指導。 看完Cover Letter感覺這篇文章應該是意義重大的高大上研究,我們一起看看全文: 文章題目、作者、摘要,參考文獻,致謝等都很完整,但是正文真的一個字都沒有。期刊的編輯幽默地表示: 由於我們期刊有紙質版本,我們無法在期刊發表該論文,因為那將意味著使用化學物質……而這似乎不適合這篇「不含化學物質」的論文。因此, 它沒有被錄用。我們不常收到這樣的投稿:首先讓我們發笑,然後又讓我們思考。因此,我們進行了漫長而艱苦的思考,該怎麼處理這篇文章。
  • 研究生導師:3小時內讀不完一篇英文文獻的你,還沒邁入科研門檻
    然後再找一兩篇該領域對應的英文綜述認真閱讀一下,不會的單詞可用電子詞典查一查,也許讀第一篇文章需要花兩天,過兩天再讀第2遍時,也許只要一天,然後再讀第2篇時也許只要半天!初始的中文閱讀積累了初始的研究印象,後面的英文文獻基本八九不離十,會有一種似曾相似的感覺,從而建立起讀英文文獻的信心。
  • 這篇文章告訴你答案
    01 學習英語的目的是什麼為什麼要學習英語?這個問題已經被人們問起過無數次,也被無數人回答過。提問的人在得到答案之後,並沒有幾個真正著手去學習英語,回答問題的人也沒有幾個能夠真正回答到點子上。有些人為了回答為什麼學習英語,用數千字的文章展開長篇大論的闡述,這種回答本身就已經讓人昏昏欲睡,又如何提起對英語學習的興趣?
  • 買iPhone 免費送一年的 Apple TV+ 怎麼用?這篇文章告訴你答案
    這篇文章告訴你答案 Apple TV+ 11 月 1 日正式上線,蘋果給出的優惠政策是 9 月 10 日之後買入的新設備(無需最新的型號)在 3 個月內激活,且是非中國區的 Apple ID,即可獲得一年的免費觀看權(如果不是新設備,則只有 7 天免費觀看期)。
  • 這篇文章告訴你!
    環保性關於家庭的健康,美觀實用性關乎衣櫃用的久不久款式美不美觀,所以大家在選擇家具的需要特別注意板材的選擇,下面易高家居小編就和大家聊聊定製衣櫃如何選擇板材?一、看看衣櫃板材膠黏劑。板材存在甲醛是正常的,但是甲醛超標的話會對身體產生危害。有些人在板材在使用過程中需要使用到膠水,膠水是甲醛的罪魁禍首之一,所以膠水的選擇要看看是否符合國家的生產標準。
  • 維修過的自動擋變速箱什麼時候做保養?這篇文章來給你答案!
    維修過的自動擋變速箱什麼時候做保養?這篇文章來給你答案!首先自動變速箱保養,跟變速箱維修幾乎沒有什麼太大的關係!如果本身的自動變速箱壞了,維修好了以後,那麼它本身維修以後就是重新更換的變速箱油!什麼類型的變速箱?就算是自動變速箱的種類也有很多!如果本身車輛已經出了質保期,這種情況下個人建議根本不用按照4s店或者是廠家給出的質保裡程來進行保養!根據你日常用車的條件(自動變速箱的保養裡程差不多也就是在三年或者是6萬公裡左右的保養周期,時間跟裡程幾乎都是相對的,或者是到三年或者到6萬公裡,都要去對變速箱進行一個全方位的保養)。
  • 編輯參考文獻為APA格式的文章時應注意的問題
    參考文獻的核對及格式統一絕對是編輯的一大糟心事。往往佔全文篇幅10%的參考文獻部分,編輯用在其上的時間要超過總編輯時間的30%,就這樣還不能保證全對,絕對是費心費力不討好的事。雖然在處理參考文獻的過程中,技術活無法取代體力活的功能,但能夠節省一點時間就儘量節省一點時間,畢竟編輯的時間是真的不夠用。以我最近遇到的兩篇採用APA格式參考文獻的文章為例吧。在我的專業社會學領域,通用的參考文獻格式是APA格式。
  • 論文參考文獻的5個關鍵問題,助力你的論文大業
    不論是寫畢業論文、職稱論文,還是競賽論文等等,都需要去查詢、閱讀大量的參考文獻、書籍,才能更好的了解自己的研究領域,從而寫出一篇不錯的具有前瞻性的論文,或者綜述性文章。而參考文獻的正確書寫格式,也是需要特別注意並加以掌握的。現將具體格式總結如下,希望對大家有所幫助。