什麼是小樣本學習?這篇綜述文章用166篇參考文獻告訴你答案

2020-11-28 機器之心Pro

機器之心報導

參與:魔王

什麼是小樣本學習?它與弱監督學習等問題有何差異?其核心問題是什麼?來自港科大和第四範式的這篇綜述論文提供了解答。

數據是機器學習領域的重要資源,在數據缺少的情況下如何訓練模型呢?小樣本學習是其中一個解決方案。來自香港科技大學和第四範式的研究人員綜述了該領域的研究發展,並提出了未來的研究方向。

這篇綜述論文已被 ACM Computing Surveys 接收,作者還建立了 GitHub repo,用於更新該領域的發展。

論文地址:https://arxiv.org/pdf/1904.05046.pdf

GitHub 地址:https://github.com/tata1661/FewShotPapers

機器學習在數據密集型應用中取得了很大成功,但在面臨小數據集的情況下往往捉襟見肘。近期出現的小樣本學習(Few-Shot Learning,FSL)方法旨在解決該問題。FSL 利用先驗知識,能夠快速泛化至僅包含少量具備監督信息的樣本的新任務中。

這篇論文對 FSL 方法進行了綜述。首先,該論文給出了 FSL 的正式定義,並釐清了它與相關機器學習問題(弱監督學習、不平衡學習、遷移學習和元學習)的關聯和差異。然後指出 FSL 的核心問題,即經驗風險最小化方法不可靠。

基於各個方法利用先驗知識處理核心問題的方式,該研究將 FSL 方法分為三大類:

數據:利用先驗知識增強監督信號;

模型:利用先驗知識縮小假設空間的大小;

算法:利用先驗知識更改給定假設空間中對最優假設的搜索。

最後,這篇文章提出了 FSL 的未來研究方向:FSL 問題設置、技術、應用和理論。

論文概覽

該綜述論文所覆蓋的主題見下圖:

我們選取介紹了該綜述論文中的部分內容,詳情參見原論文。

什麼是小樣本學習?

FSL 是機器學習的子領域。

我們先來看機器學習的定義:

電腦程式基於與任務 T 相關的經驗 E 學習,並得到性能改進(性能度量指標為 P)。

基於此,該研究將 FSL 定義為:

小樣本學習是一類機器學習問題,其經驗 E 中僅包含有限數量的監督信息。

下圖對比了具備充足訓練樣本和少量訓練樣本的學習算法:

FSL 方法分類

根據先驗知識的利用方式,FSL 方法可分為三類:

FSL 方法解決少樣本問題的不同角度。

基於此,該研究將現有的 FSL 方法納入此框架,得到如下分類體系:

數據

此類 FSL 方法利用先驗知識增強數據 D_train,從而擴充監督信息,利用充足數據來實現可靠的經驗風險最小化。

如上圖所示,根據增強數據的來源,這類 FSL 方法可分為以下三個類別:

模型

基於所用先驗知識的類型,這類方法可分為如下四個類別:

算法

根據先驗知識對搜索策略的影響,此類方法可分為三個類別:

文章最後從問題設置、技術、應用和理論四個層面探討了小樣本學習領域的未來發展方向。

相關焦點

  • 關於文獻綜述,這篇文章說透了!
    與此同時,也就構成了文獻評論的一個主要切入點。 三是樣本局限。在教育類的實證研究中,即使再怎麼完善或大型的抽樣,總是存在著樣本局限的某些缺陷。也就是說,總是存在著被遺漏的樣本。而這恰恰就給了你進一步研究的空間和機會。 四是研究方法或工具局限。
  • 清華張長水等人30頁少樣本學習綜述論文,涵蓋400+參考文獻
    選自arXiv作者:張長水等機器之心編譯編輯:魔王這篇綜述文章回顧了少樣本學習(FSL)的演進歷史和當前進展,對 FSL 方法進行了層次分類,並總結了近期多個 FSL 擴展性主題及其最新進展
  • 我整理了三百多篇論文,得出了寫文獻綜述的這些經驗
    俗話說,「看豬跑不如吃豬肉」,當然這不是一句俗話,但是文獻綜述這種東西,即使我看過一些不同的經驗貼,到自己真正去下筆的時候,才發現一切都不像自己想得那麼簡單。上學期有一門課,老師專門提出期末作業是每人一篇文獻綜述,題材自選,於是從這門課程開設一半的時候,我就開始著手準備,在這個過程中,我自己總結出了一些小技巧和小問題。
  • 開題報告文獻綜述寫不好?這篇文章談技巧!
    從結構上看,主要是由四部分組成:1.文獻綜述,2.研究思路、研究方法及手段,3.參考文獻,4.進度安排。其中文獻綜述是開題報告中的最重要部分。文獻綜述文獻綜述是研究者在提前閱讀過某一主題的文獻後,經過理解、整理、融會貫通,綜合分析和評價概括出同類課題若干文章的基本事實、基本觀點和方法而組成的一種不同於研究論文的文體。
  • 論文寫作之如何搞定文獻綜述
    文獻綜述反映當前某一領域中某分支學科或重要專題的歷史現狀、最新進展、學術見解和建議,它往往能反映出有關問題的新動態、新趨勢、新水平、新原理和新技術等等。文獻綜述是針對某一研究領域分析和描述前人已經做了哪些工作,進展到何程度,要求對國內外相關研究的動態、前沿性問題做出較詳細的綜述,並提供參考文獻。作者一般不在其中發表個人見解和建議,也不做任何評論,只是客觀概括地反映事實。
  • 10分鐘學會文獻綜述的5個方法!
    ,青少年(限定詞2,這一選題的研究對象是什麼?),成就動機(限定詞3,這一選題的研究變量是什麼?)。這樣一來,我們就可以很快地明確,自己所要做的文獻綜述所處的大領域和子領域是什麼,可以為之後的文獻搜索工作打好基礎。
  • 論文文獻綜述怎麼寫
    他的這個五步文獻綜述法倒還真的值得學習和借鑑。克雷斯威爾認為,文獻綜述應由五部分組成:即序言、主題1(關於自變量的)、主題2(關於因變量的)、主題3(關於自變量和因變量兩方面闡述的研究)、總結。(1)序言 告訴讀者文獻綜述所涉及的幾個部分,這一段是關於章節構成的陳述。(2)綜述主題1 提出關於「自變量或多個自變量」的學術文獻。
  • 如何閱讀文獻、整理文獻綜述?通讀文章前你需要準備這些
    閱讀文獻,整理文獻綜述可以說是每一個學寫論文的研究生必不可少的技能,那麼,到底應該怎麼讀文獻呢?看看下面的技巧能不能幫到你~一、選擇高質量的文獻現在,很多資料庫都對我們開放,檢索文獻變得十分方便。但是文獻的質量良莠不齊,那怎麼選擇查找質量相對較高的文獻呢?在檢索時,縮小範圍。
  • 一篇高引用的綜述文章是如何寫成的
    因此,找幾篇綜述文章看看就可以了。此處的全面是指多換幾個關鍵詞檢索和多換幾個資料庫檢索。先說關鍵詞,每個作者傾向的關鍵詞不同,而且新興領域還沒有約定俗成的術語時,更需要多換幾個關鍵詞了。再說資料庫,因為每個資料庫收錄的期刊都是不全面的,這裡重要的檢索工具必不可少。  還有兩個小技巧來獲得相關文獻。一是所讀文章中引用的文獻,這個好理解,文後的參考文獻就是。
  • 文獻綜述的主要特點以及內容要求
    一、什麼是文獻綜述文獻綜述是對某一學科、專業或專題的大量文獻進行整理篩選、分析研究和綜合提煉而成的一種學術論文,是高度濃縮的文獻產品。根據其涉及的內容範圍不同,綜述可分為綜合性綜述和專題性綜述兩種類型。所謂綜合性綜述是以一個學科或專業為對象,而專題性綜述則是以一個論題為對象的。
  • 這篇文章給你科普!
    選題報告一般包含研究背景、研究現狀與意義、研究內容目標與思路、已有研究成果、研究計劃和參考文獻列表等內容。 選題報告是進一步開展工作的前提,因此其寫作質量要求不亞於最終的學位論文。
  • 這篇文章會告訴你答案
    這篇文章會告訴你答案大家好我是你們的小熊,四隻腳的熊,今天下編要給大家介紹的是如何才能製作乾冰冰淇淋?用二氧化碳滅火器製造的冰激凌是完全可食用的,只是不要吃那些有可能夾在冰激凌中的硬塊,那可能是遺留的乾冰。這是什麼原理呢?液體蒸發的時候會變冷。例如,當一個人身上被弄溼的時候會感覺很冷。
  • 到底什麼是"氣溶膠"?看完這篇文獻綜述你就明白了
    看完這篇文獻綜述你就明白了) 中國國家衛生健康委員會日前發布的《新型冠狀病毒感染的肺炎診療方案(試行第五版)》中,對於病毒傳播途徑的描述,除「經呼吸道飛沫和接觸傳播是主要的傳播途徑」外,新補充了「氣溶膠和消化道等傳播途徑尚待明確」。
  • 文獻綜述類論文寫作秘籍
    最後必須指出的是,在我們搜集文獻的過程中,肯定會發現一些現成的、與我們要寫的文章相似的綜述文章。我們可以借鑑這些文章的內容(最重要的是這些文章的參考文獻清單)來縮短我們搜集、理解和閱讀原始文獻的過程,但切不可如獲至寶,投機取巧地照抄這些現成的綜述文章,而根本不看原始文獻,這是目前錯訛屢屢出現的根源,也違背了學術研究求真務實的精神。
  • 因一篇參考文獻被撤稿,這篇Meta分析也打算撤回稿件
    Heneghan教授告訴Retraction Watch,當他的團隊獲知NEJM的撤稿消息後,馬上就提出要求撤回這篇Meta分析:系統評價不應包含已被撤稿的數據,一旦發現納入了被撤稿的研究,應立即採取行動。通過這篇Meta分析的撤稿,我意識到,以後發表文章先通過撤稿資料庫進行審核至關重要。期刊在發表時也應做類似的審核,就像會審核是否存在抄襲問題一樣。
  • 你知道嗎?很多eccDNA研究都是參考這篇文章
    圖1 eccDNA在酵母基因組上的分布這篇文章不僅首次在全基因組水平上報導了用DNA外切酶消化線性DNA,獲取純的環狀DNA;3、採用ϕ29DNA聚合酶滾換擴增eccDNA;4、超聲打斷處理後構建二代測序文庫並進行測序。
  • 論文文獻綜述是什麼?怎麼寫?看完你就知道了!
    要畢業了好開心哦,但是呢,即將畢業的各位同學,先別急著高興哦~還有畢業論文在等著你呢~那麼怎麼寫畢業論文呢?畢業論文一般要包括這些內容:摘要、緒論、文獻綜述、正文、結語等等,那今天我們就來詳細講解文獻綜述吧!論文文獻綜述是什麼呢?怎麼寫呢?下面就一一為你解答!一、文獻綜述是什麼?
  • 小樣本學習(Few-shot Learning)綜述
    創新總是基於對已有成果的梳理和思考,這篇綜述算是一個小結,寫出來和大家一起分享,一起討論。問題定義人類非常擅長通過極少量的樣本識別一個新物體,比如小孩子只需要書中的一些圖片就可以認識什麼是「斑馬」,什麼是「犀牛」。在人類的快速學習能力的啟發下,研究人員希望機器學習模型在學習了一定類別的大量數據後,對於新的類別,只需要少量的樣本就能快速學習,這就是 Few-shot Learning 要解決的問題。
  • 如何寫文獻綜述?
    不管是本科畢業論文還是碩士畢業論文,都要寫文獻綜述,文獻綜述是對所引用文獻的綜合評述,通過參考文獻確定選題方向,確定選題後廣泛閱讀與選題相關的參考文獻,通過自身的主觀理解和研究水平對所收集到的文獻進行綜合分析,從而提出自己的見解和研究思路。
  • 寫好研究生期間的第一篇綜述,這幾點你應該要注意!
    研一剛入學的我們,科研思維啟蒙工作正式開始,了解論文類型、學習寫作技巧、查找閱讀文獻、總結記錄觀點……一學期的理論學習後,我們開始摩拳擦掌、躍躍欲試,天真的認為不需實驗研究,只需整理分析資料的綜述類文章最適合我們,但其實一篇好的綜述是承前啟後的醫學論文,其價值不低於研究類文章。如果把研究類文章比喻為一顆顆珍珠,綜述則是用金線把他們串起來的項鍊。