今天的卷積網絡,Yann LeCun在93年就已經玩得很溜了

2021-01-11 澎湃新聞

原創 Synced 機器之心

機器之心報導

作者:澤南、張倩

卷積神經網絡的成功是否超出了其發明者的想像?Yann LeCun 說:「是的,我們一直在嘗試更加瘋狂的寫法,而它的進步卻從未中斷過。」

手寫數字識別是很多人入門神經網絡時用來練手的一個項目,但就是這麼簡單的一個項目,最近在 reddit 上又火了一把,因為在 MIT 計算機科學和人工智慧實驗室,有人挖到了一個「祖師爺」級別的視頻……

這段視頻錄製於 1993 年,主人公是圖靈獎得主 Yann LeCun(楊立昆)。彼時 LeCun 才 32 歲,剛剛進入貝爾實驗室工作,而視頻裡機器學習識別的第一段數字 201-949-4038,是 LeCun 在貝爾實驗室裡的電話號碼。

從這段視頻中我們可以看到,LeCun 在 90 年代初創造的文本識別系統已經達到了驚人的速度和準確率,這在當時的條件下是非常難能可貴的。

這段視頻由貝爾實驗室自適應系統研究部門主任 Larry Jackel 拍攝(Larry 當時是 LeCun 的 boss,現任英偉達自動駕駛顧問)。視頻中出鏡的還有實驗室負責人 Rich Howard(Larry 的 boss)和研究工程師 Donnie Henderson。Yann LeCun 本人表示:「Donnie Henderson 將整個演示系統整合在了一起…… 整套系統在算力為 20MFLOPS 的 DSP 版上運行。」

幾位工程師在視頻中洋溢的笑容也頗具感染力。

LeCun 表示,1993 年的文字識別系統已經用上了卷積神經網絡(CNN),自己在這套系統中編寫了一種網絡數據結構的編譯器,並生成了可編譯的 C 語言代碼,在原始碼中以權重和網表(netlist)代表文字。

這段視頻的驚豔之處還在於,它比經典手寫數字數據集 MNIST 的問世還要早 6 年。

其實,早在 1989 年,LeCun 就已經發表了「將反向傳播用於手寫郵政編碼識別」的相關研究,而且已經在美國的郵政系統中成功應用。隨後,這一系統的應用範圍擴展至銀行支票。90 年代末期,該系統已經處理了美國 10%-20%的支票識別。

1999 年,LeCun 等人聯合發表了「MNIST」手寫數字數據集。這一數據集包含數萬個樣本,被稱為「計算機視覺領域的 hello world 數據集」、「機器學習界的果蠅」,如今已經作為基準被使用了二十餘年。

在看了這段視頻之後,有研究者感嘆,「不要再抱怨 GPU 算力不夠了」。

深度學習先驅 Yann LeCun

說起 Yann LeCun,熟悉人工智慧領域的人肯定不會陌生,Yann LeCun 現在是紐約大學教授、美國工程院院士、Facebook 副總裁和首席 AI 科學家。

在深度學習還未流行的 20 世紀八九十年代,LeCun 與另兩位先驅者 Yoshua Bengio、Geoffrey Hinton 一道探索了深度學習領域的概念基礎,並通過實驗向人們展示了新方法的前景。此外,他們還貢獻了一系列工程進展,展示了深度神經網絡的實用優勢。

雖然在二十世紀八十年代,研究者就開始試用人工神經網絡幫助計算機識別模式、模擬人類智能,但直到二十一世紀的前幾年,這種方式仍未獲得廣泛認同,LeCun 等研究者試圖重燃 AI 社區對神經網絡興趣的努力曾經一直被人們質疑,但如今他們的想法帶來了重大的技術進步,他們的方法也已成為該領域的主導範式。

自 2012 年以來,深度學習方法促進計算機視覺、語音識別、自然語言處理和機器人技術等應用領域取得極大突破。

在 2019 年,美國計算機協會 ACM 公布了上一年度的圖靈獎,Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun 三位深度學習巨頭同時獲獎。

從左至右:Yoshua Bengio、Geoffrey Hinton、Yann LeCun。

ACM 表示,Yann LeCun 主要作出了三大貢獻:

提出卷積神經網絡

改進反向傳播算法

拓寬神經網絡的視角

20 世紀 80 年代後期,LeCun 就職於多倫多大學和貝爾實驗室,也是在這一時期,他利用手寫數字圖像訓練了第一個卷積神經網絡系統。如今,卷積神經網絡已成為計算機視覺、語音識別、語音合成、圖像合成和自然語言處理領域的行業標準。卷積神經網絡有著廣泛的應用,如自動駕駛、醫學圖像分析、語音助手和信息過濾等。

這可不是搞定 MNIST 那麼簡單

與我們通常為 MINIST 數據集構建文字識別系統不同,Yann LeCun 在 1993 年展示的技術可是用攝像頭直接拍攝的,還需要搞定文字縮放、位置等問題,後來也確實在郵政系統裡獲得了應用。

如此看來在當年就能實現這樣的效果確實不容易,更何況在 20 世紀 90 年代,研究者們是沒有 TensorFlow 可用的,全靠 C 語言手寫,這個問題求解的非機器學習部分與其說是困難,不如說是繁瑣。

在社交網絡中,人們對 LeCun 展示的算法除了感興趣,還有讚譽和膜拜,有人說道:「這並不是說他們在 1993 年就解決了 MNIST 上的問題,比那還要更進一步。」

在深度學習被 GPU 帶動開展大規模應用以前,人工智慧算法其實已經實現了相當的聰明程度。在 1993 年的文字識別之後,昨天,人們又挖出了 LeCun 參與的另一項研究:人臉檢測。

在 2003 年,一個視頻展示了 Rita Osadchy、Matt Miller 以及 Yann LeCun 等人在 NEC 實驗室的研究,使用卷積神經網絡進行人臉檢測研究。

雖然只是人臉檢測而不是人臉識別,但這種技術的意義不言而喻,如今自動駕駛汽車上的障礙物檢測方法使用的就是和它相同的技術。在推特上,LeCun 也點讚了這段視頻。

看來,如今我們在機器學習領域廣泛使用的方法,早在幾十年前就已完成了整體架構。

不過與此同時,也有網友發出了直擊靈魂的提問:「既然 LeCun 在 1993 年就可以讓 AI 這樣識別文字了,為啥直到今天大多數網站仍然認為文字驗證碼是識別機器人的好辦法?」

參考連結:

https://twitter.com/MIT_CSAIL/status/1347237563342340097

https://www.reddit.com/r/MachineLearning/comments/kuc6tz/d_a_demo_from_1993_of_32yearold_yann_lecun/

© THE END

轉載請聯繫本公眾號獲得授權

投稿或尋求報導:content@jiqizhixin.com

原標題:《今天的卷積網絡,Yann LeCun在93年就已經玩得很溜了》

閱讀原文

相關焦點

  • 深度學習先驅Yann LeCun被罵退推特:你們都很懂,從此我不說話了
    「我請求社交網絡上的所有人不要再互相攻擊了,特別是對於 Timnit Gebru 的攻擊,以及對於我之前一些言論的攻擊。」Yann LeCun 剛剛在推特上發出了這樣的呼籲。「無論是口頭還是其他方式的衝突,都只能獲得傷害和相反的結果。我反對一切形式的歧視。這裡有一篇關於我核心價值觀的文章。」
  • 變形卷積核、可分離卷積?卷積神經網絡中十大拍案叫絕的操作。
    1×1卷積核也被認為是影響深遠的操作,往後大型的網絡為了降低參數量都會應用上1×1卷積核。五、越深的網絡就越難訓練嗎?-- Resnet殘差網絡>傳統的卷積層層疊網絡會遇到一個問題,當層數加深時,網絡的表現越來越差,很大程度上的原因是因為當層數加深時,梯度消散得越來越嚴重,以至於反向傳播很難訓練到淺層的網絡。
  • 從圖(Graph)到圖卷積(Graph Convolution):漫談圖神經網絡 (二)
    在從圖(Graph)到圖卷積(Graph Convolution): 漫談圖神經網絡 (一)中,我們簡單介紹了基於循環圖神經網絡的兩種重要模型,在本篇中,我們將著大量筆墨介紹圖卷積神經網絡中的卷積操作。接下來,我們將首先介紹一下圖卷積神經網絡的大概框架,藉此說明它與基於循環的圖神經網絡的區別。
  • 混合時空圖卷積網絡:更精準的時空預測模型
    域轉換器 域轉換器 由串聯的兩層網絡組成,即逐路段 卷積(segmentwise convolution)和路段間共享 卷積(shared
  • 今日Paper | CausalML;隱式函數;慢動作視頻重建;交叉圖卷積網絡等
    >交叉圖卷積網絡(Cross-GCN):使用k順序特徵交互來增強圖卷積網絡選擇核網絡  CausalML:用於因果機器學習的Python包論文名稱:CausalML:from=leiphonecolumn_paperreview0318推薦原因本文主要內容:本文提出了一種新的機器學習算法包——CausalML,這是一種採用ython語言編寫而成用於解決因果推理(causalinference)與機器學習(machine learning)任務的算法,並且已經封裝成型
  • NeurIPS 2020最佳論文;全卷積網絡實現E2E目標檢測
    所以,在本文中,來自曠視科技和西安交通大學的研究者提出了一個新穎問題:全卷積網絡是否可以實現良好的端到端目標檢測效果?並從標籤分配和網絡架構兩個方面回答並驗證了這一問題。推薦:原來,丟棄 Transformer,全卷積網絡也可以實現 E2E 檢測。
  • 德克薩斯A&M大學在讀博士遊宇寧:自監督學習在圖卷積網絡中的研究...
    當前自監督學習已經被廣泛用於訓練卷積神經網絡(CNNs),有效地提高了圖像表示學習可傳遞性、泛化能力和魯棒性,並且已在語義分割、目標檢測、圖像分類、人體動作識別等實戰場景中展現出卓越效果。現在更多無需人工標註的前置任務訓練也被提出,如前景對象分割、圖像修補、圖像著色等。然而,自監督如何應用於處理圖數據結構的圖卷積網絡(GCNs)的問題卻很少被探索。
  • Reddit熱議:AI教父Yann LeCun提出的「能量模型...
    另外,還有一位網友透露,最近3-4年很多專家都對它很著迷,他們認為基於能量的模型是深度學習的『未來』。那麼,代表ML未來的『能量模型』到底是什麼?2019年11月,LeCun代表Facebook參加了《Using Physical Insights for Machine Learning》主題研討會,並發表了名為《基於能量的自監督學習(Energy-Based Self-Supervised Learning)》的主題演講。
  • 遊戲想要玩得溜?囉嗦唐僧親自唱《Only you》給你聽
    暌違22年,大話西遊唐僧扮演者羅家英再度唱響《Only you》,而這次翻唱版本卻叫《Only 6》。近日,由京東商城聯手酷派手機,邀請「囉嗦唐僧」羅家英出演遊戲手機酷玩六上市短片《Only 6》,重製搞笑上映,一時間引起諸多網友請求「唐僧」施法念咒加持遊戲體驗。
  • 用於視頻回歸任務的長期循環卷積網絡
    2、3d CNN這種方法背後的邏輯非常直觀,因為卷積中的第三維可以對應於時間域,從而可以直接從一個網絡學習時空特徵。3、長期循環卷積網絡(LRCN)2016年,一組作者提出了用於視覺識別和描述的端到端可訓練類架構。
  • 丟棄Transformer,全卷積網絡也可以實現E2E檢測
    機器之心轉載作者:王劍鋒在近來研究人員熱衷於探索 Transformer 用於目標檢測的嘗試時,這篇論文提出了一種全新的觀點,即利用全卷積網絡也可以實現良好的端到端目標檢測效果。所以,在本文中,來自曠視科技和西安交通大學的研究者提出了一個新穎問題:全卷積網絡是否可以實現良好的端到端目標檢測效果?並從標籤分配和網絡架構兩個方面回答並驗證了這一問題。
  • 標籤縫紉精通 列印跨界玩得溜
    2020年11月23-25日,中國現代辦公年會(以下簡稱COAA年會)在南昌盛大開幕。雖然大家了解兄弟品牌都是從印表機產品開始,但是實際上兄弟也有不少跨界產品,在商務辦公、生活時尚等多個領域玩得也挺溜。
  • 通俗的解釋卷積神經網絡
    這引發了堆疊的卷積層,它包含將每個神經元的視線限定在輸入圖像的一小塊地區。接管域的大小由過濾器的大小給出,也稱為內核大小。當濾波器在圖像中滑動時,它的兼職道理就像燈號處分中的卷積,所以它容許特性檢驗。卷積是一個積分,顯露一個函數(核函數或濾波器)在另一個函數(輸入)上移位時的重疊量。
  • 深蘭科技動作識別-人體骨架時空圖卷積網絡的可學習邊與權
    本文將重點介紹論文中關於動作識別的時空圖卷積的可學習邊與權重,及其劃分策略。一、空間圖卷積神經網絡在深入研究成熟的ST-GCN之前,團隊首先要在一個幀內查看Graph CNN模型。而通過在p(x)中編碼矩形網格,可以實現圖像域上的標準卷積,在(Dai et al.2017)中找到該構思的更詳細的說明和其他應用。圖一然後,定義圖上的卷積操作:通過將以上形式擴展到把輸入特徵圖換成採用空間圖V_t的方式。
  • 曠視出品:丟棄Transformer,全卷積網絡也可以實現端到端的目標檢測
    來源 | 知乎專欄作者 | 王劍鋒編輯 | 青暮目前主流的基於全卷積網絡的目標檢測器儘管性能優越為此,對於全卷積檢測器,研究者引入了預測感知的一對一(POTO)標籤分配進行分類,以實現端到端檢測,並獲得了與NMS相當的性能。此外,他們還提出了一種簡單的3D最大濾波(3DMF),以利用多尺度特徵並提高局部區域卷積的可分辨性。藉助這些技術,其端到端框架在COCO和CrowdHuman數據集上可以與許多最先進的使用NMS的檢測器相媲美。
  • 《非人學園》卷積突破攻略 活動玩法分享
    非人學園卷積突破將在今日維護更新後開啟,那麼該怎麼玩呢?下面就給大家帶來了非人學園卷積突破活動介紹,希望能夠幫助到大家了解。披著遊戲的外衣,【卷積突破】背後究竟隱藏著怎樣的秘密呢?外表光鮮卻暗藏殺機的電玩都市,等待著銀角的會是什麼呢?   非人學園假期全新副本【Eii·卷積突破】正式開啟,跟隨銀角一起揭開電玩都市的秘密吧!
  • 古谷徹你玩得太溜了~化名蒼月升踏入BL廣播劇的陣營!
    古谷徹你玩得太溜了~化名蒼月升踏入BL廣播劇的陣營! 但沒過多久,以這個化名而行動的他在09年就突然宣布隱退。直到在13年的劇場版動畫「世界第一初戀~橫澤隆史的場合~」中配音桐島禪而再次出現在粉絲面前。
  • 2020最佳博士論文;南開等提出新型自校準卷積
    機器之心 & ArXiv Weekly Radiostation參與:杜偉、楚航、羅若天本周的重要論文包括 SIGGRAPH 2020 最佳博士論文,以及南開大學等提出的自校準卷積和相應網絡。
  • ...沒有攻擊性的器官很重要嗎,很多攻擊性的事物,我們還是玩得很溜...
    小編覺得通訊公司在每個地方的市區有這麼大的樓肯定是有道理的,否則也不會建在那裡,畢竟裡面要有人工辦理業務的地方,還得有人工客服、伺服器、散熱設備、辦公室、員工宿舍等等,也難怪要有這麼大的辦公場所了,感覺這些東西加起來也是需要很大地方的,大家覺得是為什麼呢?
  • 73歲諾獎得主、WLA副主席萊維特:我智慧型手機玩得很溜
    73歲諾獎得主、WLA副主席萊維特:我智慧型手機玩得很溜 2020-10-22 06:53 來源:澎湃新聞·澎湃號·湃客