七專家論道機器學習與模式識別的七大問題

2020-12-25 CSDN技術社區

為了更好地引導和推動我國人工智慧領域的發展,由中國人工智慧學會發起主辦,CSDN承辦的2015中國人工智慧大會(CCAI 2015)於7月26-27日在北京友誼賓館召開。本次會議的主旨是創辦國內人工智慧領域規模最大、規格最高的高水平學術和技術盛會,匯聚國內外頂級的專家學者及產業界人士,圍繞當前最新熱點和發展趨勢的話題進行交流與探討,並針對「機器學習與模式識別」「大數據的機遇與挑戰」「人工智慧與認知科學」「智慧機器人的未來」四個主題進行專題研討,努力打造國內人工智慧前沿技術和學術交流的平臺。

在7月26日下午的下午「機器學習與模式識別」分論壇環節,中科院自動化所模式識別國家重點實驗室主任劉成林、華為諾亞方舟實驗室主任李航、北京交通大學計算機科學系主任於劍、北京大學信息科學技術學院智能科學系教授查紅彬、微軟研究院首席研究員周明、京東智能通訊部總監劉丹等專家,就人工智慧的概念、深度學習、關於自然語言理解、關於圖像視頻分析、關於智能系統、關於跟蹤與堅守等七個話題各抒己見。本次分論壇由中科院自動化所研究員宗成慶主持。


中科院自動化所研究員  宗成慶

作為主持人,宗成慶提出了他最近對人工智慧的七個思考,請六位專家就其中的某問題發表自己的意見。問題如下:

1.人工智慧技術包括什麼。上世紀80-90年代,人工智慧一度「受寵若驚」,而後「臭不可聞」。30年後的今天,人工智慧再度獲得熱捧。人工智慧是否有了新的內涵?什麼是人工智慧核心內容?拋開自然語言理解、圖像視頻識別和理解、搜索算法、知識工程外,還有什麼? 

2.機器學習在不到10年時間中,遷移學習、增強學習、概率圖模型、深度學習等相繼被熱捧。而深度學習方法之前的每一種都不過持續2-3年時間便黯然失寵。無論哪一種統計學習方法都是建立在大規模測試樣本之上的模型,難以做到以一反三。現在機器學習是在正確的路上,並向正確方向發展麼? 

3.深度學習(DL)方法與人工神經網絡(ANN)方法在數學上沒有本質區別?難道僅是網絡層數的加深,那麼多少層網絡才算「夠深」? 

4.關於自然語言理解,在自然語言處理(NLP)中,很多問題都被轉化為分類問題或者序列標註問題。但不同的問題使用相同解決方法,對於不同處理任務用同一樣處理思路,自然不會得到很好的處理結果。要真正實現從「處理」到「理解」的出路何在? 

5.圖像、視頻分析作為模式識別最基礎性的問題,在邊界分割和模式匹配,檢索等方面取得了若干優秀成果。但多大程度上體現了「智能」,離「理解」還有多遠? 

6.智能系統,一個實用系統需要多種技術集成,而不是某個單項技術的結果。如無人駕駛汽車。而簡單的技術集成是否會成為「智能系統」?除了「圖靈測試」, 如何測量一個應用系統的智 能行? 

7.最後是關於跟蹤和堅守。每年技術變化都很快。有些被抬高,有的曇花一現,有的被冷落後由於硬體性能改變而在此推向波峰,甚至多次輪迴。如何在熱鬧中把握冷和熱的平衡,既保持冷靜的頭腦,又堅守自己的學術理想?


北京大學智能科學系教授、機器感知與智能教育部重點實驗室主任  查紅彬

北京大學智能科學系教授、機器感知與智能教育部重點實驗室主任查紅彬就「從深度學習中得到了什麼?還應該做些什麼」展開分享。在他看來,智能的本質是對環境自身狀態變化的一種預測的能力,他認為這中預測能力同生物進化論很相近,在已有知識和數據不充分情況下的預測。而獲得預測能力的基本途徑是學習。

學習就是人工智慧研究的核心內容。從研究進程來看,查教授將其分為物理符號主義:人為定義推理與行為規則;專家系統:手工構建專家知識庫;淺層神經網絡:簡單規整數據的學習;深度學習:利用大規模網絡數據來進行多層網絡學習四個過程。從手工操作、死記硬背到學習再到自主學習一步步的發展,但深度學習真的自主嗎?查教授認為自主學習要能自動定義學習目標,自主獲取所需數據,通過自身能力完成學習,建立社會網絡,實現知識的積累。談到自主學習的意義,查教授表示第一是解決符號接地問題,重點在於概念與意義的獲取;其次是解決框架問題,

就是如何在問題領域的界定與嘗試有所提高。這樣智能演化將會迎來智能發展的起點。最後,對於機器感知研究的重要性,查教授認為只有機器感知才能人機環境互動,進而才能自主學習,從而達到智能演化。並且查教授講到未來人工智慧還有很長的路要走。


微軟研究院首席研究員、自然語言計算組經理周明

微軟研究院首席研究員、自然語言計算組經理周明從自然語言理解的角度分享了自己對人工智慧的看法:他認為強大的需求驅動、大數據推動系統水平提升、計算能力(雲計算)、用戶自然進入了Loop,人-機有了更好的配合等,成為人工智慧新的發展機遇。技術方面來看,計算智能、記憶智能已經解決;感知智能接近實用化;認知智能(主要是自然語言理解)快速發展,比如從分詞、NER、SRL、問答等,建立了不錯的技術體系,但仍然存在與篇章、上下文、領域自適應問題;然後周明談到了自己對於機器學習和深度學習的親身體會,目前統計機器學習中用到多種技術,瓶頸轉到了數據,尤其是帶標註的數據的大規模獲取和佔用。目前同樣面臨著數據稀疏、領域遷移、訓練能力等問題。對於深度學習,周明表示深度學習對自然語言很多任務都有很好的前景,只是我們還存在著差距,並建議利用深度學習的技術來重做自然語言的各個任務,進而觀察是否會有進步。

最後他談到了自身的的一點思考,第一個是從人工智慧的角度深入研究,規則系統、模型系統如何進行融合,而不是說只是去追求某一項技術,第二個是從應用驅動的角度考慮,即人工智慧+,去做有用的技術,考慮到人的因素,追求最佳的用戶體驗而不是純粹自動化。


中科院自動化所模式識別國家重點實驗室主任劉成林

中科院自動化所模式識別國家重點實驗室主任劉成林從模式識別的角度分享了他對人工智慧的看法,包括模式識別的現狀和發展趨勢。人工智慧是一個很熱的詞,範圍很廣,最主要的是感知和認知,他表示從80年代開始模式識別和人工智慧開始融合。模式識別領域最重要的是深度學習和大數據,因為有了深度學習和大數據將模式識別的性能向前推進一大步,但模式識別的基礎理論並沒有太大的進展,理論和方法的進展得益於過去幾十年不斷的積累,歷史上即使是某一段時間比如長達十年的期間覺得這個領域沒有太大進展,實際上它的基礎理論研究還是在不斷的進行,不斷的湧現出一些新的進展。對於模式識別未來,他表示從模式識別的應用角度來看,有兩方面明顯不足,第一個是建立在大數據基礎上,在現實中需要收集大量的樣本和數據,所以門檻較高,第二模式識別和人的模式識別不一樣,還有很大的提升空間。所以,未來的模式識別還是內容的識別,以及自適應學習,小樣本學習,多模態學習,多任務協同等。對於自主學習,劉主任談到,即便是在將來談自主學習,也並不是將過去完全推翻從新來過,而是將過去的學習方法綜合起來將其應用的更好,這應該成為未來研究的趨勢。


華為諾亞方舟實驗室主任李航

華為諾亞方舟實驗室主任李航就深度學習發表了自己的看法,他認為深度學習可以給我們帶來很大的機會,雖然不一定能達到最終目標,但有可能會前進一大步。緊接著他分享了三個實例。第一是深度學習 2006年開始出現,但一直到2012年,都是第一階段。2012年-現在,深度學習進展讓人耳目一新。谷歌的DeepMind深度強化學習,以及Q- learning等,有了更強計算能力,會出現更強的機器。第二是神經網絡圖靈機的出現,可以模擬人類大腦的短期記憶,外部網絡的讀寫通過外部存儲器完成,而在存儲記憶之後,通過檢索從而執行一些有邏輯性的任務。第三是深度學習帶來了自然語言處理的很大機會。有了大數據,有了非常強大的計算機,我們就越來越強大,我們以前可能敢想不敢做的事情慢慢都有了可能。李航從另一個角度也談到不要對深度學習期望過高,因為僅靠深度學習不太可能實現和人類一樣的智能。但是深度學習很有可能能夠使得計算機變得越來越智能化,包括神經圖靈機這樣的概念,這出現基於大數據、基於網絡控制的圖靈機,進而很有可能更接近人的行為,可能更像人。這應是我們目前看到的挑戰和機遇。


北京交通大學計算機科學系主任  於劍

北 京交通大學計算機科學系主任於劍從一個老師的角度就人工智慧發表了自己的看法:他首先談到知識是什麼?這個問題嚴重製約了下一步的發展,知識的表述有框架結構和語義等,但兩個結構也不可能表示所有的知識,只是表示了部分知識。到學習階段,就無法實現自動化。對於知識圖譜,首先應該弄清楚什麼是知識,知識怎麼表示 ,他認為並沒有一個很好的途徑。另外,對於學習,通俗來說學習就是通過數據的積累,將系統的性能提高,隨著經驗的增長,知識相應提高。知識是由概念組成的。提到概念首先應該清楚命題 。而這裡很多概念是沒法明晰的定義,所以識別概念是人工智慧重要的能力,人工智慧關鍵是理論的進展,不要稀裡糊塗的就做下去。最後他表示人工智慧目前當然技術都可以研究,但是更重要的是在它的基礎問題應該更加有所突破,不要沾沾自喜於我們目前技術的進步。因為隨著時間的演化,技術總是在進步,但是更重要的就是理論的進展。


京東智能通訊部總監劉丹

京東智能通訊部總監劉丹從實踐方面主要分享了三方面:目前人工智慧(深度學習)除了圖靈測試之外有沒有更好的產品來評測,而京東做的在線智能客服機器人,通過在線用戶溝通後,給出滿意度評價,具體分析系統是否智能,從第三方數據顯示,比人工滿意度還高。

第二點人工智慧包含多方面技術,封閉式環境這類特定場景中,是可以量化評估的;例如電商領域人工智慧對問題回答滿意度,包括上下文處理方面,80%的人是對回答非常滿意,所以人工智慧目標應是特定場景裡面的應用。

第三個人工智慧對深度學習意義大不大?劉丹認為意義很大。京東智能通訊部在做知識圖譜相關東西,其中包括用戶畫像,用戶畫像不單單只是做標籤,這個人的姓名、愛好、畫像。深度學習可以做深層次的推理,得到更深層次關係,包括他的妻子,包括他的妻子有什麼愛好,包括他購買什麼東西有什麼愛好,這樣在精準營銷方面達到比較好的效果。京東通過深度學習支持的算法得到的效果是一般人工效果的2.3倍,人工就是通常講的打標籤。這塊路是最準確的,就像是做火箭的過程,做火箭不是一天兩天達到登月球的過程。這是特定的環境,通過一個領域才能達到人工智慧的極致。

更多嘉賓觀點,請關注大會直播專題(持續更新中):http://special.csdncms.csdn.net/ccai2015/。(編輯:周建丁)

本文為CSDN原創文章,未經允許不得轉載,如需轉載請聯繫market#csdn.net(#換成@)

相關焦點

  • 模式識別與機器學習(教學大綱)
    本課程全面講授模式識別與機器學習的基本概念與典型算法,以計算機視覺、自然語言處理中的問題為典型應用,培養學生對人工智慧的研究興趣,為繼續從事模式識別與機器學習方向的科學研究與工程應用打下堅實的基礎。二、課程目標通過本課程的學習,使學生掌握模式識別與機器學習領域中的基本概念和典型算法,如貝葉斯機器學習、概率圖模型、支持向量機、深度學習、聚類、強化學習等,掌握從事模式識別與機器學習研究的基本理念,提高學生綜合運用所學知識解決問題的能力,特別是對數據進行處理和分析的能力。
  • 深度學習 vs 機器學習 vs 模式識別(附:機器學習經典教材PRML《模式識別與機器學習》官方開放免費下載了
    而其中只有一小部分需要深度學習專家。我敢打賭,大多數初創公司都可以從最基本的數據分析中獲益。那如何才能發現未來的數據科學家?你需要學習他們的思考方式。三個與「學習」高度相關的流行詞彙模式識別(Pattern recognition)、機器學習(machine learning)和深度學習(deep learning)代表三種不同的思想流派。
  • 《模式識別與機器學習(PRML)》正式開放免費下載
    轉微博上愛可可老師的一則消息:【公認機器學習經典《模式識別與機器學習(PRML)》正式開放免費下載】《Pattern Recognition
  • 模式識別學科發展報告(4)丨模式識別應用技術未來重要研究問題
    模式識別是研究對數據中存在的物體、行為、現象等模式進行檢測、描述和判別的學科,是人和機器感知環境、從環境獲取知識的主要途徑。模式識別的發展緊密圍繞著三個核心要素展開,即特徵提取、建模與推理、學習與優化。
  • 大數據未來七大發展方向:物聯網、智慧城市、語音識別、人工智慧……
    近日,中國工程院院士、西南電子電信技術研究所研究員陳鯨圍繞「信息大數據深度應用發展趨勢與安全問題」展開分析。
  • 【模式識別國家重點實驗室】模式識別學科發展報告
    Nilsson發表的關於學習機器的著作(裡面主要內容是模式分類);1966年第一個以模式識別為主題的研討會;1968年發表的模式識別研究綜述;1968年國際期刊Pattern Recognition創刊;Fukunaga和Duda & Hart分別於1972年和1973年發表的模式識別經典教材。70年代是模式識別研究快速發展的一個時期,傅京孫提出句法模式識別方法並形成了理論方法體系。
  • 模式識別學科發展報告丨前言
    Nilsson發表的關於學習機器的著作(裡面主要內容是模式分類);1966年第一個以模式識別為主題的研討會;1968年發表的模式識別研究綜述;1968年國際期刊Pattern Recognition創刊;Fukunaga和Duda & Hart分別於1972年和1973年發表的模式識別經典教材。70年代是模式識別研究快速發展的一個時期,傅京孫提出句法模式識別方法並形成了理論方法體系。
  • 揭開對機器學習的七點誤解
    雷鋒網 AI 科技評論按,近日,哥倫比亞大學計算機科學專業博士生 Oscar Chang 發博闡述了關於機器學習的七個誤解這是因為,張量微積分使用了索引標識,這使得前向模式和反向模式的處理方式相同。南轅北轍的是——矩陣微積分為了標識方便而隱藏了索引,這通常會導致自動微分的表達式樹顯得過於冗雜。若有矩陣的乘法運算:C=AB。在前向模式中,有:
  • 人工智慧之機器學習ML 學習筆記乾貨
    機器學習研究領域集中於兩個範疇:(1)分類任務要求系統依據已知的分類知識對輸入的未知模式作分析,以確定輸入模式的類屬。相應的學習目標就是學習用於分類的準則(如分類規則)。(2)問題求解任務要求對於給定的目標狀態,尋找一個將當前狀態轉換為目標狀態的動作序列;機器學習在這一領域的研究工作大部分集中於通過學習來獲取能提高問題求解效率的知識(如搜索控制知識,啟發式知識等)。
  • 模式識別與人工智慧「十二五」規劃戰略研討會召開
    由國家自然科學基金委員會信息科學部自動化處主辦,模式識別國家重點實驗室承辦的「模式識別與人工智慧」領域發展戰略研討會於6月11日在北京召開。戴汝為院士、張鈸院士、陸汝鈐院士等30餘位該領域的知名專家學者參加了會議。中科院自動化所副所長徐波代表自動化所致歡迎辭。
  • 諾亞方舟實驗室李航:深度學習還局限在複雜的模式識別上
    儘管深度學習目前還停留在「複雜的模式識別(pattern recognition)」層面上,但它仍是最有效的方法,會極大推動人工智慧的進步。「如果把實現人工智慧的理想比喻為登月,那麼有些方法看起來好像是在爬樹、在登山,基本不可行,而深度學習的方法好像是在做火箭,它至少能把我們帶出地球大氣圈,雖然可能還不能達到登月的目的。」他說。
  • 模式識別與機器學習(教學大綱)|向量|貝葉斯|算法|神經網絡_網易訂閱
    以貝葉斯學習思想貫穿始終,並適時與其他重要知識點(如支持向量機、深度學習)等進行交叉和關聯,便於讀者在形成良好知識體系的同時保持對整個領域知識的把握。  全書共14章和4個附錄,循序漸進地剖析模式識別與機器學習領域。
  • 模式識別:人類和機器學習的基礎
    人類和動物藉助感官進行學習。學習有助於識別和分辨我們周圍的模式。模式識別的過程包括將接收到的信息與大腦中已經儲存的信息進行匹配。把記憶和感知到的信息聯繫起來是模式識別的一個名為識別的步驟。模式識別需要重複經驗。迄今為止,所有發現和發明都是人類模式識別技能的結果。人類傾向於在各處看到模式。當進行比較,判斷和獲取知識時,它們很重要。尋找模式非常重要。
  • 機器學習訓練中常見的問題和挑戰!
    一、訓練數據的數量不足要教一個牙牙學語的小朋友什麼是蘋果,你只需要指著蘋果說「蘋果」(可能需要重複這個過程幾次)就行了,然後孩子就能夠識別各種顏色和形狀的蘋果了,簡直是天才!機器學習還沒達到這一步,大部分機器學習算法需要大量的數據才能正常工作。
  • 模式識別
    發展歷程早期的模式識別研究著重在數學方法上。20世紀50年代末,F.羅森布拉特提出了一種簡化的模擬人腦進行識別的數學模型——感知器,初步實現了通過給定類別的各個樣本對識別系統進行訓練,使系統在學習完畢後具有對其他未知類別的模式進行正確分類的能力。1957年,周紹康提出用統計決策理論方法求解模式識別問題,促進了從50年代末開始的模式識別研究工作的迅速發展。
  • 重磅| 谷歌大腦養成記:從識別貓到突破性機器翻譯
    誘人的七位數年薪並非罕見。參加這一領域最重要的學術會議的人員已經翻了四倍。利害攸關的不僅是漸進創新,還要控制住能夠代表未來全新計算平臺的東西:無處不在的人工智慧。Part 1:學習的機器1. 大腦的誕生雖然 Jeff Dean 的職稱是高級研究員(senior fellow),但卻是谷歌大腦實際上的負責人。
  • 模式識別70年,學科發展報告基礎篇
    (模式識別問題是指對過程或事件的分類和/或描述。過程或事件可以是物理上的物體或抽象的事件如精神狀態。具有相似特點的過程或事件組成類別)。這個定義對模式識別的技術(分類、描述)和模式、類別都表達的非常明確。
  • 模式識別學科發展報告丨三、模式識別應用技術重要研究進展
    模式識別是人工智慧領域的一個重要分支。人工智慧通過計算使機器模擬人的智能行為,主要包括感知、推理、決策、動作、學習,而模式識別主要研究的就是感知行為。在人的五大感知行為(視覺、聽覺、嗅覺、味覺、觸覺)中,視覺、聽覺和觸覺是人工智慧領域研究較多的方向。模式識別應用技術主要涉及的就是視覺和聽覺,而觸覺則主要與機器人結合。
  • 圖像識別與人工智慧圖像識別和機器視覺有什麼區別
    人工智慧領域發展到現在,ai與人工智慧、圖像識別領域、計算機視覺領域等近年來越來越多的整合和融合。首先,人工智慧在生活工作中將普遍應用;其次,人工智慧在不同的工作場景都有其應用,從金融到醫療,從服務到工廠,應用無處不在;最後,人工智慧正在與自動駕駛技術等聯繫在一起。
  • 模式識別、機器學習傻傻分不清?給我三分鐘!
    模式識別從十九世紀五十年代興起,在二十世紀七八十年代風靡一時,是信息科學和人工智慧的重要組成部分,主要被應用於圖像分析與處理、語音識別、聲音分類、通信、計算機輔助診斷、數據挖掘等方面。這就屬於人類對於模式的識別,這種技能對於人們甚至是一些動物來說,是非常簡單而且幾乎是與生俱來的。但是在模式識別中,機器似乎並不如人們所預料的那樣「智能」。這種經由人為提取特徵後交給機器,然後讓機器去判斷其它事的屬性的工作流程就像是按圖索驥,按照這種方法,雖然有可能找到一匹真正的汗血寶馬,但是也有可能找回一隻滿身惡臭的瘌蛤蟆。