為了更好地引導和推動我國人工智慧領域的發展,由中國人工智慧學會發起主辦,CSDN承辦的2015中國人工智慧大會(CCAI 2015)於7月26-27日在北京友誼賓館召開。本次會議的主旨是創辦國內人工智慧領域規模最大、規格最高的高水平學術和技術盛會,匯聚國內外頂級的專家學者及產業界人士,圍繞當前最新熱點和發展趨勢的話題進行交流與探討,並針對「機器學習與模式識別」、「大數據的機遇與挑戰」、「人工智慧與認知科學」和「智慧機器人的未來」四個主題進行專題研討,努力打造國內人工智慧前沿技術和學術交流的平臺。
在7月26日下午的下午「機器學習與模式識別」分論壇環節,中科院自動化所模式識別國家重點實驗室主任劉成林、華為諾亞方舟實驗室主任李航、北京交通大學計算機科學系主任於劍、北京大學信息科學技術學院智能科學系教授查紅彬、微軟研究院首席研究員周明、京東智能通訊部總監劉丹等專家,就人工智慧的概念、深度學習、關於自然語言理解、關於圖像視頻分析、關於智能系統、關於跟蹤與堅守等七個話題各抒己見。本次分論壇由中科院自動化所研究員宗成慶主持。
中科院自動化所研究員 宗成慶
作為主持人,宗成慶提出了他最近對人工智慧的七個思考,請六位專家就其中的某問題發表自己的意見。問題如下:
1.人工智慧技術包括什麼。上世紀80-90年代,人工智慧一度「受寵若驚」,而後「臭不可聞」。30年後的今天,人工智慧再度獲得熱捧。人工智慧是否有了新的內涵?什麼是人工智慧核心內容?拋開自然語言理解、圖像視頻識別和理解、搜索算法、知識工程外,還有什麼?
2.機器學習在不到10年時間中,遷移學習、增強學習、概率圖模型、深度學習等相繼被熱捧。而深度學習方法之前的每一種都不過持續2-3年時間便黯然失寵。無論哪一種統計學習方法都是建立在大規模測試樣本之上的模型,難以做到以一反三。現在機器學習是在正確的路上,並向正確方向發展麼?
3.深度學習(DL)方法與人工神經網絡(ANN)方法在數學上沒有本質區別?難道僅是網絡層數的加深,那麼多少層網絡才算「夠深」?
4.關於自然語言理解,在自然語言處理(NLP)中,很多問題都被轉化為分類問題或者序列標註問題。但不同的問題使用相同解決方法,對於不同處理任務用同一樣處理思路,自然不會得到很好的處理結果。要真正實現從「處理」到「理解」的出路何在?
5.圖像、視頻分析作為模式識別最基礎性的問題,在邊界分割和模式匹配,檢索等方面取得了若干優秀成果。但多大程度上體現了「智能」,離「理解」還有多遠?
6.智能系統,一個實用系統需要多種技術集成,而不是某個單項技術的結果。如無人駕駛汽車。而簡單的技術集成是否會成為「智能系統」?除了「圖靈測試」, 如何測量一個應用系統的智 能行?
7.最後是關於跟蹤和堅守。每年技術變化都很快。有些被抬高,有的曇花一現,有的被冷落後由於硬體性能改變而在此推向波峰,甚至多次輪迴。如何在熱鬧中把握冷和熱的平衡,既保持冷靜的頭腦,又堅守自己的學術理想?
北京大學智能科學系教授、機器感知與智能教育部重點實驗室主任 查紅彬
北京大學智能科學系教授、機器感知與智能教育部重點實驗室主任查紅彬就「從深度學習中得到了什麼?還應該做些什麼」展開分享。在他看來,智能的本質是對環境自身狀態變化的一種預測的能力,他認為這中預測能力同生物進化論很相近,在已有知識和數據不充分情況下的預測。而獲得預測能力的基本途徑是學習。
學習就是人工智慧研究的核心內容。從研究進程來看,查教授將其分為物理符號主義:人為定義推理與行為規則;專家系統:手工構建專家知識庫;淺層神經網絡:簡單規整數據的學習;深度學習:利用大規模網絡數據來進行多層網絡學習四個過程。從手工操作、死記硬背到學習再到自主學習一步步的發展,但深度學習真的自主嗎?查教授認為自主學習要能自動定義學習目標,自主獲取所需數據,通過自身能力完成學習,建立社會網絡,實現知識的積累。談到自主學習的意義,查教授表示第一是解決符號接地問題,重點在於概念與意義的獲取;其次是解決框架問題,
就是如何在問題領域的界定與嘗試有所提高。這樣智能演化將會迎來智能發展的起點。最後,對於機器感知研究的重要性,查教授認為只有機器感知才能人機環境互動,進而才能自主學習,從而達到智能演化。並且查教授講到未來人工智慧還有很長的路要走。
微軟研究院首席研究員、自然語言計算組經理周明
微軟研究院首席研究員、自然語言計算組經理周明從自然語言理解的角度分享了自己對人工智慧的看法:他認為強大的需求驅動、大數據推動系統水平提升、計算能力(雲計算)、用戶自然進入了Loop,人-機有了更好的配合等,成為人工智慧新的發展機遇。技術方面來看,計算智能、記憶智能已經解決;感知智能接近實用化;認知智能(主要是自然語言理解)快速發展,比如從分詞、NER、SRL、問答等,建立了不錯的技術體系,但仍然存在與篇章、上下文、領域自適應問題;然後周明談到了自己對於機器學習和深度學習的親身體會,目前統計機器學習中用到多種技術,瓶頸轉到了數據,尤其是帶標註的數據的大規模獲取和佔用。目前同樣面臨著數據稀疏、領域遷移、訓練能力等問題。對於深度學習,周明表示深度學習對自然語言很多任務都有很好的前景,只是我們還存在著差距,並建議利用深度學習的技術來重做自然語言的各個任務,進而觀察是否會有進步。
最後他談到了自身的的一點思考,第一個是從人工智慧的角度深入研究,規則系統、模型系統如何進行融合,而不是說只是去追求某一項技術,第二個是從應用驅動的角度考慮,即人工智慧+,去做有用的技術,考慮到人的因素,追求最佳的用戶體驗而不是純粹自動化。
中科院自動化所模式識別國家重點實驗室主任劉成林
中科院自動化所模式識別國家重點實驗室主任劉成林從模式識別的角度分享了他對人工智慧的看法,包括模式識別的現狀和發展趨勢。人工智慧是一個很熱的詞,範圍很廣,最主要的是感知和認知,他表示從80年代開始模式識別和人工智慧開始融合。模式識別領域最重要的是深度學習和大數據,因為有了深度學習和大數據將模式識別的性能向前推進一大步,但模式識別的基礎理論並沒有太大的進展,理論和方法的進展得益於過去幾十年不斷的積累,歷史上即使是某一段時間比如長達十年的期間覺得這個領域沒有太大進展,實際上它的基礎理論研究還是在不斷的進行,不斷的湧現出一些新的進展。對於模式識別未來,他表示從模式識別的應用角度來看,有兩方面明顯不足,第一個是建立在大數據基礎上,在現實中需要收集大量的樣本和數據,所以門檻較高,第二模式識別和人的模式識別不一樣,還有很大的提升空間。所以,未來的模式識別還是內容的識別,以及自適應學習,小樣本學習,多模態學習,多任務協同等。對於自主學習,劉主任談到,即便是在將來談自主學習,也並不是將過去完全推翻從新來過,而是將過去的學習方法綜合起來將其應用的更好,這應該成為未來研究的趨勢。
華為諾亞方舟實驗室主任李航
華為諾亞方舟實驗室主任李航就深度學習發表了自己的看法,他認為深度學習可以給我們帶來很大的機會,雖然不一定能達到最終目標,但有可能會前進一大步。緊接著他分享了三個實例。第一是深度學習 2006年開始出現,但一直到2012年,都是第一階段。2012年-現在,深度學習進展讓人耳目一新。谷歌的DeepMind深度強化學習,以及Q- learning等,有了更強計算能力,會出現更強的機器。第二是神經網絡圖靈機的出現,可以模擬人類大腦的短期記憶,外部網絡的讀寫通過外部存儲器完成,而在存儲記憶之後,通過檢索從而執行一些有邏輯性的任務。第三是深度學習帶來了自然語言處理的很大機會。有了大數據,有了非常強大的計算機,我們就越來越強大,我們以前可能敢想不敢做的事情慢慢都有了可能。李航從另一個角度也談到不要對深度學習期望過高,因為僅靠深度學習不太可能實現和人類一樣的智能。但是深度學習很有可能能夠使得計算機變得越來越智能化,包括神經圖靈機這樣的概念,這出現基於大數據、基於網絡控制的圖靈機,進而很有可能更接近人的行為,可能更像人。這應是我們目前看到的挑戰和機遇。
北京交通大學計算機科學系主任 於劍
北 京交通大學計算機科學系主任於劍從一個老師的角度就人工智慧發表了自己的看法:他首先談到知識是什麼?這個問題嚴重製約了下一步的發展,知識的表述有框架結構和語義等,但兩個結構也不可能表示所有的知識,只是表示了部分知識。到學習階段,就無法實現自動化。對於知識圖譜,首先應該弄清楚什麼是知識,知識怎麼表示 ,他認為並沒有一個很好的途徑。另外,對於學習,通俗來說學習就是通過數據的積累,將系統的性能提高,隨著經驗的增長,知識相應提高。知識是由概念組成的。提到概念首先應該清楚命題 。而這裡很多概念是沒法明晰的定義,所以識別概念是人工智慧重要的能力,人工智慧關鍵是理論的進展,不要稀裡糊塗的就做下去。最後他表示人工智慧目前當然技術都可以研究,但是更重要的是在它的基礎問題應該更加有所突破,不要沾沾自喜於我們目前技術的進步。因為隨著時間的演化,技術總是在進步,但是更重要的就是理論的進展。
京東智能通訊部總監劉丹
京東智能通訊部總監劉丹從實踐方面主要分享了三方面:目前人工智慧(深度學習)除了圖靈測試之外有沒有更好的產品來評測,而京東做的在線智能客服機器人,通過在線用戶溝通後,給出滿意度評價,具體分析系統是否智能,從第三方數據顯示,比人工滿意度還高。
第二點人工智慧包含多方面技術,封閉式環境這類特定場景中,是可以量化評估的;例如電商領域人工智慧對問題回答滿意度,包括上下文處理方面,80%的人是對回答非常滿意,所以人工智慧目標應是特定場景裡面的應用。
第三個人工智慧對深度學習意義大不大?劉丹認為意義很大。京東智能通訊部在做知識圖譜相關東西,其中包括用戶畫像,用戶畫像不單單只是做標籤,這個人的姓名、愛好、畫像。深度學習可以做深層次的推理,得到更深層次關係,包括他的妻子,包括他的妻子有什麼愛好,包括他購買什麼東西有什麼愛好,這樣在精準營銷方面達到比較好的效果。京東通過深度學習支持的算法得到的效果是一般人工效果的2.3倍,人工就是通常講的打標籤。這塊路是最準確的,就像是做火箭的過程,做火箭不是一天兩天達到登月球的過程。這是特定的環境,通過一個領域才能達到人工智慧的極致。
更多嘉賓觀點,請關注大會直播專題(持續更新中):http://special.csdncms.csdn.net/ccai2015/。(編輯:周建丁)
本文為CSDN原創文章,未經允許不得轉載,如需轉載請聯繫market#csdn.net(#換成@)