人工智慧已經從理論走向了日常生活。在AI變得愈加強大之時,其弱點也十分明顯。牛津大學計算機系主任Michael Wooldridge教授發出提醒:人工智慧局限頗多。以下內容根據Wooldridge教授在市北·GMIS 2019全球數據智能峰會上的《機器學習之局限》講話整理,由氫雲資訊編輯。
一般來說,我們都愛分享一些人工智慧的最新創新成果。但今天我想要說的,是人工智慧和機器學習正在面對的一些挑戰。
20年前,人工智慧似乎還像科幻片一樣。但近10年來,人工智慧和機器學習已經取得了巨大突破,如面部識別這樣的技術應用已經非常普遍。人們對於人工智慧顯得異常興奮,砸下了許多投資,也懷著極高的期望。
計算機在一些方面能力極強,但在另一些方面卻非常弱。在數學運算方面,計算機能夠可靠完成每秒10億次級的計算,還可以不眠不休地工作,這是人類無法做到的。但有些對於人類來說微不足道的事情,有些我們每個人時刻都具備的能力,對計算機而言卻很難。
其實,有不少事是計算機不在行的。比如,長期推理(如計算機無法預見到吸菸的危害是長期積累而導致的)、解決表述不準確的問題、認知(如視覺和語言)以及判斷(尤其當缺少精確規則的時候)。
為什麼這些事對計算機來說那麼難呢?這裡有兩種可能性。首先,由於我們的算法是基於理論來解決問題的,但這樣的算法在現實中就效果不佳,因為解決問題還需要大量記憶和時間。這裡所說的大量往往達到天文數量級,就會讓運算變得十分低效。其次,對於像認知這類能力,傳統的軟體開發與算法無法提供借鑑,需要完全不同的技術路徑。
現代AI的突破本質上就是要解決以上兩大問題,AI的發展歷史也是兩種不同路徑的發展史——自上而下和自下而上。
所謂自上而下,是指基於知識的AI,也就是讓人來明確告訴計算機如何完成任務。這就要求把人類知識轉化成明確的計算機語言,並傳遞給計算機。這種方式在一些情況下效果很好,比如專家系統,但在機器人領域和現實問題方面卻效果不佳。另外,這樣的方式也不能解決認知問題。
所謂自下而上,就是機器學習的方式,通過輸入和輸出形成知識。比如,給計算機輸入不同時期(少年、青年、中年)艾倫·圖靈的照片,讓計算機學習其中的關聯,那麼下一次再有一張計算機沒見過的圖靈照片出現時,它也能認出這是圖靈。監督學習是這當中最簡單的技術,採用的是成對的(輸入對應輸出)訓練數據。而神經網絡和深度學習是當前的主流訓練方式。
現在的AI大量基於數據,但缺陷是AI無法做到真正的「理解」。這一缺陷在語言處理中體現的尤為直觀和明顯,比如目前的翻譯程序無法創造性地在翻譯意思的同時產出優美的文字。我堅信,無論給這樣的翻譯程序輸入多少各種語言的文本,它仍然不會明白字面意思之下的豐富涵義。
一個典型的例子是下面這段極其簡短的對話。
男:我要離開你了。
女:她是誰?
任何人應該都能從中讀出很多意思,甚至是豐富的畫面感。但這樣的理解是基於人類的經驗以及成長過程的各種經歷,與其他人打交道的過程。缺乏這些經驗和經歷的電腦程式自然是無法理解的。
因此,我們需要明白的是,人工智慧可以是深度學習,但深度學習卻非人工智慧。
以上內容僅代表作者個人觀點,不代表氫雲資訊觀點及立場
以上內容及觀點不構成任何投資建議,據此投資後果自負