星期六上午,隨著「叮鈴」一聲的門鈴聲,小明急忙跑過去打開家門,見到門口站著一個人形機器人。機器人身高一米五左右,跟小明差不多,樣子有點像星球大戰中的C-3PO。機器人向小明鞠了一個躬,「你好,我叫羅伯特,是你們家預訂的管家機器人。」小明高興地跳了起來:「太好啦!我們已經等你很久了,請進。我叫小明。」「小明,你好。」羅伯特點點頭走了進來。
小明領著羅伯特在家裡轉了一圈。看看客廳、書房、臥室、廚房、衛生間,最後來到小明的房間。根據指引,羅伯特在小明房間裡走了一圈,之後站在了落地窗前。書桌旁擺著一個魚缸,裡面養著一些熱帶魚。小明說:「你別忘了每天給它們換水。」又指著落地窗前的一架天文望遠鏡說:「你走動的時候注意別碰到它,是爸爸在美國給我買的呢。天氣好的晚上,別忘了提醒我去觀察星座。」羅伯特點點頭,「明白了,你的房間真不錯。」之後又用平緩的語氣說:「不過,空調溫度太低,對身體不好,建議你把溫度調高。」然後慢慢轉過身,像是怕碰到天文望遠鏡,說:「窗戶也沒有關好,這樣會有安全隱患。」順手把窗戶關上了。「我再去其他房間看看。」羅伯特一邊說一邊慢步走出了小明的房間。小明坐下,開始做功課。不一會兒,羅伯特走了回來。小明問羅伯特:「我現在有一個數學問題,不知道該怎麼解。你能幫我看一下嗎?」羅伯特走到桌前,用親切的聲音回答:「小明,我是管家機器人。我的職責是把你的家管理好,不負責輔導你的學習。如果需要輔導功課,可以請家教機器人,我們公司也有相關的擴展模塊可以購買。」小明微笑著答道:「好,我問問爸爸是不是可以買。」
這個場景是我們設想的未來管家機器人的使用場景,它的最大特點是基於受教式人工智慧(Educated Artificial Intelligence,EAI)技術。這種技術具有以下幾個特點:
1. 應用限定的智能系統:根據此原理構建的智能系統服務於不同的應用,圓滿完成任務是每個系統的終極目標,系統的智能性全部體現在完成任務的能力上,而不是一般意義上的人工智慧。比如,管家機器人和家教機器人分管不同工作,擁有各自應用所需的智能,因此也被稱為受教式應用智能系統。
2. 接受用戶教育:智能系統可以接受用戶教育,快速學習,適應環境。用戶承擔一定的教育責任,但系統也有自主性,正如老師和學生的關係,在某些方面學生也可能超越老師。教育不同於教誨,不需要給出每一條規則,用戶只有在必要時提供少量的指示,比如用戶只須領著管家機器人在房間行走一遍,它就能識別整個格局,並知道未來工作環境中的注意事項。
3. 擁有自學習和推理能力:在動態變化的環境中,基於用戶的教育,學習所需知識,矯正錯誤,從而具備場景所需的學習、推理能力。
4. 智能工具:受教式人工智慧系統的目的是成為人類的工具,在特定的應用中提升用戶體驗,而不是部分再現人的能力。它也不同於傳統的機械系統,只是重複同樣的工作,而是能在動態的環境中做出判斷。
雖然人腦是一個只有1.5公斤左右重的器官,但它或許是宇宙中最複雜的系統。對人類來說,宇宙和人腦都充滿了無窮的奧秘,是科學家不斷探究的對象。儘管現在的研究對人腦的工作原理與機制有了一定的了解,但是腦科學的研究進展距離我們能在計算機系統上再現人類智能的目標還相差甚遠,機器很有可能永遠無法實現與人類同等的智能。
(1)人腦與人工智慧
我們應該如何實現人工智慧?是通過理解人的大腦的工作原理和機制,在電子計算機上將其實現嗎?即使這個策略存在可能性,也有極其漫長的路要走。此路線依附的是腦科學的突破,需要切實地理解人腦智能產生的機理,單獨靠電子、信息技術的發展是不足以支撐的。
1. 人腦結構VS計算機體系架構,差異巨大
人腦有很高的複雜度,有10的11次方個神經元,10的15次方個突觸。平均每個神經元有1萬個突觸相連。據估計,整個網際網路有10的12次方個網頁,每個網頁的平均連結少於100個。如果把人腦和網際網路都當作網絡來看,兩者有大致相同的結點數,但人腦的連接數更多,複雜度更高。
人腦主要由腦幹、間腦、大腦及小腦四個部分構成。腦幹由延髓、腦橋及中腦組成,下連脊髓,上面是間腦。間腦由視丘及下視丘組成,大腦位於其上。大腦分左右兩個半球,中間由肼胝體連接。左半球控制右半身,右半球控制左半身。兩個大腦半球的表面覆蓋著大腦皮質,大腦半球又分成不同的腦葉:前額葉、頂葉、顳葉及枕葉。小腦位於大腦之下,腦幹之後。而電子計算機採用馮·諾伊曼(VonNeumann)架構,由運算器、控制器、存儲器、輸入設備和輸出設備五大部分組成。計算過程中,把程序和數據存入主存儲器中,從主存儲器中取出指令逐次執行。整個結構比人腦簡單得多。
2. 意識仍是所知甚少的世界
人類區別於機器的一個重要特點是擁有意識,而機器永遠不會。人的意識到底是什麼?儘管已經有很多研究,但並沒有取得一致性的結論。這個問題仍然是科學的最大謎團之一。
意識是指人在清醒時的感知與認知,本質是生命現象。「我思故我在」,首先意識是現實存在的,是每個人以自我為中心的精神活動,對每個人來說都是持續、一致和穩定的,所以是主觀的,經常被稱為自我意識。但意識又是客觀的,它對應著大腦神經系統高層次的處理,由低層次的神經元上的生物反應支撐。意識是一個統一體,將個人的所有感知與認知聯繫在一起;與潛在意識密切相連、交互,可獲得身體各個器官的信號,同時又對它們發出指令;認識自己在空間、時間、社會群體中與其他個體的關係。意識又擁有主動性,比如,意識可以做出決定,通過大腦以及神經系統,將指令傳到全身,控制整個身體的運動。意識的過程可能發生在大腦的不同部位,是不同作用產生的結果,最近的研究發現大腦中的屏狀核可能起到意識的「開關」作用。意識由生物進化得來,從簡單的有機生化過程發展到極其複雜的大腦生化過程,生命與非生物的本質區別在於,生命體能夠通過自身的感知、認知系統認識到自身的存在,並且對外界做出反應與行動。沒有證據表明,我們能把這種極其複雜的生物現象在非生物的計算機上實現,開發出「意識機器」。
3. 語言處理也面臨永無止境的挑戰
語言代表著人類智能的最高水準,也是人類區別於動物的主要特徵。有了語言,人可以傳遞信息,表達思想,講授知識,傳播文化。詞彙和語法是語言的兩個重大要素。一般成年人可以掌握5000到10000個詞彙。在大腦的長期記憶中,人記憶一個詞彙的時候,不僅會記住它的發音、書寫形式,還會記住與其相關的詞彙、概念、用法、經歷,對詞義的理解。語言的理解不僅需要詞彙和語法的知識,而且需要整個世界的知識以及推理能力。喬姆斯基認為人的語言能力是先天就有的。觀察兒童學習語言的過程就會發現兒童不需要許多指導,只要處在適當的語言環境中,就可以學習到非常複雜的語言。這種現象的唯一解釋就是人的語言能力是由DNA決定的。
自然語言處理是人工智慧的一個分支,目的是讓計算機能夠像人那樣具備聽、說、讀、寫的能力。自然語言理解從兩種意義上講是極其困難的。首先語言理解理論上需要用到人的所有知識以及所有的推理能力。因此,被認為是「人工智慧完全」問題語言理解的實現意味著人工智慧的實現。其次,計算機上實現任何東西都需要用數學模型來刻畫,但是我們還不知道如何用數學模型來精確地刻畫人的語言使用,也不知道是否有可能實現。語言在理論上可以有無窮的組合式產生,所以用窮舉的方法不可能實現自然語言處理。此外,雖然語言遵循一定的規則,但又有很多例外,所以用規則也不能解決問題。統計學習,特別是深度學習,為我們提供了很好的工具。從理論上講,如果有無窮多的訓練數據,則可以模仿人的語言處理,不斷逼近人的語言能力,但現實中往往無法得到那麼多的數據;另外,語言現象一般遵循冪律分布,永遠都會存在長尾部分,而這部分無法得到充足的數據,所以完全依賴統計學習也是不可行的。
(2)EAI的特點
人工智慧研究目前分強人工智慧和弱人工智慧兩種流派。強人工智慧觀點認為,可以製造出與人同等智能的機器,而且,這種機器擁有感覺、知覺以及自我意識,甚至具備自我發展和進化的能力。弱人工智慧觀點認為,不可能製造出這樣的智能系統。現在製造的機器可能在某些方面看上去與人有同等的智能,但並不是真正擁有智能,也沒有自我意識。而產業界其實並不關心智能強弱的問題,只關注智能應用情況,即通過相關技術獲得智能應的體驗和效果,因而希望EAI可以成為實現這一目標的正確途徑。
Educated AI既可以理解為Educated Artificial Intelligence(受教式人工智慧),也可以理解為Educated Application Intelligence(受教式應用智能),擁有應用限定、用戶教育、自學習推理能力,能判斷的智能系統等。EAI的目的不是再現人的智能,而是幫助人更好、更高效地完成各個具體任務或任務集,部分達到或超過人的智能。基於EAI理念的智能系統應該滿足以下幾個原則:1. 從屬於人類;2. 限定於場景的任務;3. 接受教育;4. 自我成長;5. 個性化。
有許多應用系統可以通過EAI的理念構建,變得更加實用,從而更好地幫助用戶解決問題,給用戶帶來價值。智能管家機器人可以幫助用戶管理好家庭,從事家居管理、日程管理、室內清潔、物品搬運以及安全保障等。機器人的基本功能在出廠時都已基本具備,只不過由於機器人接受了不同用戶不同的教育,從而形成個性化系統。
(3)EAI技術的挑戰
EAI技術的基本特點是機器學習加人工教育,通過人工教育的方式最大程度地降低甚至克服機器學習的困難,從應用的角度出發,加速系統智能化提升的進程。機器學習是基於數據構建概率統計模型並運用模型對數據進行預測與分析的技術。包括監督學習、非監督學習、深度學習、強化學習和概率推理等。人工教育是指由用戶通過實際指導給出知識、實例當作機器學習輸入,用於構建系統,幫助系統進行預測、判斷。人工教育可以大幅加速學習應用場景特定的模型和參數,使機器學習快速收斂,系統快速適應於具體的應用場景。機器學習的最大優點是通過數據驅動的方式解決具體問題,擁有一套完整的理論體系,具有很強的魯棒性和可擴展性。機器學習的最大缺點是它依賴於數據。儘管數據中隱含的規律在一定程度上能被挖掘出來,但從實現智能的角度看往往不夠充分,特別是當數據缺乏的時候,機器學習就會變得無能為力。
人工教育能讓我們很快地獲得智能系統需要的知識(包括概念、規則)與實例。它的最大優點是教育的知識與實例具有很強的可讀性,具備特定場景的語義,可以很好地理解應用要求,能夠直接對系統的行為給予一定的指導。其缺點是人定義的知識不一定是系統的,無矛盾的,無歧義的,這樣,開發與維護知識的成本也會很高。
目前,儘管機器學習中的很多技術都應該可以直接應用,但EA也有其獨特的技術難點和挑戰,比如:
1. 如何保證人工教育與機器學習的交互和知識、信息傳遞的有效性?人工教育需要能夠與傳統機器學習有效對接,用這些知識或信息增加系統的整體能力。
2. 如何保證應用中性能的單調提升?人工教育加機器學習的目標是給用戶提供應用中的良好體驗,讓用戶感受到在教育和學習的過程中,系統的性能在不斷提升。
3. 如何通過人工教育將學習過程簡化?這裡強調的不是如何讓機器學會學習的方法,而是如何讓機器通過簡單的實例就能學到要學的內容,如果能夠達到「 One Shot Learning」的效果就更好。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.