提起人工智慧,我們腦海中自然而然會想起近些年來在影視劇中的人工智慧形象,一個與人類幾乎相差無幾的機器人,一個在智商上甚至能夠超越人類的程序。但就目前而言,現實中的人工智慧技術想要發展到科幻影視劇中的程度,還有一段距離。
那什麼是人工智慧,如何判斷是否是真正的人工智慧呢?一個有趣的想法是,當機器擁有人的思維後,便認為這臺機器是人工智慧。
那麼問題進一步細化,如何判斷機器是否擁有人的思維?
1
1950年,阿蘭·圖靈在《心靈》(Mind)雜誌上發表了著名的《計算機器與智能》(Computing Machinery and Intelligence)一文,提出了判斷一臺計算機是否具備智能的測試方法,即大名鼎鼎的圖靈測試。
概括而言,圖靈測試是通過考察機器的外部行為來說明其內部心智的問題,即一旦機器能夠展現出與人類通過思維展現出的行為相同或相似的行為活動,則有理由相信機器與人一樣具有思維。
圖靈測試的關鍵點在於,如果通過測試,則認為機器擁有思維能力,而這項能力是智能最為重要的表現。
為此,圖靈設計了一項測試,讓A、B、C三人在相互之間無法辨別的情況下,讓C來詢問A和B一系列問題,並最終給出結論。為避免詢問者通過聲音來判斷,因此互相之間溝通是以文本作為載體,A的任務是儘量使C做出錯誤的判斷,而B的任務則是幫助C做出正確判斷。最後,C給出自己對問題的判斷,當然,這個回答不一定正確。
測試期間,在不知情的情況下,用一臺機器D來代替A,重複以上的遊戲。如果A與D欺騙C給出錯誤判斷的次數相差無幾,那麼至少在這個遊戲中,可以認為機器擁有和A一樣的思維。
圖靈的主要邏輯在於認定思維是智能的主要體現,行為又是思維的主要表現,而語言行為是行為的核心。因此,將語言交互能力作為驗證機器智能的條件。
2
那麼,接下來問一個更深入的問題,圖靈測試能否作為真正意義上智能的評判標準呢?
在圖靈測試中,許多被測試者可能經常會被問到這些問題。
如:
貓坐在毯子上,因為它很溫暖。什麼很溫暖?
貓坐在毯子上,因為它很冷。什麼很冷?
有趣的是,許多人都知道正確的答案是什麼,但一些被測試的程序可能會回復一些混淆視聽的回答,企圖矇混過關。
比如回復「你家養了貓?」「哪裡買的毯子?」「幹嘛問我這種蠢問題?」,非常有趣不是嗎,但顯然,這樣的回答並不能證明它通過了圖靈測試。
如果要回答,必須對人類語言的細微之處以及人類社交本質有一定的理解,同時這些問題中還包含了這個世界運行的諸多常識。可以說,連5歲的小孩都能夠回答這些問題,但即便目前世界上最強大的計算機仍然無法給出正確的答案。
那麼回到問題,圖靈測試能否作為評判機器是否具備智能的標準呢?
答案是當然可以,的確有許多人認為圖靈測試還有很多改進的空間,比如無法確認機器是否真的理解了我們的意思,還是根據設定好的程序來進行回復,但這都不是重點。
如果一臺機器的外在表現已經讓我們無法分清楚它到底是人還是機器,那麼我們當然能夠認為這臺機器具有智能,至於機器是否具有真正意義上的智能並不重要。
至少在人類完全理解智能的概念前,圖靈測試仍然能夠作為評定機器是否具備智能的標準。
3
作為人類的我們,能否回答以下兩個問題呢?
李明:我昨天剛換上了假牙。
珍妮:真的假的?!
李明:真的。
問題:李明現在的牙齒是真的還是假的?
阿呆給領導送紅包時,兩人的對話頗有意思。
領導:「你這是什麼意思?」
阿呆:「沒什麼意思,意思意思。」
領導:「你這就不夠意思了。」
阿呆:「小意思,小意思。」
領導:「你這人真有意思。」
阿呆:「其實也沒有別的意思。」
領導:「那我就不好意思了。」
阿呆:「是我不好意思。」
領導:你肯定有什麼意思。
阿呆:真的沒有什麼意思。
領導:既然沒有什麼意思,那你是什麼意思?
阿呆:其實,我的意思就是想意思意思。
領導:你既然是想意思意思,那就是有什麼意思。
阿呆哭了:我就是想意思意思。但是,真的沒有什麼別的意思。這麼個小紅包能有什麼意思?也就是意思意思而已。
領導笑了:呵呵,我對你有點意思了。
阿呆心想:嘻嘻,我就是這個意思。
問題:以上每個「意思」都是什麼意思呢?
最後,如果你是圖靈測試者,你會給機器提什麼問題?
8月27-29日,由深圳市人工智慧行業協會主辦的深圳(國際)人工智慧展將在深圳會展中心召開。展會中各家企業將展現其最新的人工智慧技術,歡迎各位來現場進行圖靈測試。