博士太太沙龍的朋友邀我講一些科技方面書的讀後感,遂選了這本「數學之美」和她們分享。
今天很榮幸能有一個機會和大家分享一本書《數學之美》,它講的是數學,可並不高冷。
在座的各位都有手機,對吧?手機通常有個語音助理,蘋果手機有個單獨的名字叫Siri.我們可以通過它設定行程、語音撥號、查詢天氣、播放音樂、讀短消息,還可以和它聊天,你使用過程中有沒有哪怕一點點好奇去想過它是怎麼實現的呢?
阿法狗打敗了所有的人類圍棋職業高手,你有沒有一點點擔心電腦超過了人腦,我們該怎麼辦?為電腦打工嗎?
其實在目前,這都是數學問題。
數學一開始只是為了計數存在的,據說很早時候一個部落選酋長,老酋長對兩個競爭者說你們各說一個最大的數吧,誰說的數大,那麼新任酋長就是誰。其中一個張口說:「三」。另一個人抓耳撓腮想了半天回答不上來,只好認輸。因為在那個時候,三就是最大的數了。
現在,我們日常購物、理財的時候會用到數學,其他時候似乎離我們很遠。可實際呢?大家都聽過大數據吧,現在什麼都講大數據,不論是天氣預報還是世界盃,你都能從中聽到這個詞。那什麼是大數據?
大數據,就是以往數據的整合。數量少的可以用excel表格解決。真正用到大數據的是在人工智慧方面。而這個可不是excel表格可以解決的,谷歌搜索用到的處理大數據的電腦,擺幾個足球廣場肯定是沒問題的,裡面存儲的數據也是海量的。為了方便大家理解,我來舉個例子:我們在百度搜索上輸入「今日天氣」,然後敲回車,得到什麼呢?是今日氣溫的一些數據。百度伺服器理解了「今天天氣」的意思,然後反饋給我們相應的搜索結果嗎?
不是的!百度伺服器並不知道「今日天氣」是什麼意思,它只是對大數據進行了處理,然後給出反饋的。大數據是如何處理的呢?
其實就是找規律,規律是統計的基礎上來的,而這個就利用了數學知識。可能有些人不理解了,這有什麼規律?假如百度第一天上線,那麼輸入天氣後反饋出來的是很多和今日天氣有關的連結,有關於古詩方面的,有今日天氣的名詞解釋,也有今天天氣的實時報導。一天下來,伺服器根據大數據監控到,99%人輸入今日天氣後,點擊的是實時報導的連結,那麼統計的結果就是這個連結就有優先級,下一次還有人輸入今日天氣,那麼第一個連結就是實時報導。這裡百度伺服器並不具備理解詞義的能力,而只是做一個簡單的統計,而這利用了數學。
有些用過Siri聊天的朋友可能的會問,那麼為什麼和Siri聊天呢,回復還比較準確?難道也是不理解我們說的意思?其實在上世紀70年代前,科學家是不用統計來做這樣的事的。而是認為語言是高度抽象的,人和其他動物的本質區別,所以要理解語言,首先要有一個人的大腦才行,可後來發現,人的大腦要實現起來太難了,那怎麼辦呢?就想利用語法規則來實現,可這條路看上去容易,執行起來太難了,因為語言的模糊性和多義歧義性,這裡就不展開講。後來有個科學家想偷個懶,就用了數學統計的方法,沒想到!效果不錯。他是怎麼做的呢?就是先收集大量的語料,形成大數據,然後找規律。我聽業界的人說Siri剛開始的時候,後面不是聊天機器人,而是一堆印度人,他們真人在和蘋果的手機用戶聊天,等聊到一定程度了,那麼把他們相互之間聊的內容作為語料。這個一定程度不是上萬條聊天記錄,而是上億上百億的概念。這樣後面的用戶再和Siri聊天的時候,就可以看之前統計中這個問對應了多少條回復,然後選一個回復概率最高的。阿法狗也是採用了統計方法,當然更加複雜一點。如果之前沒有和這句一摸一樣的呢?那麼選取關鍵詞,比如我們要知道世界盃法國的情況,我們可以輸入『世界盃 法國』,就可以了。這就是關鍵詞,而不用輸入『2018世界盃中法國比賽的情況是什麼?』當然你這樣輸入也沒問題,但關鍵詞也可以實現同樣的效果。
時至今日,機器人對自然語言的識別仍然是採用同樣的方法。也就是雖然網上電視吹噓的AI機器人似乎很厲害,實際上它們是沒什麼智力的,它們根本不懂你說的話是什麼意思。現在還有一些AI智能音箱什麼的,其實也是沒智力的。能根據你的指令播放音樂,做一些事情,只是在對臺詞,它也不懂你說的內容是什麼。如果你換了表述方法,對不上臺詞了,它就不知道該怎麼做了。Siri也是如此,經常要告訴用戶,需要用戶怎麼表述,它才知道該怎麼做。
我想現在大家可能都覺得AI機器人也太不智能了,也不再擔心是不是馬上要為機器人打工的問題了。是的,目前採用數學統計的方法來解決人機互動已經走到瓶頸了,這本書講的數學之美可以說現在已經不美了。可一旦突破這個瓶頸,那麼迎來的是什麼?就是我們手機上不用再裝那麼多APP了,不需要再點開淘寶搜索商品,打開百度地圖來導航,打開抖音來看好玩的,只需要一個語音聊天機器人,它能理解我們說的,然後後臺執行,打開淘寶,打開百度,打開抖音,然後把我們想要的反饋給我們。我們只需要說:「我要去上海金茂,給我導航」,那麼聊天機器人就會後臺啟動地圖APP,然後設定好起始位置,並且把最優的路線設計好反饋到手機界面上來。也就是你手機上的支付寶、微信、百度地圖、抖音統統看不到了,手機屏幕上只有一個聊天機器人。這才是真正的智慧型手機。
這也是為什麼跨國大公司都拼命在做聊天機器人,因為誰拿下它,那麼就是拿下了這個出入口,這個市場將是千萬億的新市場。在我的微博中也強調了這點,大家有機會可以去看下。我也自我介紹一下,我開發了一套聊天機器人系統,已經申請了國家發明專利,也就是解決目前數學方法無法解決的AI智慧機器人不智能的問題。希望大家也能多看看我的博客,給我提點建議。微博名是《這個民科有點忙》,可以微博搜索搜索到。謝謝大家!