最近微信朋友圈和微博上有一篇特火的奇葩文章[13],叫做《人工智慧達到奇點 - 最強論證文》,裡面引用了不少Ray Kurzweil的理論,充滿了各種科學臆想,各種沒有來源的手繪圖表,還包括如「時空穿梭」、「未來預測」、「嚇尿單位」、」超人工智慧「等嚇人的名詞,把許多不明真相的群眾嚇得一愣一愣的。如果是科幻文也就罷了,但是居然還說是論證。請問主要依據在哪?既然原文作者和中文小編硬要和人工智慧扯上關係,我就只好幫大家科普一下Ray Kurzweil的其人其事,順便介紹一下為什麼這些人的垃圾科學(Junk Science)理論可以在美國和中國蠱惑人心。
Ray Kurzweil是誰?你如果百度搜索一把,結果真是要嚇尿了,感覺就差挖掘機不是他發明的了:
「在人工智慧、機器人、深度學習等領域,Kurzweil被視為一個奇才。」
「他曾發明了盲人閱讀機、音樂合成器和語音識別系統。"
如果去他主頁[12]上搜,首當其衝你會發現一張他和比爾蓋茨的合照(咦,這伎倆怎麼有點熟悉),然後你會看到他說自己是語音合成等多項技術的發明人。
左1為Ray Kurzweil
那現在我們就事論事,事實是否如此呢?
去AAAI(國際人工智慧學會)搜索 [ 9 ] 一把,關於Ray Kurzweil的科學論文為0:
那去德國著名的學術論文索引網站DBLP [10]看看?
你會發現Ray Kurzweil最近20年僅有的幾篇文章要麼是沒有技術內容的摘要,要麼是沒有任何基於數據和科學實驗的口水文章。 那你可以說Ray Kurzweil是個實踐性發明人才,他不寫論文。那事實是否如此?Ray Kurzweil說他發明語音識別這點成立嗎?
做過語音研究的人都知道,語音識別技術最早是1932年貝爾實驗室開始的 [ 4 ](基於頻譜、非連續、限定語者及詞彙),後來圖靈獎得主Raj Reddy(也就是@李開復 的CMU博士導師)在史丹福大學讀博士期間進一步研究了連續語音識別問題,再到後來DARPA的資助下,Fred Jelinek和James Baker沿著統計的路子走 [ 5 ],做成了比較成功的基於隱馬爾科夫模型的連續非特定人語音識別系統。至於語音合成,最早也是貝爾實驗室開始研製的vocoder [ 6 ],然後才逐步發展起來的。目前最常用的unit-selection語音合成技術發明人是CMU的Alan Black [ 7 ],另一主流合成技術是HMM語音合成,與Kurzweil沒有半毛錢關係。至於」深度學習,機器人技術的奇才「,實在是白日做夢了,不管是學術界還是工業界,從未聽說過Kurzweil在這些領域有什麼貢獻。至於他是不是發明了掃描儀、OCR、盲人閱讀器,這些交給各位自己去扒皮把。
那問題來了,Kurzweil沒有任何科研和學術背景,他是怎麼當上受到媒體追捧的「未來學家」?CBS早在2010年就對Kurzweil推銷的垃圾科學的方法做有詳盡分析[ 1 ],指出Ray Kurzweil推銷的垃圾科學手段主要有:
#1: 抓住消費者的恐懼。 Kurzweil經常鼓吹要把人腦植入計算機避免死亡,超強人工智慧要毀滅人類,其實就是抓住了人們害怕的心理。
#2: 抓住流行文化。 他的垃圾科學還有一個重要的特點就是抓住廉價的科幻材料,抓流行文化,讓大家更加相信他的理論。
#3: 使用社會傳播而非科學論證。 Kurzweil最常用的做法就是引用其他一些所謂的社會名流的論斷(比如當年的千年蟲Y2K),而不用科學的手段來論證。
#4: 從權威而不從事實出發。從K的網頁我們就能看出,他的各種偽造的事跡,獎項,與名人的合影,讓大家相信他是權威,所以大家相信他。
#5: 偽造證據。 CBS介紹,Kurzweil曾經在2002年引用了一份不存在的Gartner研究報告來佐證自己的觀點。
#6: 把真實的科學當做垃圾科學。 Kurzweil認為:氣候變化,這項大氣和環境科學家多年的研究成果,是一個騙局。
#7: 用家庭成員來證明自己的可信度。《紐約時報》介紹,K曾經用自己的兒子在一份證詞上證明自己可信。
#8 引用容易受騙的記者來傳播消息。 Kurzweil經常欺騙類似Ashlee Vance這樣的記者來傳播他的正面新聞.
事實上,Kurzweil可不是一般的小忽悠,他的手段還是很系統,有計劃,很高明的。比如,K喜歡提出一些讓人在當前無法證明,也無法證偽的嚇人論斷來蠱惑人心(如」奇點理論「)。不過仔細留意就會發現,他的這些論斷往往是沒有任何依據的。其實辨別垃圾科學很容易:真正的科學是需要對問題有嚴格定義、有實際的技術、有驗證的標準,有數據的支持。
另外,"未來學家"Ray Kurzweil的公司詐騙在美國證監會是留有案底的。他整日吹噓「奇點」將近,而其在90年代創立的公司就被美國證監會起訴證券詐騙,見美國《商業周刊》96年文章《Kurzweil詐騙案剖析》[ 2 ] 與美國證監會的文件 [ 3 ] [ 8 ]。
最後,我來正面回答一個問題:「目前人工智慧技術的發展值不值得人類擔憂自身的安全?」
我的回答是:「完全沒必要擔心。」
目前可以用的人工智慧應用無非是語音識別,圖像分類,廣告點擊率預測,機器翻譯,簡單問答與對話系統等等。其實就算在這些任務中,不少實際使用的開放系統的準確率也往往達不到期望(如Amazon的最新智能家居助理Alexa [11])。再比如,在機器翻譯中,西班牙語與英語的翻譯已經取得了一些成果,但是中文,阿拉伯語,到英語的自動翻譯結果還是差強人意。至於機器人是否能在未來10年超過人類的智商和佔領地球,我覺得下面的情況更可能會反覆出現:
那深度學習呢?深度學習是機器學習的一個重要分支,主要關注的是用神經網絡做特徵學習。目前深度學習取得進展較大的是語音識別 [14],圖像分類 [15],文本分類[16] 等傳統問題,主要取得的成果是在這些任務的準確率上:通過大數據,增加模型參數,降低variance,提高機器學習模型的健壯性得到的。首先,我們要肯定這些進步,然而我們也要認識到,當前的深度學習技術在知識推理、邏輯、規劃、機器人領域等人工智慧核心領域還沒有取得重大的突破性科學成果。
那麼人工智慧的學者是不是只關心技術,不關心法律、經濟、社會問題呢?這個答案也是否定的。事實上,每年都有很多關於人工智慧與社會福利的研究[17],有很多的學者在從事人工智慧對隱私、法律、經濟、安全和社會的研究 [ 如 18, 19, 20, 21 ]。最近國際人工智慧學會前主席Eric Horvitz也在斯坦福提出了AI一百年研究計劃,指出了人工智慧未來100年需要涉及人類的方方面面,為人類服務[22]。
比起普通民眾的擔憂,實際上不少人工智慧的學者擔憂的往往相反:目前人工智慧的應用還比較初級,根本談不上智能,甚至很多學者認為現在計算機連真正理解人類的語義也無法做到。引用CMU計算機學院Ed Hovy的話:「你們這些做研究的,機器分類的準確率再提高1%有什麼用?我根本不關心。我問你,什麼是語義? 你的程序能回答嗎? 我問你的電腦程式一個簡單問題,「小明買了一輛車」,句子裡的「買」到底是什麼意思,計算機根本無法回答。」
所以,對於計算機科學家來說,不管是從工程上還是科學上來說,人工智慧的研究都還是任重而道遠。作為普通民眾,也需要堅決抵制垃圾科學。
作者:@王威廉,美國卡內基梅隆大學計算機學院。雷科技授權轉載。
[ 1 ] http://www.cbsnews.com/news/how-ray-kurzweil-sells-his-junk-science/
[ 2 ] http://www.businessweek.com/1996/38/b3493123.htm
[ 3 ] http://www.sec.gov/litigation/litreleases/lr18469.htm
[ 4 ] http://www.stokowski.org/Harvey%20Fletcher%20Bell%20Labs%20Recordings.htm
[ 5 ] http://mitpress.mit.edu/books/statistical-methods-speech-recognition
[ 6 ] http://en.wikipedia.org/wiki/Vocoder
[ 7 ] http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=541110&tag=1
[ 8 ] https://www.sec.gov/litigation/litreleases/lr15187.txt
[ 9 ] http://www.aaai.org/ocs/index.php/index/index/search/results
[10] http://dblp1.uni-trier.de/pers/hd/k/Kurzweil:Raymond
[11] http://www.wsj.com/articles/amazon-echo-review-talking-helper-alexa-is-no-match-for-siri-1422997829
[12] http://www.kurzweilai.net/ray-kurzweil-biography
[13] http://mp.weixin.qq.com/s?__biz=MjM5MTAyNjcyMA==&mid=203679648&idx=3&sn=6f12da9739160d56477426e1e3688a75&scene=1&from=singlemessage&isappinstalled=0#rd
[14] http://www.isip.piconepress.com/courses/temple/ece_8527/lectures/2014_spring/lecture_38_spmag.pdf
[15] http://papers.nips.cc/paper/4824-imagenet
[16] http://nlp.stanford.edu/sentiment/
[17] http://dssg.uchicago.edu/
[18] http://www.aaai.org/ocs/index.php/AAAI/AAAI14/paper/view/8599
[19] http://dl.acm.org/citation.cfm?id=2390629
[20] http://www.cs.cmu.edu/~jasonh/
[21] https://css-center.stanford.edu/
[22] http://news.stanford.edu/news/2014/december/ai-century-study-121614.html
點擊最下方「閱讀原文」,到雷科技網站進行討論。