每次看別人關於ai可能會帶來哪些應用的討論,我總能從情感上把和自己有關的東西弄到一邊去,比如,最近問的一個問題:人工智慧會不會導致會計師失業?回答「不會」。這就像今天說絕對的工作機會,覺得再過幾年世界就不好找了。然而,人工智慧,或者說機器學習,或者機器智能,會帶來哪些應用呢?我們知道,這些應用會改變一切。
首先是小到,電子化。打個比方,在生活中我們無時無刻都在使用的東西——計算機。編輯某些文字,寫一些小說,在圖像和聲音的多種變化中分析視覺信息;把語音轉換成文字;把文字加粗,同時還把標點符號去掉,準確抓取句子中的重點;把文字分詞,分成多種語言、平行句子、甚至圖片的每一個部分,可視化,或者更牛的,能夠理解圖片中的每一個物體、細節,把世界變成高維空間。類似這些,大量的東西都是用人力完成。那麼,是不是機器全包了呢?也不是。或者是,機器能做的更精細?這一點也不樂觀。畢竟圖像的抽象力、語音信息的理解能力、甚至每個人的抽象回憶力都是有區別的。但是,它們肯定是某一種類似於「暗號」的東西。
比如,我們現在有一個機器用身份證號碼給身邊的人發簡訊,利用我們的生物特徵、聲紋分析信息,來判斷哪些人是我們的親朋好友,什麼時候我們去過他們的家。機器學習方法的本質是統計學方法,那麼我們可以把它看作有通用規律的統計學問題。有些問題問的不是統計學問題,而是人腦思考問題的不同方式。有限預測無限通用問題,是它的通用形式,可以變化。或者我們真的認為完全不會出現問題嗎?當然不是。你真的可以對看過的每一部劇都寫個影評,每個事件的發生總有很多原因。傳統文字的寫作是英雄體文,動漫字幕是平假名,可是這些通用的語言風格,在機器上就得琢磨一下怎麼寫。所以,我們會有一些新方法,它們可以不走人工、自動方向,但是它們有很多通用的好處。當然,你必須願意使用這些方法。
回到機器學習,我也看過一些資料,目前學術界用這些方法,大部分都是因為它能在有限的數據上得到好的結果。我們提到的機器學習其實是面向非常非常非常有限的數據集和問題的。我們應該學會怎麼從有限的數據集中學習。那種強推不算是趨勢,機器學習也只是某個領域的思路,未來人工智慧每天都在生產各種東西出來,圖像識別,醫療診斷,遊戲等等,重要的是生產出來的東西如何定價?怎麼定價?消費者要不要接受你的價格?如果接受的話,會更高,不接受的話會更低。這才是趨勢。人工智慧目前還無法完全解決很多問題,但是會讓人更專注於某些有關的人工智慧的研究。