編者按:依託深度學習,人工智慧帶來了又一次的科技浪潮,AI也由此成為2016年科技最熱詞彙之一。聚焦今年熱點,網易智能今日重磅推出「AI+」系列採訪報導,聚焦人工智慧領域從技術到投資、產品、應用等多鏈條發展,尋找AI與多行業結合的關鍵人物以及產生的一系列化學反應。本文為系列採訪第一期,受訪者為微軟人工智慧首席科學家鄧力。在採訪中,鄧力深刻剖析了人工智慧熱潮的關鍵因素,中美人工智慧發展差異,AI人才的發展以及微軟在人工智慧領域近期公開發布的一些布局情況。
文 / 小羿碧怡
如果2015年科技最熱詞彙是「VR」的話,「人工智慧」已經成為2016年最熱的科技詞彙之一。
說到人工智慧,就不得不提到微軟的研究院。在微軟的七大研究院中,成立最早的雷德蒙研究院已經有25年的歷史,而在當時,人工智慧就已經成為這個研究院的研究領域之一。早在1999年底,身為加拿大滑鐵盧大學正教授的鄧力就加入了微軟總部雷德蒙研究院,並憑藉自己深厚的學術功底在2014年初成為該研究院深度學習技術中心研發部門負責人,隨後在2016年初出任微軟人工智慧首席科學家。
微軟雷德蒙研究院總部大樓一角
早在2009年開始,鄧力和他的團隊就同多倫多大學Geoff Hinton教授及兩位學生並肩合作,在微軟雷德蒙研究院開始將深度學習各種不同的方法用在語音識別上,並在2010年夏研究成功。之後發表了一系列論文並多次應邀演講,引起除了微軟之外還有科大訊飛,谷歌、亞馬遜、IBM的一系列語音識別的產品化。隨後,鄧力憑藉在「深度學習與自動語音識別方面的傑出貢獻」,榮獲2013年IEEE SPS最佳論文獎和2015年IEEE SPS技術成就獎。鄧力首次提出並解決將深層神經網絡應用到大規模語音識別中,這一實踐顯著提高了機器對語音的識別率,重新點燃了(由深層次帶來的)神經網絡在當前這個大數據、大計算時代的復甦,極大的推進了人機互動的發展。
那麼,在當年的時代,微軟在人工智慧領域的布局如何?鄧力博士又是如何看待明年人工智慧的發展趨勢呢?且聽智能菌慢慢道來。
深度學習助推弱人工智慧成熟,全靠這三樣東西
隨著深度學習在語音、語義、圖像上的不斷出現的巨大成功的應用,已誕生60周年的人工智慧再次發酵,掀起了第三輪熱潮。這一次,被網際網路教育的人們對AI的未來充滿幻想和好奇,而實際上我們已經發展到哪個階段呢?鄧力向智能菌表示,目前在弱人工智慧方面,我們已經取得了很多好的成績。
所謂的弱人工智慧包括我們日常用到的語音識別、圖像識別、機器翻譯甚至機器問答等。鄧力認為這方面每一個局限任務的研究和應用已經相對成功了,這是因為引入了深度學習,語音與圖像識別以及機器翻譯的準確率得到了巨大幅度的提升。「要是沒有深度學習的話,語音識別,圖像識別和機器翻譯的準確率將遠遠低於現在的水平。」鄧力說道。
而未來的應用領域亦不止於普通的圖像識別以及語音識別和機器翻譯這樣簡單,鄧力告訴智能菌,深度學習在應用到複雜功能包括閱讀理解和自動對話上的顯著效果沒有那麼快,但仍然能有效提升它的準確率和應用的可能性,並終將達到像在語音識別和機器翻譯上一樣大的進展。
正因如此,深度學習已漸漸成為當下討論AI的新「代言詞」。但它的出現並非只靠AlphaGo等現象催生,背後更有著六十年來不斷迭代的技術作為發展的強大後盾。
「現在有三個要素,一個是大數據,二是大計算,就是計算速度非常快(計算能力的提高),第三個就是新的算法和新的模型結構。這三個因素使得現在這個技術得到一個爆破點。」鄧力表示,在計算速度不夠快,數據不夠多的以前,複雜的模型,多層的神經網絡相當於異想天開。鄧力稱,現在的計算速度跟20年前相比極大地增快一天能訓練出來的神經網絡以前需要三個禮拜。而現在伴隨著新的算法和模型結構,大數據的湧現,再加上計算機的快速計算能力,不僅能快速出結果還能幫助實驗人員反覆驗證。鄧力也提出,因為每個公司,每個行業,無論規模大小都可能擁有自己不同的或特有的數據,這些差異化的數據會給不同的應用帶來價值。
鄧力也提出了自己對深度學習的建議,他認為目前的技術能夠很成功地去認知圖像和語音及翻譯語言,但缺乏解釋和真正推理的功能。
「在圖像識別上解釋性會很重要,比如說反恐,你用監視器攝相,說這個人很可疑,這裡危險很大。如果識別的可靠性不高,要問為什麼會有這樣的識別結果。比如因為以前在其他地方有類似這種表現,知道了以後更有信心說應該幫助你做什麼樣的決策。」 鄧力解釋道: 深度學習在助力人工決策行動時,行動代價越大,對解釋性要求越高。而對於商業應用來說,這種解釋性將尤為重要。
大規模用戶數據支撐 ,中國AI企業應該做什麼?
日前,美國白宮推出了人工智慧研究和發展國家戰略計劃的相關報告,其中指出在研究AI和影響力貢獻上中國超過了美國。據了解,報告評估所引用的指標描述是發布深度學習研究刊物的數量以及被其他研究人員引用發布的刊物數量。然而,這是否就代表中國在人工智慧領域的發展已經開始超越美國呢?
鄧力表示:「在某些領域我覺得是對的,比如中文的語音識別。」但同時鄧力也認為單從發表論文的數目本身上看,並不能作為最終的衡量目標,應該更著重看其影響有多大。「中國學生和研究人員的人口基數大,寫的文章肯定也多,從這個角度來講,至少說中國已經發展非常快。中國比美國遲了一點,但是後面會發展比較快,這很正常。」鄧力說道。
儘管報告所權衡的指標有所爭議,但是中國近年來在人工智慧領域上的耕耘也有目共睹。市場上一批批智能化的機器人、產品等現身各個行業。
「中國方面的優勢之一是數據量非常大,用戶反饋力強,應用場景廣闊。而美國在研究走的還是比較前一點。」鄧力告訴智能菌。鄧力認為目前國際交流頻繁,中國發展的速度非常快。中國的優勢非常大,這對人工智慧非常重要。
天然的龐大人口基數實際上也為人工智慧落地市場提供了更多的數據反饋,而另一方面,群居文化也為AI應用服務提供便利。鄧力也舉了中國O2O行業的例子: 「中國應該做的比美國好,服務對象就在這附近,同座大樓,給他遞東西就很方便。美國一般住的距離比較遠遠,應用上就不那麼好做。人工智慧的發展需要很多數據,數據自動採集比較快是一個很大的優勢。」
因此,鄧力亦建議中國AI發展可以以大規模用戶為特色,利用此優勢挖掘不同的數據。儘管美國人工智慧技術很好,但是數據強度可能不如中國大,效果也未必能比一般的人工智慧好。
強人工智慧至少需要十幾年,大腦機制研究很關鍵
第三次人工智慧熱潮不僅只是投資界、產業界的關注,影視界大片《西部世界》也正在詮釋AI的火熱。劇中有意識,有感情的機器人相當引人注目,也讓人開始思考到底未來的人工智慧將怎樣發展。
曾有演講者稱未來想要一個通用的人工智慧產物出現,對此,鄧力表示「沒那麼快,那麼樂觀」。鄧力坦言要達到通用的人工智慧至少還需要十年、二十年,或更長。這個過程中有各種各樣的問題需要解決,包括常識嵌入的問題,人工智慧每個思考的步驟、思維、創造性等都需要考慮。
鄧力向智能菌解釋道:「常識的問題是局部的問題,你要是把常識加到人工智慧,這個10年之內可能做到。完全要做到廣義的人工智慧,相當於說你寫一個通用程序就可以解決所有的問題,這是沒有那麼快的。」
鄧力的言下之意正表明,目前的人工智慧水平仍離強人工智慧很遠。
強人工智慧的實現要基於對腦機制進行大量的探索,對腦的機制了解足夠深入,能讓我們從中學會腦是怎樣做管理,泛化你的學習能力。「就像你要是數學學的非常好,它也會幫助你物理學的好。但現在的人工智慧遠遠沒達到這個水平。」鄧力認為這是十分重要的基礎研究,並鼓勵政府、大公司投資也放在這些基礎研究上。他也表示除了加大腦機制的研究,相應的硬體與算法也要同步跟上,在這些環節都能突破了以後,強人工智慧才有可能實現。
儘管高水平發展時間漫長,但有不少應用已經落地影響著我們的生活。但同時也有人擔心,未來人工智慧的發展會不會也如《西部世界》劇中會反抗人類的機器人一樣威脅到人類的存在。
電影《西部世界》海報
「我自己感覺威脅論是比較遠的事情,我看大家現在也有一些討論,早一點制定一些政策,這是應該的,早一點預防。」鄧力認為AI領域做語音和圖像識別,做感知方面並不會很危險。但AI的自學習和自動推理會使得認知機器自己越來越強,從長遠來講可能會有一些威脅。但作為努力研究AI技術的研究員,鄧力也表示一般研究過程中只會去思考怎麼樣讓AI自學習,讓它聰明,讓它更有智慧,讓它如何可以更有效地幫助人類。真正做研究和實驗的人一般並不會對這些威脅論看得那麼嚴重。
深度學習博士年薪300萬美元?AI跨學科人才更受青睞
此前有媒體報導,人工智慧深度學習專業的博士年薪高達200萬到300萬美元。計算機工程學科的人才在AI界有多吃香也從此可見一斑,但這是否代表AI行業就不需要其他學科的人才呢?
而鄧力認為跨學科人才正倍受青睞。「比如說認知科學、腦科學。你要真正得到強人工智慧,除了計算機科學(機器學習、數理邏輯,自然語言處理,等等),這兩塊也不能少。再就是資訊理論和控制論,在美國一般是屬於電子工程學科,這個也非常重要。」鄧力告訴記者在AI研究中,不同領域的知識跟研究方法會越來越滲透到AI和深度學習領域裡面。
此點也在網易科技、網易智能與烏鎮智庫聯合發布的《烏鎮指數:全球人工智慧發展報告2016》中的學術與研究篇得到了驗證。報告顯示,人工智慧研究的四大細分領域,機器學習、自然語言處理、計算機視覺以及機器人均與邏輯學、數學等其他學科產生聯繫。
《烏鎮指數:全球人工智慧發展報告2016》封面
「我們有在招,但競爭很厲害。我們也做了很多努力,其中的一個努力就是找有不同背景的人,如果做強人工智慧就要不同學科互相合作。」
人才競爭雖然激烈,但微軟仍下足本錢。近年來,微軟在中國的研究中心不斷擴大,同時也加大了研究員的力量投入。鄧力認為中國有很多人才,曾有不少人說,微軟亞洲研究院為中國培養那麼多人才,記得我的校友張亞勤對我說這就是一個「黃埔軍校」。但無可否認的是,這些中國的人才確實對微軟甚至整個業界各種各樣的事業都產生了非常大的影響。
微軟的整合布局,組建5000人的AI部門地毯式推進
在微軟最有權勢的華人高管陸奇卸任之後,鄧力所在的微軟雷德蒙研究院發生了較大的人事變動。
9月底,微軟宣布組建人工智慧及研究事業部(Microsoft AI and Research Group),專注人工智慧。據悉,這是一個具備5000人規模的工程和研發團隊,由微軟全球執行副總裁沈向洋領軍。這一部門將包括微軟研究院(MicrosoftResearch)、微軟信息平臺部門(Information Platform Group)、必應(Bing)和小娜(Cortana)產品部門,以及環境計算(Ambient Computing)和機器人團隊。自此,微軟所有人工智慧相關人員及產品都將統一到新建團隊下進行管理。
微軟公司
沈向洋在一篇博客中說道,「(新的團隊)將使微軟具備創造真正智能系統和產品的能力,我相信我們擁有這個地球上許多頂尖的人工智慧人才,我們將繼續吸引更多的人才加入」。
在人工智慧大團隊組建之際,微軟CEO薩提亞·納德拉說,微軟要把AI注入全球所有的計算平臺和所有產品,最終目標是要在全世界普及人工智慧。概括起來,微軟在人工智慧領域的重點布局有四個方面。
一是個人助理領域,如小娜(Cortana)、小冰這樣的語音助手和聊天機器人,致力於徹底改變人機互動方式。據微軟透露,小娜收到的指令和問題已經超過120億條,擁有1.33億活躍用戶,可以在多個設備上運行。
二是將人工智慧技術加入所有的微軟應用中,比如圖片編輯工具Microsoft Pix、Skype、Office365、智能鍵盤SwiftKey、Bing等等。
Skype Translator演示圖
三是將微軟的人工智慧技術服務,如在語音、視覺上的認知能力和機器分析能力等,開放給全球的應用開發者,目前微軟已經在Bot Framework平臺上使用AI技術建立智能工具包。
四是在基礎設施上,微軟投入更多。例如,微軟在雲中投入大量FPGA(現場可編程門陣列),它能直接與網絡對話;微軟搭建了全球性的、超大規模的雲基礎框架,利用Azure開發出全球最強大的AI超級計算機並開放給每個人。另外,微軟的CNTK(現已更名為微軟認知工具包)是最快的分布式運算神經網絡框架,也成為唯一開源的可擴展的深度學習工具包。
科技界巨頭們起起伏伏,算下歷史也不過二三十年,而在人工智慧領域,微軟始終是走在前列的弄潮者。對於不遠的將來,鄧力認為,人機對話的應用會更廣泛。「另外醫學的應用我覺得前景非常大。還有計算機視覺上的應用,這些技術相對比較成熟。」鄧力說道,如果技術成熟的話,你可以找到一大堆的應用。
註:本文系網易智能「AI+」系列原創採訪報導,轉載請註明出處和作者,違者必究。