近日,在聯想創投2020 CEO年會上,清華大學講席教授、智能產業研究院院長、美國藝術與科學院院士、百度前總裁張亞勤先生帶來了《未來科技趨勢展望》。
張亞勤表示,數位化的3.0時期已經到來,數位化的範圍已從內容、社交和企業服務領域向物理和生物世界進行延伸,將我們熟悉的城市、工廠、電網、家庭向智慧交通、工業網際網路、智慧醫療等方向進行升級,為了完成物理世界的「數位化」,數據需要更清晰地讓數字世界和現實世界一一對應,通過深度學習,計算機不斷加深著對於人類世界的認知。
隨著數據的海量爆發,如何突破目前的算力,成為了一代又一代科學家攻克的關鍵,香農定律、馮諾依曼架構和摩爾定律奠定了傳統計算與通訊範式,如何突破已經接近極限的三種理論?張亞勤表示,需要通過對信息的重新定義,制定新的計算範式、計算體系和通訊架構,而他們又給產業帶來了新的機會。為此,中國需要抓住機會,引領數位化的3.0時代和第四次工業革命浪潮。
清華大學講席教授、智能產業研究院院長、美國藝術與科學院院士、百度前總裁張亞勤發表演講
以下為張亞勤演講全文:
大家下午好!非常高興能夠來到聯想創投CEO年會,作為中國IT的icon,聯想36年曆經坎坷,也取得很多進展,尤其是聯想的「3S」戰略,和我今天要講的內容「智能技術趨勢」非常吻合。
數位化進程的演變與3.0時代的到來
演講現場
回顧IT產業30年發展歷程,最大的特徵就是數位化。第一波數位化開始於80年代中期,也是聯想成立的時期。圍繞自然界的內容表述,數位化的範圍包括音樂、視頻、聲音、圖像等,算法和標準有MP3/4、H.26、AVS等;隨著PC的推出,又出現了PPT、EXCEL、WORD文檔數位化。
第二波數位化開始於90年代中期,在內容數位化的基礎上加上網際網路、HTDP、HTML的產生,從而催生消費者網際網路,從早期的PC網站、門戶,到搜索、電商、社交,再到後來的共享經濟、Zoom等視頻通訊、數字貨幣和行動支付。從產品體驗和規模等方面來看,中國在移動網際網路時代下的消費互聯領域整體領先於世界。
與此同時,企業也在數位化方向不斷細化與革新,比如ERP、CRM、HR、Supply Chain、BI、workflow等管理系統的誕生。在雲領域,中國已在逐步追趕基礎設施雲的建設,逐漸縮小與其他國家在規模效應上的差距。
我認為,中國軟體的發展跳過了以「軟體作為產品」的時代,直接進入以「軟體作為服務」的時代。網際網路本身就是「軟體作為服務」的一種符號,作為一種新軟體模式,我認為大量SaaS公司會在5年之後陸續出現,未來SaaS平臺會有很大的機會。
現在,我們進入了數位化3.0時期,也即智能感知時代,這個階段發生了兩方面轉變:一是物理世界的數位化,我也把它叫做「網際網路的物理化」——工廠、電網、機器,乃至所有行動裝置、家庭、城市都在向數位化發展。在這個過程中出現了相較於過去上千甚至上萬倍的海量數據,比如一輛無人車每天產生的數據量大約5-10T;相比於數據主要提供給人員輔助決策的1.0和2.0時代,數位化3.0時期99%以上數據在機器間傳輸,到最後一環節才傳遞給人員。
第二個方面的轉變生物世界的數位化,人們的細胞結構、所有器官乃至整個身體都在數位化,整體數量級比物理世界大上千倍。從虛擬、宏觀到微觀,整個數字信息世界、物理世界和生物世界正在走向融合。此外,「數字孿生」技術可以讓我們更加清晰地將物理世界和生物世界進行一一對應。
有了大數據之後,我們還要實現數據的結構化和智能化。在人工智慧的60年發展過程中,有「冬天」也有「春天」。人工智慧根據不同算法大致分為兩類:一種是邏輯推理,是以知識為驅動的算法;另一種是以大數據為驅動的算法,兩者都運用到了人類大腦的基本認識、基本模型和決策模型。
過去十年裡最流行的深度學習,基本是以大數據、大計算、大模型算法來驅動,其中包括AlphaGO、AlphaZero。深度學習的確在過去一段時間取得很好的進展,比如GAN、Transfer learning,到現在的GPT-3等等。未來,深度學習還有很大發展空間,其算法需要結合符號邏輯、知識型推理和更多模型的因果關係和新的範式,目前對於產業來講,未來五至十年,深度學習還會是最重要的算法。
根據Google AI負責人Jeff dean的觀點,人工智慧的三大要素是數據、算法和算力,實際上是數據加上100倍的算力,並且算力比數據更重要100倍。這個觀點我不完全同意,但我同意在目前深度學習框架下,算力十分重要。
突破香農、馮諾依曼、摩爾瓶頸,
推動算力發展
演講現場
怎麼突破目前的算力?過去60年,傳統計算與通訊範式有三個重要原理:香農定律、馮諾依曼架構和摩爾定律。
香農定律,定義了熵、信道容量和失真情況下壓縮極限,目前,我們距離這三個極限已比較接近。馮諾依曼架構是指五個最基本模塊加上程序存儲原理,是圖靈意義下最好的一種實現,但它的瓶頸在於數據和計算的分離。在深度學習中,龐大數據量本身就會形成一個瓶頸。最後還有摩爾定律的限制。
如何突破這三個瓶頸?
首先,我們需要對信息做一個重新的定義,制定新的計算範式。另外,進入網際網路時代,香農理論從點對點通訊延伸到多用戶資訊理論,但真正的理論框架並沒有太大進步,所以需要更多理論層面的模型更新,否則深度學習就很難引入因果關係和模型。
目前,圖像視頻編碼技術的發展已經達到性能極限,如何用AI徹底、大幅度地進行改善也需要我們的思考。
此外,還需要新計算體系和通訊架構,創新傳感器類型。傳感器能夠獲取各種各樣的數據,所以非常重要。有觀點認為,人用「小數據」就可以做決策,但我認為大數據是機器的優勢,雖在決策方面與人相比稍有欠缺,但在獲取各種不同數據時比人更有優勢。
同時,需要新模態。深度學習需要的Tensor Products、線性代數、布爾代數等要素在傳統的馮諾依曼架構下不易實現,通過研發GPU、ASIC等技術加速並徹底形成新架構成為了大趨勢。除了傳統的英特爾、AMD,谷歌、百度、地平線、寒武紀等公司也在做這件事,在新架構產生之後,就會隨之產生更多新算法、新模型、新型晶片,這將是一個非常大的機會。
這是一個我在百度啟動的項目:崑崙晶片,這是一個大型晶片,主要用於大型訓練,已經在百度部署。第一代崑崙晶片能在150瓦的功率下實現260 TOPS的處理能力。第二代崑崙晶片採用7nm先進工藝,相對於第一代晶片而言,性能提高了3倍。
核心基礎設施「ABCD」
帶來智能時代的顛覆性改變
演講現場
計算、通訊、新架構、新算法,它們給產業帶來的新機遇,就像聯想的「3S戰略」,在IT行業不斷升級的背景下,為整個產業帶來了新機遇甚至是顛覆性的改變。
抓住新的行業機遇,我們正在面臨第四次工業革命,如果說前三次工業革命中國是旁觀者,但在這一次,中國有機會在很多方面成為引領者。
面向第四次工業革命,我們希望能夠打造成一個國際化、智能化和產業化的智能產業研究院(AIR)。我們有三個方式達到這個目標:最重要的是吸引一流人才,特別是擔任過CTO、研究院院長的人才,另外還要有深厚的學術背景和豐富的企業經驗;其次,研究院還要培養目前我們還比較缺乏的、具備深度大系統思維能力和頂層設計能力的CTO和頂級架構師;最後,我們要打造核心技術並逐步將其發展為公司。
目前,我們剛剛起步,除我之外,還有兩位聯合合伙人,一位是馬維英博士,他是電氣電子工程師學會院士,字節跳動副總裁、人工智慧實驗室主任,也是微軟亞洲研究院前常務副院長;另一位是趙峰博士,他也是電氣電子工程師學會院士,還是前海爾集團CTO、副總裁,全球loT教科書編寫者。這兩位聯合合伙人非常符合我剛才的描述,不僅發表很多學術文章,同時又有豐富的產業經驗。
我們聚焦於三個研究領域:智慧交通、工業網際網路、智慧醫療。我認為,智慧交通能夠為整個社會和產業帶來巨大的影響,作為未來5-10年最有挑戰的技術,無人駕駛還能夠通過狹義的人工智慧解決自身的難題。我們還聚焦工業網際網路、IoT、智能感知,因為他們是數字世界和物理世界的接口;在我們看來,AI在未來十年還可以深層次地改變整個醫療健康產業,不局限於AI機器人針對病人和醫護人員的協助性工作,還包括製藥、蛋白質結構預測等,實現以上三領域的發展都需要基礎設施「ABCD」,即AI、Big Data、Cloud、Device,以及學者對基礎科學研究的支持。
在AIR,我們採用完全開放的模式,希望和整個產業有多種形式的合作,比如聯合實驗室、聯合科研項目、共同孵化項目,我們也希望能夠通過這個機會認識更多創業者,讓大家更了解AIR,大家齊力構建更大的生態圈。