來源:新浪科技
出品:新浪科技《科學大家》、墨子沙龍
主講:李向陽 中國科學技術大學計算機科學與技術學院教授、博士生導師、執行院長,中國科學技術大學信息與智能學部常務副部長
作為世界上最大的博物館之一,巴黎羅浮宮坐擁數萬館藏,除了聞名世界的《蒙娜麗莎》,其中還有另外一個作品雕塑「菲迪皮德斯」。這座雕塑的名字也許並不耳熟能詳,但它背後的故事和由此誕生的「馬拉松比賽」幾乎風靡全球。
古希臘時期,菲迪皮德斯為了把馬拉松戰役取得勝利的消息傳遞迴去,在長途跋涉42.195公裡後去世了。他所傳遞的信息在現在看來也就一個比特大小,卻為此付出了生命的代價。
這麼多年來,人類一直在關注怎麼去進行信息的採集、傳輸、計算,以至於生成知識和獲得智能,當然也包括近幾年的人工智慧(AI)浪潮。
人工智慧已經經歷了很多的浪潮,現在主要是由AlphaGo引起的第三波浪潮。深度學習技術已經在圍棋領域第一次實現了機器對人類的全面勝利。除了下棋以外,在其他一些領域,人工智慧也已經做得非常好了。當然還有很多事情,可能對人來說非常簡單,但對機器卻非常難,比如根據一副圖去寫一些話或一個故事。
人工智慧離不開領域內經常講的「ABCDE」。A是算法(Algorithm),B是大數據(Big data),C是計算(Computing),D是領域知識(Domain knowledge),還有E是指生態(Echo system)。
總的來說,現在的深度學習仍是一種基於一定數據的統計規律學習,對我們所處的物理世界深度了解,而數據基本上來自物聯網設備(比如各種攝像頭等等)採集得到的各種數據。
所以,提起人工智慧,有兩個話題是繞不過去的:智能物聯網和大數據。
智能物聯網
文明是人、社會與物理世界的有機融合。在這一複雜的融合過程中,包括環保、災害、安全等多方面的問題需要妥善解決。當然有很多途徑可供採用,但最主要的方式可能依舊是通過一些設備和方法來對事件進行感知、預判,精確地了解世界。
總的來說,我們需要對世界更透徹地感知,更全面地互聯互通。物聯網(Artificial Intelligence & Internet of Things,AIoT)作為信息系統向物理世界的延伸,它極大地拓展了人類認識世界、改變世界的能力。可以說,物聯網是信息技術的第三次革命浪潮。
到底什麼是物聯網?具體的說是智能物聯網,基本上可以從三個層面來拆解這個概念:普通對象設備化、自治終端互聯化和普適服務智能化。普通對象設備化就是對任何東西都賦予它一些智能,使其變成一種感知設備。第二是自治終端互聯化,即任何設備都是互聯的,建構一個萬物互聯的世界。而普適服務智能化則指的是所有的服務都是智能化的。
物聯網整體上就是一個基於網際網路、傳統電信網等信息承載體,讓所有能夠被獨立尋址的普通物理對象實現互聯互通的網絡,並提供智能服務的載體。智能物聯網發展到現在,大概經歷了幾十年,現在已經非常普及。也許在生活中大家並沒有注意到,但實際上智能物聯網已經遍布我們身邊。
智能物聯網也是一種「今天和明天」的技術,此前的七八年間大家更多地在談論人工智慧,但下一步真正能夠落地的或許是人工智慧物聯網,是一種基於設備、基於行業的智能技術。智能物聯網以物聯網、網際網路、大數據、人工智慧融合創新,來引領我們未來的產業發展。
物聯網:智能感知技術
物聯網方面主要面對的挑戰有三,也是物聯網的三個核心:感、傳、算。
首先須得有個東西去了解世界,也就是感知技術。人感知世界的方法主要有視覺、聽覺、觸覺、嗅覺和味覺。機器感知則是利用各種信號,比如無線信號等等,並藉助一些智能的推理方法,來獲取物理世界的一些信息,比如人員是否存在、如何運動,他的行為、思想狀態、物體的狀態等等各種不同的信息。感知的方法有很多,比如常見的振動傳感器、加速度陀螺儀、光傳感器、視覺方法、聲音、無線信號等等,都可以用來感知、理解世界。
所謂「傳」,就是把感知到的內容傳回來。最後,要對傳過來的信息進行處理,即要做計算功能。當然所有過程都必須要有能量來支撐。所以說物聯網是感、傳、算以及能量四個方面來組成。不同設備的形式不太一樣,但基本離不開這四部分。
通過有限的設備感知無限世界
物聯網現在遇的一大困局是:很多時候大家發覺容易感知的信息難以傳輸,而易傳輸的信息難以感知。比如高精度視頻,這很容易感知,但是高清視頻耗傳輸帶寬太大,很多設備可能沒有能力將其傳回。另外還有些東西可能容易傳輸,比如說目標人物今天高興不高興,是什麼樣的語氣、心情,什麼感情,這很容易傳輸,信息量不大,但不容易感知。
傳輸、感知之間往往有這種不對稱、不協調的情況。當然所謂的難和易也依賴許多限制條件,所以說難易也是一個相對的概念,比如你到底要什麼設備,是不是有能量等等。但總的來說,感知和傳輸有這樣的一個困局。比如現在所有人都有手機,為什麼現在智慧型手機這麼好用,當然除了系統做得好以外,離不開硬體能力的提升。比如說,一部智慧型手機裡面有很多傳感器——光照、加速度陀螺儀、距離感知等等,就可以了解很多信息。
隨著產品的推陳出新,智慧型手機裡面的傳感器肯定會越來越多,可以測量的東西也越來越多。但依舊有一個困境無法通過增加傳感器來解決:如何以有限的感知來感知一個無限可能的世界?一個智慧型手機再怎麼能裝東西,它的體積也是有限的,但我們要了解的東西是非常多的,所以接下來研究人員們就需要面對這樣一個挑戰:如何以有限感知的設備和能力來了解無限可能的世界。
要破局,有很多方法,比如說「無感而感」,也就是在設備水平無法進行傳感的情況下,達到這樣的能力。第二種叫做「跨域感知」,即通過不同的設備,拿到不同方面的部分信息,就像盲人摸象一樣,再通過跨域感知來了解全局信息。第三種深度感知,是指利用現有技術把以往已獲得但分析不透徹的信息進行深度挖掘,可以獲得更多的信息。
目前在這一行業與學術界已經達成了一定的成果,例如此前我們團隊曾跟一些企業合作,開發了一款可以進行手語識別的智能手錶/手環。目前全中國有一兩千萬聾啞人,對於這些人群,我們可以通過這樣一個穿戴式智能手錶,在他們打手語的時候,對手語進行識別從而實現交互,為他們提供一種更方便跟外界做交互的新選擇。
除此之外,智慧型手機還可以測量心跳,一部手機只要拿在手上或放在口袋裡,就能測出你的心跳。這是通過跨域感知實現的。
神奇的「RFID」技術
這一領域內甚至還存在沒有電池的感知。二戰時期,蘇聯送給美國大使館一個木頭雕制的美國國鳥雕塑。美國人做了很多檢查,發現沒什麼問題,就放到了他們大使館。大概在七年後,一個英國大使館的小夥子調收音機,卻聽到了美國大使館的人在說話。大家去查聲音的來源,第一次什麼都沒查出來。最後把這個雕塑卸開以後,發現裡面有一根大概20多釐米的鐵針。而這個神奇的竊聽設備能夠竊聽既不需要電池,也不需要外來電流,卻能捕捉300米以內大耗電量振蕩器所發出的微波脈衝。這就是著名的「金唇」行動,即Great Seal Bug (The Thing)事件,是人類歷史上第一個沒有電池也可以感知周圍聲音的設備。
它的基本的原理是,人們說話的時候會有聲波振動,振動會引起周圍無線信號的一些變化。鐵針通過外面傳播給它的能量,從而產生一些微小的振動,通過反射回去的能量可以恢復人的聲音。基於這一技術,在1971年,Mario Cardull發明了Radio Frequency Identification技術,簡稱「RFID技術」。他做了一個沒有電池的小天線,通過另外一個讀寫器,發射能量打在天線上返回,就可以獲取很多信息。
RFID現在使用的很多,有很多不同的技術,可分為無源、有源等。比如大家的食堂飯卡,有的更方便的食堂,在碗上就帶有RIFD,不需要人工計價,只要盤子放到對應區域就可以知道具體價格。當然不同的技術可以實現的讀寫器和標籤距離也不同,最遠可能達到幾十米到上百米,但通常情況下大概二十米左右的距離。RFID一般應用於倉儲管理,比如像沃爾瑪很多設備上都有標籤。在二維碼時代每件設備都需要手動掃描,但通過RFID標籤,可以實現遠距離、大批量的設備識別,大大提高了效率。但同時RFID目前也存在一些挑戰,如漏讀等。
如果未來RFID的定位距離精度能夠提高到10-15釐米左右或者10釐米以內,就能可以實現很多有趣的應用。一位MIT老師就依託此技術做出了一個應用:將每個商品貼上RFID標籤,顧客將商品放入購物車中,同時顧客錢包中裝有RFID的銀行卡,通過距離的關係,可以識別出購物車中的商品是哪位顧客,然後自動付款,這樣顧客在超市就不再需要排隊等待結帳。
如果再前進一小步,把RFID定位精度提高到1釐米甚至1毫米,又會怎麼樣?目前我們在實驗室能夠做到毫米級的軌跡跟蹤,可稱之為「RIFD標籤的高精度定位和跟蹤」。如果這一技術能夠應用於機場中的行李分揀環節,那將大大降低人工成本與人工分揀的錯誤率。
它也可以應用於檢測高速運轉物體的轉速,從而得出機器是否工作正常。這種檢測主要有兩種方法,第一種是把標籤貼在物體上跟蹤物體,本質上是跟蹤標籤。但無法給物體貼標籤時,如何對物體做高精度的定位和跟蹤呢?
我們可以在一個空間中放置一些天線,利用這些天線接收無線信號,當物體在空間運動的時候,通過不斷的讀寫RFID標籤反饋的信息,根據標籤反饋過來的信號強度,或者信號的相位和時間的信息,再利用信號打到物體上產生的反射信號的相位跟反射距離和波長的公式,很容易得出物體的位置信息。
目前這部分的研究主要有兩大挑戰。首先是設備的測量相位精度較低,設備相位精度影響定位精度,目前在理論上可以做到10^(-2)毫米級別的定位精度,但實際操作中還做不到。另外,由於相位跟波長成反比,所以波長越長,相位精度越高。如果可以利用高頻小波長電磁波,就可以實現更精確的定位和知。
我們還可以通過深度學習達到識別目的。比如標籤,通過形成一種能量的時空譜,將時空譜放到深度學習模型裡面去做判斷識別;比如運動,也可以建立時空的能量譜,用深度學習模型來判別這個人到底在做什麼動作。像是在物理模型上的噪音等問題,都可以用深度學習去解決,也可以做很多智能的跨域感知。
這方面目前已經有了一些實驗:比如美國學者根據拍攝的無聲視頻中實驗對象的臉就能推斷出其心跳等身體狀況。類似工作我們自己也有做,比如學生在圖書館,不需要拍攝到他們的電腦,只通過拍攝他的桌面,就能知道電腦上在打什麼字,單個字大概能到50%的準確率,對於一個句子,則有99%的準確率。它的原理很簡單,因為敲鍵盤的時候,鍵盤在振動,桌面也在振動,所以根據桌面的振動規律,就可以反推電腦上在打什麼字。
物聯網:低耗互聯技術
有了感知,接下來就需要用這些感知數據去做互聯。我們在很多場景下都會遇到能量的瓶頸,最常見的就是手機或電腦的電量耗盡。但在很多場景下,是沒有條件頻繁更換電池的。還有一些場景是不能加入電池的。一些醫學檢測需要讓病人把一個東西吞下去,比如以色列此前研發的具備感知能力的「藥丸」,但它不能由電池提供能量,因為電池中有很多對人體有毒有害的危險物質。
在這類情況下,怎麼解決電池供電的瓶頸?我們需要研發一些新的能量獲取與網絡模式,應用於傳統方式解決不了的場景。比如在低功耗、無源通訊網絡上,通過前文的RFID標籤,在信息兩端一方是沒電池,一方有電的設定下,通過打過去反射回來,以此感知信息。這是目前美國和我們都在做的一項工作。
那麼是不是有可能讓兩個都沒有電源的設備來進行通信呢?也許聽起來難以實現,實際上這樣的技術已經發展出來了,就是所謂的「反射通信方法」。比如設備Alice要發射一個信號給設備Bob。Alice發射信號給Bob的時候,如果真的完全沒有能量,是違背物理規律的。但Alice可以反射周圍如電視塔或者wireless AP的能量,這麼反射一下,就相當於告訴Bob「我在給你發一個東西「。對Bob來講,若要知道Alice在不在發信號,就必須知道她是不是反射東西給了自己。而判斷是不是反射,則須根據統計規律:當對方不發射信號時,通常收到能量只能來源於電視塔,這可能是一個統計的規律。一旦有反射信號,統計規律會相應變化,就知道對方給自己發信號了。通過這樣一個簡單的反射和統計規律的發現,就可以傳遞信息。這就是雙方在沒有電池、沒有電源時,通過捕獲在世界裡無處不在的能量來進行通信和計算的方法。
反射通信方法——利用周圍無處不在的無線信號能量
大數據
數據採集完畢以後該如何處理利用呢?現在有很熱的一個方向叫「大數據」。什麼是大數據?第一,數據要多;第二,數據要快速的處理;第三,數據的種類很多;第四,數據實際上很多時候且大部分是沒有用的,我們要在沙裡淘金,甚至淘都不太夠,要琢,要真的用放大鏡才能發現有用的東西。
理解大數據的概念,可以先看看人類科研的四大範式:
(1)第一種是實驗範式,比如伽利略爬上比薩斜塔做了個實驗,去發現一些規律。
(2)第二種是理論範式,比如牛頓和愛因斯坦不做實驗,給出一些理論。
(3)第三種是仿真範式,是近100年出現的第三種範式。可能理論上有些東西,但跟實際可能有一些誤差,自從人類有了計算機以後,可做計算機的模擬。我在美國讀博的時候,是做火箭的,但不能說做火箭的時候去試一下,因為每次發火箭的成本太高,因此只能做模擬,這叫仿真範式。
(4)第四種是數據範式,出現在近二三十年。1998年圖靈獎獲得者吉姆·格雷在Microsoft提出數據範式。通過統計各種數據,從數據當中發現規律。
大數據確實有大用,未來學家託夫勒就說過,能夠改變世界有四樣東西:第一是暴力,戰爭是改變人類走向的力量;第二是知識,我們經常講知識改變命運;第三是金錢,它可以改變世界。第四,最重要的,他認為大數據是第四種改變世界的力量。可以說正是科研的進步才可以讓我們應用第四種「數據範式「。
大數據已經在很多方面有多方面的應用,例如:(1)在健康領域,尤其是個性化的健康醫療服務上;(2)個性化的教育上,由於疫情的影響,將來線上線下結合的教育可能會非常普及。大數據、物聯網、人工智慧在教育領域有很大的市場。(3)在社會科學上,像一些國家的競選活動,都用了很多大數據來輔助他們的競選。(4)現在也可以利用大數據做文學創作,大數據學習自動寫稿子、寫評論。(5)影視娛樂,比如《紙牌屋》電影,它就用了很好的大數據分析,分析選演員、寫劇情、什麼時間去放,效果最好。(6)城市交通,比如阿里在杭州做的指揮交通等,都是用大數據來做一些智能推斷。(7)大數據用於個性化的廣告上,比如螞蟻金服就是個人的大數據精準畫像,做個性化服務。再比如騰訊遊戲,很多廣告都是基於一個很大的領域,叫計算經濟學,它的基礎是大數據。
但是大數據還有很多挑戰與困局。隨著日益普及的物聯網設備,數據量呈指數增長,幾年後可能要將近180 ZB,但其中非結構化數據,即音頻、視頻等等將超過80%。這些數據給隱私保護帶來巨大挑戰。如果數據安全隱私沒做好,所有的「好處「都是空中樓閣,很容易出問題。但為什麼安全隱私比較嚴重,是因為數據孤島現象很厲害,很多個人和企業都擁有各自的數據,但數據不能流通。
「數據隔離」之瓶頸
那麼怎麼能讓數據不可見,但數據價值可用呢?數據隔離已經成為智能技術發展的一大瓶頸。這需要一些交叉學科的研究,比如計算科學、經濟學、數據科學、法律法規等,這樣才能讓數據真正能成為21世紀的「石油「,讓數據價值真正地流通起來。
漫畫家彼得·施泰納(Peter Steiner)於1993年7月5日在《紐約客》刊登的一則漫畫:「在網際網路上,沒人知道你是一條狗」(英語:On the Internet, nobody knows you『re a dog)。後來這句話漸漸流行起來,這一漫畫也成了《紐約客》中被重印最多的一則漫畫。的確,網絡剛剛興起的時候只是在提供互聯的服務,只是在連接機器,它並不關心機器後面的人是男人、女人、小孩子、老人還是一隻狗。
《紐約客》彼得·施泰納(Peter Steiner)來源:知乎
但是現在隨著搜索技術、大數據技術的發展,我們可以做人物的精準畫像,「狗」無處可藏。人家知道是一隻狗,在後面敲鍵盤。但技術在發展,個體意識、隱私保護需求也在增長。人們希望數據可用,但不可見,需要更高的價值和服務。即,「雖然我是一隻狗,但你不應該知道我是一隻狗」。整個人類的技術發展也可以分為這三個不同的階段:從剛開始的不知道,到後來可以精準地知道,再後來去明確哪些東西是不應當知道的。
總地來說,大數據在未來必須和人工智慧深度結合,即A(Algorithm)、B(Big data)、C(Computation)和人工智慧深度結合起來。
人工智慧,沙裡琢金
從感知再到收集數據,數據本身是沒有價值的,只有通過各種技術去挖掘數據背後的規律,沙裡琢金才真的有用,這便是人工智慧的用武之地。提起人工智慧,必須要說圖靈。他處在一個技術快速發展的好年代,但也是一個不夠開放的差年代。在很多領域多作出了巨大貢獻的圖靈,還是在1954年自殺了。
Alan Mathison Turing,1912~1954
圖靈在1950年提出了圖靈測試:如果一臺機器能夠與人類展開對話,在不見面的情況下,人類不能辨別出來其機器身份,那麼這臺機器就算有了智能。
1956年,十位著名科學家在美國達特茅斯開會,第一次提出了Artificial Intelligence,研究人工智慧的概念。後來大家都拿了圖靈獎,其中有一位先生還拿到了諾貝爾獎。
1956年在美國達特茅斯學院的討論會
人工智慧經歷了好幾次浪潮。其中第二次發生在是1990年左右,當時日本提出來做第五代計算機,當時人工智慧領域提了很多先進理念,就是因為技術等方面的不足,就夭折掉了。隨著計算、數據等等技術的發展,第三次人工智慧的發展浪潮來臨的時候,很多在二、三十年前就已經存在的技術理論才真正開花結果。
有人在討論目前算不算是人工智慧爆發的前夜。雖然有很多人工智慧公司已經成立起來,但很多公司在近些年內會面臨發展困局。人工智慧「深藍」在1997年第一次交手便戰勝了人類最好的棋手卡斯巴羅夫。現在AlphaGo也已經戰勝了世界圍棋冠軍。雖然圍棋比西洋棋難多了,但最複雜的還當屬麻將。什麼時候機器把人類麻將給贏了,那人工智慧就又上了一個臺階。因為不論是西洋棋還是中國圍棋,它都是一個能看到全局信息再做決策的遊戲,但是麻將只看到自己的牌,很多信息是不知道的,這就將難度大大提高。
1997年5月「深藍」電腦挑戰卡斯巴羅夫
中國科大智慧機器人「佳佳」
人工智慧還能進行藝術「創作」。機器可以根據風格,可以把一張真實的照片變成一張藝術照,產生藝術風格的遷移等等。當然也可以有其他具體應用場景,比如在網上購物時虛擬試衣等等。這種類似於虛擬實境的實踐,都需要人工智慧技術的參與。
人工智慧在日常生活當中還有很多其他應用。比如AI助理,遊戲語音技術,智能音箱,自動駕駛,還有醫療、智能家居、安防等等。目前人工智慧應用得最好的就在安防領域。現在很多安防企業都在搶灘布局人工智慧,其中涉及人工智慧的環節很多,從底層的晶片到中間的計算,到數據,再到深層的服務框架。
國家之間的競爭也愈發白熱化,而對中國來講,要想做好第三代人工智慧,包括做自主系統,做生態,我們既要擁抱開放的世界,還要保證研發的自主程度。
人工智慧任重道遠
人工智慧有三個階段,從運算智能(即能存會算),到感知智能(即能聽會說、能看會認),到最高級階段的認知智能(即能理解、會思考)。
現在的人工智慧研究基本上都還處在運算智能和感知智能的階段,離認知智能還有比較遠的距離。運算智能取得了很多的突破,感知智能也在慢慢的逼近和超越人類。在認知智能方面則有很大的挑戰,包括數據的瓶頸、泛化的瓶頸、能耗、語義鴻溝和可解釋性、可靠性、安全性等。
萬物互聯時代的人工智慧,最好的技術是大家天天在用,但卻感覺不到它的存在。未來我們的世界可能是無屏的,或是基於智能的交互、理解、服務,不再天天敲鍵盤輸入東西。
人類一直在採集信息做計算,要解決三個方面的挑戰:一是感知,二是計算,三是決策。目前很多機器、手機計算能力都已經很強了,但未來最可能真正改變人類命運的卻是另一個計算模式:量子計算。量子計算可能會讓以前人們認為人工智慧無法做到的事情變得可行。可以說,以前的很多「遊戲規則」,在量子計算以後可能都會改變。量子技術也不斷有新突破,不久前中國科學家已經發布「九章」量子計算機,而未來如何,我們拭目以待。