8月7日,2020年全球人工智慧和機器人峰會(CCF-GAIR 2020)在深圳正式開幕。
誕生於2016年的CCF-GAIR,致力於打造國內AI和機器人領域規模最大、規格最高、跨界最廣的學術、工業和投資平臺。CCF-GAIR 2020峰會由中國計算機學會主辦,香港中文大學(深圳)、雷鋒網聯合承辦,鵬城實驗室、深圳市人工智慧與機器人研究院協辦。
2020年,新基建浪潮風起雲湧,AI、5G基站建設、大數據中心、工業網際網路、城際高速鐵路和城市軌道交通、新能源汽車充電樁、特高壓等七大領域迎來歷史發展機遇期。
「十年一遇」的新基建大浪潮,碰上方興未艾的AI產業,CCF-GAIR 2020峰會主題亦鎖定在了「AI新基建,產業新機遇」。
AI新基建,究竟會帶來哪些產業新機遇呢?
城市大腦要升級到2.0版本
中國工程院院士、鵬城實驗室主任高文,重點分享了智慧城市建設中「城市大腦」的最新發展情況。
智慧城市的核心是城市大腦,城市大腦的核心是視覺認知計算(VCC)。
高文表示,城市大腦要從1.0升級到2.0版本。
城市大腦1.0,是一個以雲計算為核心的系統,但由於系統各部分沒有很好的分工協調機制,使得系統成本高、響應速度慢、數據的可用性低。
鑑於1.0版本城市大腦存在的諸多問題,科研人員從人類視覺系統中得到啟發,進而開發出了2.0版本的城市大腦。
人類大腦和視覺系統具有很好的分工,視網膜、視覺通道、大腦分工協調,在不同階段採用不同視覺編碼模型。
高文表示,城市大腦2.0是一個端邊雲合理分工協調的混合系統架構,可以有效解決城市大腦1.0存在的大部分問題。城市大腦2.0的核心,是數字視網膜及其標準化,其具有以下四大特性:
先進視頻編碼技術:節省存儲和帶寬50%以上;定製ASIC邊緣計算:節省雲計算資源90%以上;原始圖像上特徵提取:低延時和高精度;標準化特徵的提取,存儲和復用:顯著提升信息密度和價值。實現AI的三大法寶
作為產業界代表,科大訊飛聯合創始人胡鬱、京東技術副總裁何曉冬以及依圖科技CTO顏水成,分別帶來了他們對AI產業化的思考。
胡鬱認為,深度神經網絡、大數據、漣漪效應,是實現AI的三大法寶。
深度神經網絡與大數據的結合成為當前主流路徑,而基於網際網路和移動網際網路的「研究-工程-產品-用戶」閉環,又加速了迭代優化的進程。
何為「漣漪效應」?胡鬱拿「訊飛語音輸入法」舉例,早期用戶在輸入法效果非常差的時候貢獻了數據,伴隨用戶不斷給系統貢獻數據,系統性能就會不斷的提高;隨著波紋越來越多,系統誤差就會越來越小,就像水波紋的振幅一樣。當收集到幾千萬人的數據時,這時候系統性能已經提高到90%甚至是95%以上。
胡鬱指出,在感知智能和運動智能領域,人類、機器和動物處於並列齊驅的水平,而認知智能是人類獨有而動物和機器做得不太好的地方,也是目前AI最大的挑戰;從現在的研究方向也可看到,自然語言處理、知識圖譜等關係到認知智能最核心的領域,深度神經網絡並沒有給出更好的解決方案。
京東技術副總裁何曉冬,亦是深度學習和自然語言處理領域專家。圍繞「多模態自然語言處理技術進展及在工業界的實踐」,何曉冬帶來了《多模態人機對話與交互:理解、創作、決策》的主題分享。
何曉冬認為,相較於GPT-3這樣的端到端的「暴力美學」技術路線,我們可以開展更多基於知識和推理驅動的任務,比如說一些複雜的任務型對話系統,它可以驅動我們研發真正高級的智能模型;我們也需要更多模態的數據,通過海量文本、語音、圖像和視頻數據,建設跨模態數據集和知識庫。
依圖科技CTO顏水成,同樣是位科研界大咖,他帶來了《芯智能,新基建》的主題分享。
顏水成認為,工業界要想讓AI走向落地,一個非常重要的點是要讓AI的成本降低,讓用戶用得起;這時候就需要把算法的效能和晶片的效能通過協同開發的方式去形成AI的解決方案,而不是純粹的算法——這種解決方案稱之為「芯智能」。
從「芯智能」的解決方案,到 「算法即晶片」的理念,顏水成指出:
要想打造一款有競爭力的晶片,要清晰明白這個晶片典型的使用場景,它的主要算法以及這些算法在未來幾年裡可能的發展趨勢,然後根據這些信息再去對晶片架構進行優化,以及對工具鏈做相應的優化,最後實現它們相互的優化,但同時也要保障晶片和算法能夠分層解耦。
AI研究的新進展
CCF-GAIR 2020依然是學界大咖的陣地。南京大學人工智慧學院院長周志華、香港中文大學(深圳)校長講座教授黃鎧、北京語言大學信息科學學院院長荀恩東、鵬城實驗室副主任陳長汶,分享了他們關注領域的最新研究成果。
通過一個破譯瑪雅曆法的真實案例,周志華引入了「反繹學習(Abductive Learning)」概念——從不完備的觀察出發,得出最可能的解釋。
周志華表示,反繹學習將基於知識的邏輯推理和基於事實/證據的機器學習相結合,有著非常好的應用前景。
我們現在都在談數據、算法和算力,但是未來不能忽略知識,知識凝聚了人的智慧,過去十幾年都從數據驅動做人工智慧,現在是時候把數據驅動和知識驅動結合起來了。
作為學界泰鬥,黃鎧分享了對「5G雲、AIoT和邊緣計算」的最新思考。
黃鎧認為,計算機一定要走向智能化,如果只是高性能計算+序列化的雲,那麼這樣的雲計算就缺乏智慧,除了算力、算法,還要有智慧,因此AI、機器學習、深度學習要布局在雲端,而且要圍繞雲端開發邊際雲(Edge Cloud)。
黃鎧還談到了SpaceX發射的通信衛星。他表示,SpaceX通信衛星未必會取代6G,但毫無疑問會連接大量的IoT設備。目前,SpaceX已發射720個通信衛星,未來會全面增加到12000個。
作為信息和語言學專家,荀恩東認為語音智能的核心問題是「語義理解」。
荀恩東表示,語音智能之所以那麼難,是由自然語言的特點所決定的,畢竟自然語言的歧義無處不在;其中歧義包括語義、詞法、語法、語意、語用等方面的內容,還涉及到語言多樣性,並且面臨著知識瓶頸。
基於這個背景,荀恩東提出了語言智能的四類應用,分別是分類、生成、抽取,校對。他還表示,語言關係在數學上可以表現為序列關係、幾何關係、數的形態和圖的形態,複雜的問題都是這些形態的組合。
做語言理解實際上就是把自然語言做結構化,這種結構化是計算機可操作的一個結構化的方案,這種結構化的方案很容易對接落地的需求。
鵬城實驗室,是在深圳設立的主攻網絡空間科學與技術的省級實驗室。作為實驗室副主任的陳長汶,分享了對「視頻物聯網」領域的思考。
陳長汶認為,視頻物聯網是新一代的智能化物聯網,「感知」「聯網」「集成」構成其三部曲。
陳長汶表示,傳統的視覺傳感器通常為單一應用設計,數據存於本地;新一代視頻物聯網要求全新的智能化聯網思路和設計,具體包括無處不在的無線接入系統、大規模聯網的雲計算平臺以及邊緣計算、霧計算等下一代網絡計算新架構。
關於視頻物聯網的技術挑戰,陳長汶亦沒有諱言,主要包括以下五大方面:
感知前端的嵌入式視覺數據處理;可靠和自適應的視頻物聯網通訊連結能力;基於視頻物聯網應用的有效搜索和檢索;網絡安全和個人隱私的恰當平衡;建立視頻物聯網和標準平臺。
5G、AI和視頻物聯網,會擦出怎樣的火花?陳長汶表示,5G具有的智能化前端、高寬帶低延時聯網、全局優化集成以及mMTC應用場景等特徵,配合日益增強的視覺傳感器AI數據分析和聯網能力,將加速視頻物聯網走向成熟,並為醫療健康、消費電子、智能交通/智慧城市、機器人、工業製造等領域帶來重要的行業應用。
結語
為紀念在計算機視覺領域做出巨大貢獻的已故華人計算機視覺鼻祖黃煦濤,CCF-GAIR 2020還特別開設了「計算機視覺之父黃煦濤紀念專場」。專場邀請黃煦濤生前好友和學術弟子齊聚一堂,來回憶、總結並探討黃煦濤在學術生涯中的軼事、學術成就和貢獻,以此來紀念這位學術前輩。
黃煦濤(Thomas S. Huang),1936年出生於上海,信息學家,中國工程院外籍院士、美國國家工程院院士,中國科學院外籍院士、臺灣中央研究院院士,美國伊利諾伊大學厄巴納-香檳分校Beckman研究院圖象實驗室主任。當地時間2020年4月25日,黃煦濤在美國印第安納州逝世,享年84歲。
黃煦濤主要從事教學與圖像處理、模式識別、計算機視覺和人機互動等方面的研究工作,並發明了預測差分量化,被譽為「華人計算機視覺鼻祖」。
據介紹,黃煦濤門下大概有120多個博士生,其中在大陸的「弟子」佔到了超過70%的比例。現在,黃煦濤的學生遍布中國前沿科技研究和科創產業領域。即便大師仙去,他的精神以及他的弟子,也將繼續影響著中國前沿科技和計算機視覺研究的未來發展。