國際計算機學會訪談芮勇:多媒體計算、AR和智慧型手機的未來

2020-12-08 智東西

智東西(公眾號:zhidxcom)
文 | 國際計算機學會

日前,國際計算機學會(ACM)對聯想集團首席技術官、高級副總裁、ACM Fellow芮勇博士進行了專訪。在專訪中,芮博士講述了自己的學術研究生涯,並對行業未來的技術發展,如智慧型手機、AR,多媒體計算等進行了分析和解讀。以下是專訪的中文譯文版。

Q1、您是怎樣進入多媒體計算研究領域的?

在我讀本科和碩士的時候,我的方向是控制理論和大規模系統優化。這些專業知識對我後來在多媒體領域的研究工作,比如「相關性反饋(relevance feedback)」,神經網絡和深度學習等,都發揮了重要的作用。

在伊利諾伊大學厄巴納-香檳分校讀博期間,我開始從事多媒體分析和檢索的研究。那時,網際網路還處於幼年時期,Web瀏覽器剛剛出現,而搜尋引擎還沒有誕生。在那個時代,圖像搜索的概念相當超前。

當時我遇到了一個很好的機會。美國國家自然科學基金會設立並資助了 「數字圖書館」項目。我有幸參與其中。我把控制理論,信息檢索和計算機視覺這三個領域融合起來,進行了深入的跨學科研究,最終,我成為第一批基於相關性反饋實現圖像搜索的研究者,為圖像搜索創造了一種全新的模式。「相關性反饋」是一種通過用戶先前的搜索結果和行為模式分析而優化搜索結果的方法。

獲得博士學位後,我開始了在微軟18年的職業生涯。在那裡,我繼續從事多媒體分析、理解和檢索,機器學習,計算機視覺和模式識別等領域的研究工作。

現在,作為聯想的首席技術官和聯想研究院的領導者,我將繼續帶領團隊推進多媒體計算的發展,並將最前沿的多媒體研究成果融入到聯想的產品和服務中去。

Q2、如今這個時代,每天都會產生大量的多媒體數據,那麼在未來,多媒體分析和檢索有什麼能為社會帶來重要價值的新興應用?

從技術的角度來說,以深度學習為代表的人工智慧算法正在並將繼續促進多媒體研究,尤其近期深度學習較好構建了基於多模態(multi-modality)的算法框架,使得跨領域的多媒體數據的有效融合、利用/檢索成為可能。

比如圖像和視頻的描述(captioning)。幾年前,描述能做的只是給圖像或視頻自動打上標籤(tag)。而深度學習建立了計算機視覺和自然語言處理之間的連接,可以將零散的標籤變成一句基於視覺內容並且通順連貫的自然語言描述。

隨著相關領域和硬體設備的進一步發展,圖像/視頻描述甚至將支持一段(多句)關於內容的自然語言描述,也將支持更自然的用戶交互系統;支持的模態(modality)也會超越計算機視覺和自然語言處理的範圍,例如,可以導入語音特徵(voice features), 空間深度信息(depth feature), 文本特徵(text features)等。

Q3、智慧型手機是人們消費多媒體內容的主要渠道之一,聯想也是智慧型手機製造商。根據現有研究和產品開發的進展,您認為未來的智慧型手機會是怎樣的?

從技術的角度來看,未來,像人工智慧、VR/AR, 5G, 實時翻譯,新電池技術以及全息技術的發展,將深刻改變智慧型手機和用戶的體驗。

具體而言,無邊框屏(infinity screen),神經網絡處理器(NPU),以及更多的傳感器可能會出現在智慧型手機上。在傳感器方面,手機將會融合生物特徵傳感器、深度攝像頭,多攝像頭以及更好的計算機視覺技術。此外,5G的發展將為智慧型手機用戶帶來10倍帶寬和零延遲。

智慧型手機的形態也可能會發生大的變化。其中一個可能性是可摺疊手機。比如,2016年,聯想研究院研發出業界第一個真正的可摺疊手機原型CPlus和Folio。CPlus可以在手機和腕錶之間轉換形態,而Folio則可以在平板和手機之間隨意切換。

Q4、聯想正在進軍AR/VR領域,比如聯想VR Classroom以及迪斯尼和聯想合作推出的《星球大戰:絕地挑戰》AR設備Lenovo Mirage。AR/VR技術已存在了幾十年,為什麼現在這些技術正在走向主流?

是的,AR/VR技術已經存在了幾十年。但近年來的技術突破,比如光學鏡頭,計算機視覺以及slam(simultaneous localization and mapping, 即時定位與地圖構建),讓AR/VR技術開始加速發展,巨大潛力開始顯現。另外,AR/VR可以幫助解決很多行業上的痛點問題,也能夠給用戶帶來全新的娛樂體驗。

我個人認為,與VR相比,未來AR很可能會成為一個更大的、更有前景的平臺。尤其是當AR與垂直行業結合時,比如教育,培訓以及工業維護等。在聯想2017Tech World上,我們展示了聯想研究院研發的晨星AR(daystAR)眼鏡原型以及我們的AR平臺。一位工程師在現場展示了如何利用這些AR設備和平臺維修出現故障的飛機發動機,生動地詮釋了AR技術在垂直領域的廣闊應用前景。

相關焦點

  • 聯想CTO芮勇:我們在人工智慧上是如何轉型和布局的?
    目前聯想研究院在人工智慧的發展上存在哪些優勢,芮勇博士所擅長的多媒體計算領域又將如何與聯想的產品與業務相結合?雷鋒網 AI 科技評論近期與芮勇博士進行了一次專訪,結合國際計算機學會(ACM)對芮勇博士進行的採訪內容整理成文,並做了不改動原意的編輯和刪減。
  • 聯想芮勇:智能邊緣計算助力機器人實現大飛機噴漆等行業場景應用
    聯想集團高級副總裁、CTO芮勇在大會主論壇發表的主旨演講中透露,在聯想智能邊緣計算的助力下,聯想打造的晨星機器人,能讓工人通過機器人精準地執行遠程噴漆工作,這一應用已落地於中國商飛的國產大飛機的製造場景中。芮勇介紹稱,飛機需要噴漆的零件高達數百種,在傳統自動化噴塗實踐中,機械臂的示教和調試要花費幾周的時間;但如果採用人工噴漆,質量會依賴於工人的操作手法,也很難保證一致性。
  • ACM公布2017 Fellow名單,楊強、芮勇、馬毅等7名華人當選
    最新的ACM Fellow名單無疑再次印證,中國力量在國際AI領域不斷擴大。全球最大的計算機領域專業性學術組織ACM在官網最新公布了2017年最新當選的Fellow,人數一共54名,來自加拿大、中國(包括香港)、丹麥、德國、瑞士、英國和美國的大學、公司和研究中心。
  • VR和AR的未來發展
    vr/ar的應用什麼是虛擬實境?虛擬實境技術(vr)是一種能夠創造和體驗虛擬世界的計算機仿真系統,它使用計算機生成一個模擬環境,它是多源信息融合、交互式三維動態場景和實體行為的系統仿真,使用戶能夠沉浸在環境中,什麼是AR?
  • CVTE視源股份亮相ACM國際多媒體會議
    10月21日-25日,第27屆ACM國際多媒體會議(ACM International Conference on Multimedia, 簡稱ACM MM)在法國尼斯隆重舉行。在本屆會議上,CVTE中央研究院共有兩篇論文(1篇Full Paper,1篇Challenge Paper)被大會收錄,應邀前往法國作講解報告。
  • 第五版《中國計算機學會推薦國際學術會議和期刊目錄》今日公布
    雷鋒網 AI 科技評論消息,成立於 1962 年的中國計算機學會(CCF)一直為計算機領域專業人士的學術和職業發展提供服務,並不斷進行學術評價,引領學術方向,由 CCF 發布的《中國計算機學會推薦國際學術會議和期刊目錄》也一直是值得計算機領域人士參考的學術評價風向標。
  • 智慧型手機之後,下一個風口在哪?
    自從計算機出現以來,技術產業大概每十五年就會出現一個新的中心。這個議程是由計算模式確定的,誰贏得這個模式,誰就主導了整個行業,每個人都對此感到恐懼,然後新模式出現了,形成了新的中心,而舊模式就不再重要了。大型機之後是PC,然後是Web,接著是智慧型手機。
  • 國際計算機協會:ACM Fellow 名單重磅發布!12位華人學者入選
    臺灣國立大學電機工程學系教授兼院長,2020 年 1 月 15 日被任命為國際電子設計自動化頂尖學會 IEEE CEDA 總裁。關注高維數據的智能獲取、處理和管理之間的關係,在應用系統中發揮作用,在兩個領域入選全球高被引科學家。 入選理由:為基於高階數據的計算和學習做出貢獻。 陳怡然:
  • 計算所成立智能計算機研究中心
    智能計算機是人工智慧的硬體基礎。深度學習、類腦計算以及新型存算器件等使能技術的發展,為研製具備更高智能和性能的新型計算系統提供了機遇。  智能計算機研究中心為計算所下屬二級研究機構,以「一個核心,兩個平臺」為發展思路,即以研製領先的智能計算機為核心任務,成為智能計算機關鍵技術研究平臺、智能計算系統優秀人才匯聚和成長的平臺;以「應用牽引,使能驅動」為技術發展路線,充分發揮計算所在計算機體系結構學科、大機器和大晶片設計、高層次人才聚集、高水平國際合作等方面的獨特優勢,以國家在智能計算機研究領域的布局和具體戰略需求為牽引,
  • 編程貓亮相國際頂級計算機會議ACM,發表重要研究成果
    【天極網IT新聞頻道】近日,第28屆ACM國際多媒體會議在線舉行,編程貓核心技術中心聯合北京航空航天大學、中國科學院信息工程研究所亮相ACM會議,並表了《關於如何在細粒度上刻畫跨模態語義鴻溝》的論文,希望在視覺與文本中搭建有效橋梁,為將來提升教學效率做好技術儲備。
  • 華人AI界痛失「一代宗師」,計算機視覺之父黃煦濤先生去世
    黃煦濤先生是中國工程院和中國科學院「兩院」外籍院士,美國國家工程院院士,電氣電子工程師學會(IEEE)、美國光學學會、國際模式識別學會、國際光學學會(SPIE)等學會成員,還在國立臺灣大學、國立交通大學、山東大學、中國海洋大學、青島科技大學等校任榮譽教授。
  • AlphaZero學會控制量子計算機
    許多人知道,量子計算機是一種基於量子物理使用量子邏輯進行通用計算的設備。不同於電子計算機,量子計算用來存儲數據的對象是量子比特,它使用量子算法來進行數據操作。一個系統一次可以存在多個狀態。當翻譯成計算機語言時,這意味著量子計算機可以一次執行多個計算,這大大提高了計算速度。
  • 編程貓亮相國際頂級計算機會議ACM,探討人工智慧與教育融合發展
    近日,第28屆ACM國際多媒體會議在線舉行,編程貓核心技術中心聯合北京航空航天大學、中國科學院信息工程研究所亮相ACM會議,並表了《關於如何在細粒度上刻畫跨模態語義鴻溝》的論文,希望在視覺與文本中搭建有效橋梁,為將來提升教學效率做好技術儲備。
  • 計算機基礎知識|計算機的特點、用途和分類
    目前最大、應用範圍最廣的是「國際網際網路」(Internet),在網上的所有計算機用戶可共享網上資料、交流信息、互相學習,整個世界都可以互通信息。 計算機網絡功能的重要意義是改變了人類交流的方式和信息獲取的途徑。2.計算機的應用計算機問世之初,主要用於數值計算,而今的計算機幾乎和所有學科相結合,在經濟社會各方面起著越來越重要的作用。
  • IEEE計算機學會發布2021技術預測,計算技術未來發展趨勢是什麼?
    近日,IEEE(電氣電子工程師學會)計算機協會(IEEE CS)公布了其2021技術預測報告(2021 Technology Predictions),重點關注大流行對人類生活,供應鏈,勞動力以及運營和市場的不可預測性的影響。
  • 計算機系師生在多媒體建模國際會議上獲最佳論文獎
    計算機系師生在多媒體建模國際會議上獲最佳論文獎   清華新聞網3月1日電 日前,在中國黃山舉辦的第19屆多媒體建模(Multimedia Modeling)國際會議上,清華大學計算機系博士生劉少偉與教師崔鵬、朱文武、楊士強聯合發表的論文《社會-視覺信息感知的圖像搜索排序