雷鋒網 AI 科技評論消息,2018 年 9 月 15 日,中國多媒體大會(ChinaMM2018)於西安正式開幕,此次會議由中科院計算所陳熙霖研究員、北京航空航天大學李波教授、西北工業大學張豔寧教授擔任大會主席,特邀報告嘉賓為雪梨大學馮大淦教授、紐約州立大學Buffalo分校陳長汶教授、快手 AI 技術副總裁鄭文博士。除了三場特邀報告,今年會議內容涵蓋多媒體與人工智慧前沿講習班、專委會沙龍、產業前沿論壇、智能媒體學術高峰論壇、多媒體新技術成果展,探討方向涉及深度神經網絡、視頻編碼、多媒體內容分析等。
作為專委會主任和大會主席,李波教授對 AI 科技評論表示,今年是 CCF 多媒體技術專委會第二次獨立承辦中國多媒體大會,今年在去年成功辦會基礎上,規模更大。去年參會人數在 630 人左右,而今年則達到 850 多人。他進一步表示,今年多媒體專委會同時承辦多IEEE媒體大數據國際會議(BigMM2018),兩個會議同期舉辦,也進行了一些合作——共享大會報告,使得會議更加國際化了。
李波教授對雷鋒網 AI 科技評論說道,相比去年來說,今年在成果展示內容方面,也迎來創新。參會成果數量與去年相比,增加了三十多項;在成果內容方面,今年更注重大家所關心的技術問題或行業熱點方面的成果,有一批智能媒體方面的成果,如數字視網膜、無人駕駛系統等。
提及今年會議的亮點,他著重談到新增的四項技術競賽——用戶興趣建模、AI 在時尚領域的應用、圖像壓縮後處理、圖像去霧處理。雷鋒網 AI 科技評論看到,四項大賽的優勝方案也在現場進行了展示。
京東 Fashion AI 挑戰賽時尚風格識別冠軍由來自業界的個人參賽者丁煌浩和萬輝獲得,他們詳細展示了這次比賽所用的模型、數據增強、調參、閾值搜索、集成階段的方案,詳細信息可以參見:
https://fashion-challenge.github.io/%E8%A5%BF%E5%A4%A9%E5%8F%96%E4%BA%AC.pdf
來自陝西師範大學的張魯同學則獲得了基於深度學習的圖像壓縮後處理競賽冠軍,在這次比賽中,他綜合了擴張卷積、殘差學習、對稱的跳躍連結技術,在最終結果上,他提出的方案只有 10 層卷積,因此運算速度非常快,藉助改進的擴張卷積網絡,實現了相當於普通卷積 20 多層的效果,再藉助殘差學習、對稱的跳躍連結和對訓練數據的處理,進一步實現精度的提升,可以看到,最終的 PSNR 為 36.3686dB,速度為 147.18s。
除了比賽方案展示,企業和高校、研究所也來到現場進行成果展示,共赴這場多媒體盛宴。
企業方面,騰訊展示了 AI 在騰訊視頻上的應用,百度對其視覺算法和學術成果進行了視頻展示,快手也展示了 AI 技術及多媒體傳輸算法的應用,愛奇藝則展示了 ZoomAI 視頻增強解決方案。當然,除了展示技術成果,各大企業也不忘在現場宣傳招聘信息。
來自學術界的成果則更加多樣化,北京大學、北京交通大學、北京航空航天大學、中國人民大學、中科院自動化所,上海交通大學、中國科學技術大學、南京郵電大學等多所高校均有成果現場參展,展示內容包括特定領域大規模長視頻數據集、基於深度殘差網絡的視頻增強技術、有雨場景下監控視頻的高效分析與編碼、基於 X 射線的輪胎缺陷智能檢測、面向公交系統的智能客服流統計算法與裝備。
圖:成果展示一角
北京大學字形計算技術實驗室中國文字字體設計與研究中心團隊帶來其智能造字技術方案,他們與方正公司進行了技術上的合作,所產生的個性化字體目前已經應用在QQ等多個平臺。現場,他們也展示了在學術上的一些成果,在智能造字技術上,他們重點展示了基於深度學習的中文字庫自動生成技術、紋理特效字形自動生成技術、字形結構理解與識別技術。
圖:紋理特效字形的自動生成
該實驗室學生王逸之對 AI 科技評論表示,他們在 CVPR 和 SIGGRAPH 上也有發表相關工作。談及參會感受,他表示,比起純學術會議關注前沿研究,這次會議更多的是學術成果的落地展示,其中深度學習技術應用得越來越多,應用領域也迎來極大擴寬,可以看到很多圖片、視頻數據在實際中的應用。
北京大學數字媒體研究所的仿視網膜成像晶片也吸引了眾人的目光。這一團隊利用已經取得的大腦初級視覺仿真結果,突破了仿視網膜視覺信號處理過程的採集成像、編碼重構及智能處理技術。在現場,他們展示了一個集成高速攝像系統,據其介紹,目前他們的方案可廣泛用於各類高速目標的檢測識別和跟蹤等任務。更多內容可以訪問實驗室官網:http://idm.pku.edu.cn/
除了與圖像和視頻相關的研究,來自中科院自動化所的團隊也帶來了 www.zhuanzhi.ai 基於人工智慧的知識分發平臺,這一平臺基於機器學習、知識圖譜、多媒體語義分析等技術,聚焦提供人工智慧領域的知識服務,在大會頒獎晚宴上,該平臺獲得多媒體前沿技術傑出展示獎。
更多獎項如下圖所示。
以上成果也與李波教授的話相互印證,這次參展成果中,可以看到許多具有實用意義的技術。
中國多媒體大會的前身是始於 1992 年的全國多媒體技術學術會議(NCMT),迄今已有二十餘年歷史,李波教授對雷鋒網 AI 科技評論表示,中國目前研究聲音、視頻、圖像的研究團隊逐漸多起來了,再加上這幾年技術的發展,中國在國際上的影響力也越來越大,在一些頂尖國際學術會議上,中國學者都佔了相當大的比例,甚至逐步成為主力軍。
他進一步表示,在圖像視頻應用方面,這幾年出現了很多新興企業,如此次前來參會的快手、商湯、愛奇藝等,而在行業應用上,以海康威視為代表的企業在安防監控方面已經處於國際前列。中國的這些企業,在多媒體應用方面的技術處於前沿,在行業應用的深度和廣度上也做得相當不錯。
而談到對多媒體技術的展望,他表示,隨著技術的應用越來越普及,會提出一些關於智能媒體方面更深、難度難度更大的問題;如果我們認為目前對語音、視頻的分析還處於感知層面,那怎麼把聲音、圖像、文字像人一樣有機結合起來進行理解,這就涉及到更複雜的研究,這是從認知層面將信息結合起來。
此外,他說道,在一些實時性較強的系統中,比如無人駕駛系統、導航系統等,時間空間的變化是實時的,涉及到的知識、數據類型更加豐富,也存在更深層次的研究。現在大家談論大數據比較多,主要在數據分析;進一步發展,需要把數據驅動和知識驅動有機結合,把各種感知信息、經驗和決策知識用於視覺導航系統、無人系統,在開放環境的實時系統中進行推廣應用,這些都需要更多更高水平的研究和開發。
接下來精彩繼續,敬請關注雷鋒網(公眾號:雷鋒網) AI 科技評論更多現場報導。
(完)
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。