PingWest品玩6月17日訊。在今年的全球計算機視覺頂級會議CVPR(Conference on Computer Vision and Pattern Recognition國際計算機視覺與模式識別會議)上,OPPO獲得兩項第一名、兩項第三名。
OPPO獲得第一名的技術成果為將模糊圖片」算「清晰的「極端超級解析度感知」技術;此外,通過照片計算拍照方位的"手持設備視覺定位"技術則獲得第三名和分項第一;通過讀取錄像智能識別其中人類行為的「長視頻行為識別」技術,同時獲得第三名。
除OPPO研究院智能感知與交互研究部之外,OPPO美國研究所也在CVPR上展露風採,取得「真實世界超解析度圖像處理技術」(Real-World Super-Resolution Challenge:Track 1: Image Processing artifacts)第六名的成績,OPPO美研所時空實驗室主管孟子博在CVPR做了暗光影像技術演講「穿透黑暗:從圖像到視頻」(Looking into the dark: from image to video), 美研所AI計算機視覺高級技術總監全書學做了「從零開始構建可在智慧型手機和AR眼鏡上運行的統一SLAM系統」演講(Building a unified SLAM system running on both smartphone and AR glass from scratch)。
「極端超解析度感知」( Perceptual Extreme Super-Resolution)是CVPR難度最高的賽項之一,要求從模糊的低解析度圖片中,獲得細節更清晰、更接近真實情況的高清圖像。這是計算機視覺技術中難度最大的領域之一,需要儘可能地平衡圖像的畫質與真實性。針對這項挑戰,OPPO提出了獨創的神經網絡架構RFB-ESRGAN,通過更智能的方式提取原圖特徵,用分布式算法提高計算效率,以更多元的採樣與計算模型配合,通過計算把模糊的圖片清晰放大了16倍,從全球280多個頂尖參賽團隊中脫穎而出,獲得了第一名,其他參賽者,不乏來自臉書、百度、微軟、亞馬遜、中科院、UIUC等國際頂尖科技公司與院校的團隊。
OPPO極端超解析度感知處理效果,最左側圖片紅框內為原圖,最右側為最終結果這項技術將在未來為諸多應用場景提供幫助,例如將用戶手機拍攝到的模糊影像處理成細節豐富的高清效果,修復圖像受到損壞的老照片、老電影,或者對衛星、航天圖像進行細節分析等工作。
人工智慧程序對圖片從多維度進行分析在「手持設備視覺定位」挑戰(Visual localization for handheld devices challenge)中,OPPO獲得了面向室外場景的數據集(Aachen Day-Night)第一名,與面向室內場景的數據集(InLoc)第三名。「視覺定位」是通過搜集和分析圖像中的海量信息,對自身拍攝方位作出精確判斷。這一技術對未來的AR眼鏡,智慧機器人,精準導航等應用都能起到重要作用。例如,當智慧機器人助手安裝了攝像頭之後,就可以利用視覺定位技術對拍攝到的圖像作運算分析,獲得準確定位,從而精準的移動。
此外,OPPO還在「長視頻行為識別」(Activity detection in extended videos)賽項中獲得了第三名。「視頻行為識別」是指在某段視頻中分析並判斷人或物體對象的行為動作。OPPO的智能程序可高效識別並重組每一幀畫面中的人物,辨別複雜動態視頻中的人類行為。在一段數十人出鏡的長視頻中,它準確識別了視頻中每個人走動或是聊天等的數十種動作。這項技術在未來能廣泛應用在人機互動、運動分析等領域,例如未來的手機產品便可以自動識別正在運動的拍攝對象,並自動調節快門對焦。
2020年初,OPPO研究院正式成立智能感知與交互研究部,邀請行業領軍人物郭彥東博士加盟並擔任OPPO智能感知首席科學家,領導快速組建並逐步完善專業科研團隊。目前,智能感知與交互研究部已初具規模。此次OPPO參加CVPR 2020的多項獲獎成果均來自該團隊。