雷鋒網 AI 科技評論按:2019 年 8 月 23 日至 25 日,第 10 屆國際圖像與圖形會議(International Conference on Image and Graphics,簡稱為 ICIG)將於中國北京舉行,會議由中國圖象圖形學學會主辦,清華大學、北京大學和中國科學院自動化研究所承辦,並得到了國際模式識別協會(IAPR)的支持。
ICIG
ICIG 每兩年一次,是中國圖象圖形學學會主辦的最高級別的系列國際會議,迄今已經成功舉辦了九屆。會議重點關注關於圖像、視頻和圖形處理的創新技術,以及促進創新、創業和網絡化相關工作。
本次會議的主題為「人工智慧時代的圖像圖形前沿研究」,將邀請國內外圖像圖形學領域的 3 位著名學者作大會特邀報告,集頂刊頂會論文報告、前沿科技產品展示、6 個前沿專題論壇。
3 個特邀報告
報告題目一——《The Shape of Deformations》如果一個框架由三個「棒」(相同長度)在一個共同點上相交所組成,其中我們感興趣的是表示框架的方向和「形狀」。方向是相對於參考系的旋轉;而「形狀」是相對於參考系的變形。事實證明,任何框架都可以通過莫比烏斯變換轉換為任何其他框架。
該觀點揭示了旋轉是單位四元數。單位四元數是廣為所知的,並且在空間旋轉的表示中非常有用,因為它們在變量中是連續的,在連續表示中至少需要四個坐標的意義上是最小的,並且它們具有允許允許測量變形量的自然度量,即角度。莫比烏斯變換的觀點也揭示了這是該項工作新的一面,變形是雙曲面上的點。所以「形狀」可以被描述為雙曲空間中的一個點。這是一種表示,就像單位四元數一樣,是連續的、微小的,並且具有允許測量變形量的自然度量。
報告者:柏林工業大學,Marc Alexa
報告題目二——《Improved Scene Understanding by Combining Sight and Sound》在傳統的計算機視覺研究中,我們謹慎地剝離和忽略了原聲帶;同樣,在傳統的音頻分析上忽略了視頻中可用的視覺信息。本報告將描述如何通過在視頻中使用視覺和音頻來獲得更好的場景理解;並用一個例子說明,如何使用顯示說話者面部的視頻來增強音頻分析;同時,報告中還會用「視頻監控」案例來展示音頻對場景活動理解的加強作用。
報告者:希伯來大學,Shmuel Peleg
報告題目三——《Low quality fingerprint recognition》指紋識別是最廣泛使用的生物識別技術之一。儘管其應用廣泛,但低質量指紋的識別率,例如老年人的指紋、犯罪現場的潛在指紋以及非常乾燥或潮溼的手指指紋,仍然遠不能令人滿意。本報告將介紹研究者們最近在低質量指紋識別方面取得的進展,包括指紋增強、皮膚畸變校正和稠密配準。
報告者:清華大學,周杰
2 個講習班
Visual SLAM and 3D Reconstruction《Visual SLAM》:Visual SLAM 是 3D 視覺和機器人領域的基本問題,可以在未知環境中同時恢復姿勢和 3D 結構,它具有廣泛的應用。本教程將首先介紹一些基本概念和原理,如相機模型和多視圖幾何,然後介紹 VSLAM / VISLAM 的主流框架以及一些重要的模塊,如特徵跟蹤、姿勢估計、束調整和循環閉包。此外,課程還將推出新的增強現實 VISLAM 基準,介紹一組基於 VSLAM / VISLAM 技術的 AR 應用程式。
講師:浙江大學,張國鋒
《基於圖像的三維重建》:由於計算機視覺在 20 世紀 70 年代成為一門獨立的學科,在 50 年的研究中,圖像的 3D 表示,即 2D 圖像的場景 3D 重建一直是計算機視覺研究中的經典和基本問題。近年來,隨著圖像採集設備的不斷發展,利用數位相機、街景車、無人機等設備獲取大量高解析度圖像變得方便。如何通過這些圖像構建我們的 3D 世界已成為許多應用的迫切需求。因此,在理論和應用層面,基於圖像的三維重建已成為計算機視覺研究人員的熱點。本教程將介紹基於圖像的 3D 建模的基本流水線和關鍵算法,包括運動結構,多視圖立體聲,點網格劃分,語義建模等。此外,我們將展示文化遺產數位化的幾個 3D 重建演示,智能城市,高清地圖和基於 3D 地圖的視覺重新定位。
講師:中國科學院自動化研究所,申抒含
更多關於講師信息:
張國鋒http://www.cad.zju.edu.cn/home/gfzhang申抒含http://vision.ia.ac.cn/Faculty/shshen/index.htm
Plenoptic Face Analysis人臉分析是機器學習和計算機視覺領域的重要研究課題之一。它在智慧型手機、金融支付、公共安全、互動娛樂等方面具有廣泛的應用。通過編輯、合成和生成新的人臉圖像,不僅可以提高原始人臉圖像的質量,而且可以增加人臉數據規模,從而提高現代人臉識別系統在複雜環境中的魯棒性。
全光面部分析包含視覺面部圖像的收集、重建、編輯、解釋和識別。研究內容大致分為理論和應用。理論研究包括圖像採集、深度學習、轉移學習、弱監督學習等,應用研究涉及人臉對齊、人臉輪換、表情合成、屬性編輯等。基於視覺信息獲取和深度學習框架,教程深入分析了全光面部分析的理論和應用。
首先,基本部分將從全光計算攝影、視覺拓撲認知、概率生成模型和身份保存結構等方面介紹深度全光人臉分析所涉及的主要理論和方法。然後,應用部分將深入探討特定的應用場景以及面部生成、面部旋轉、年齡合成、光場成像等方面的最新進展。相關研究發表在幾個頂級期刊和會議上,如 IJCV,IEEE TPAMI,TIP,TIFS,ICCV,CVPR,ECCV,NeurIPS,AAAI。
Plenoptic Face Analysis 講師
2 個技術競賽
一、智能交通視頻圖像增強處理競賽
競賽背景視頻和圖像傳感技術在智能交通中應用越來越廣泛,這些應用的效果很大程度上依賴採集圖像的質量。然而,智能交通系統運行環境複雜,在霧/霧霾等惡劣天氣下採集的視頻或者圖像會發生嚴重的質量退化,難以滿足實際應用需求。因此,需要採用圖像增強算法對在霧/霧霾、雨、雪等惡劣天氣下採集的低質量圖像進行去噪增強處理,以改善圖像的視覺效果、提升後期圖像識別的精度。
此項競賽依託第十屆國際圖象圖形學學術會議,由北京和普威視科技股份有限公司冠名支持,旨在吸引國內外圖形圖像領域及智能交通領域的研究人員,結合計算機領域的技術優勢和智能交通領域的專業知識,共同搭建具有實際應用價值的服務於智能交通領域的圖像增強技術。參賽獲勝隊伍可獲得獲獎證書和獎金,同時和競賽組織者合寫一篇總結論文發表於頂級刊物。
該競賽作品提交截止至 8 月 5 日,在 8 月 12 日將公布競賽結果,並在 8 月 23 日至 25 日 ICIG 2019 大會期間進行競賽頒獎。
數據集競賽方提供了一組訓練集和驗證集,該訓練集和驗證集來自「Benchmarking Single Image Dehazing and Beyond」。訓練集和驗證集共包括 5500 張合成的霧圖、清晰的圖像以及深度信息,之後還有一個由 20 張真實世界的軌道交通監控霧霾圖像組成的測試集會發布。
競賽流程訓練:提供圖像去霧/霧霾的訓練集,但不限定訓練集。驗證:提供圖像去霧/霧霾的驗證集,驗證集與訓練集由不同圖像和參數合成得到。測試:測試集稍後公開發布,但與驗證集性質相似。環境:不限定測試環境。評測:參賽方在規定時間提交測試集處理結果,獲勝者需提交圖像去霧/霧霾處理代碼,由組織方在測試代碼並得到最終的處理效果和處理速度,兩者排名均靠前者為優勝,所有評測結果均在網上及時發布。二、小目標與遮擋物體檢測競賽
競賽背景遮擋和小物體是物體檢測任務的難點之一,尤其是在監控、自動駕駛和視覺感知的應用場景中。因此,該 Workshop 特別設置了遮擋圖像識別和小物體檢測兩個競賽單元,從而更好的促進計算機視覺領域的發展。
小目標檢測數據集數據集基於虛擬仿真環境創建,模擬無人機在低空飛行時,對城市道路上行駛的多種車輛進行航拍並收集可見光圖像。識別目標為公路上的車輛,其中包括 12 種車輛(BMW、Nissan、Mustang、Mini、Volkswagen、Policcar、Lincoln、Tazzar、Jeep、Truck、Bus、SUV),並且同時考慮四種成像條件:兩種天氣條件(晴天和霧天)以及兩種光線條件(白天和黃昏)。
特別強調,圖像數據中樹木或建築物對目標車輛有不同程度的遮擋,對於極其嚴重的被遮擋目標(遮擋率超過 90%),依然給出其 BoundingBox,即該遮擋目標包含於被識別目標 GroundTruth 中,參與最終模型評估。
遮擋目標檢測數據集遮擋目標檢測數據集包含了人、車、船、飛機四個大類,每類訓練和驗證集包含 10 張真實遮擋圖像,50 張多源仿真圖像以及 1000 張同源仿真圖像,測試集約 500 張(以實際數量為準,詳見文檔更新)。其中多源仿真圖像指來自於各種遊戲、仿真數據集等場景的遮擋圖像,同源仿真圖像為使用本實驗室仿真平臺生成的遮擋圖像。數據集標註包含了圖像中對應類別的全部物體,被遮擋物體的遮擋面積等信息。
6 個論壇
論壇一:頂會頂刊經驗交流分享
簡介:圖像圖形學領域,每年國內外發表了大量學術論文,佳作湧現、新人輩出。如何在這個群賢爭鳴的時代做出有特色的的高水平研究、發出自己的聲音、乃至脫穎而出,是一個廣大科研工作者、特別是青年學者值得思考的問題。本論壇邀請在圖像圖形學領域從事多年一線研究和應用的青年才俊,分享自己在頂會頂刊方面的相關成果,特別是形成自己研究特色和學術標籤的心路歷程和研究經驗。
論壇二:優博論壇和青託論壇
簡介:本論壇圍繞圖像圖形基礎理論與應用研究的前沿課題,開展學術交流和技術研討,旨在為廣大青年學者提供一個學術交流與合作的舞臺,增強優秀青年人才的活力與凝聚力,促進圖像圖形學領域優秀青年人才的成長,展示青年人才的最新研究成果,激發青年科學家的創新性,促進和提升我國圖像圖形學的科技水平和人才培養。
論壇報告講者及主持人主要來自於由 CSIG 推薦的中國科協青年人才託舉計劃入選者代表以及 CSIG 優秀博士學位論文獲得者代表,在普及圖像圖形科技知識、探索前沿高新技術與應用推廣、職業發展等方面開展交流與研討,對於我國圖像圖形基礎理論及學科技術的應用發展具有重要的推進作用。
本論壇將充分發揮學術引領作用,通過開展學術報告和研討的方式吸引廣大青年學者加入論壇,營造高層次、高水平的學術交流環境,就圖像圖形學科發展動態和研究熱點進行探討,分析青年學者在圖像圖形學領域面臨的機遇、挑戰以及肩負的使命,啟迪新的學術思想和創新,共話未來。
論壇三:快速視覺通路論壇
簡介:快速偵測環境中的危險並進行下意識的防禦反應對於生物體在自然界中的生存是至關重要的。目前廣泛認為上丘和枕核等皮下腦核團共同構成了一條快速視覺通路,能夠在警覺意識產生之前粗略地將危險相關的視覺信息迅速傳遞到杏仁核,從而引起生物體的防禦反應。本論壇以快速視覺通路為主題,旨在推動皮下視覺通路研究的發展,並加深對大範圍優先神經環路表達機制的理解。論壇將邀請本領域多位國內頂尖學者作報告,介紹他們的研究成果,分享他們的研究經驗,為從事相關研究的廣大教師和學生提供一個學術交流與合作的平臺。
論壇四:第三屆視覺大數據高峰論壇
簡介:全球視覺數據正在呈現爆炸式的增長,給視覺大數據的處理帶來了前所未有的挑戰,同時也給視覺技術的應用帶來了巨大的機遇。本論壇旨在通過科研工作者、行業企業精英等視覺數據領域一線研究者之間的學術交流,共同分享我國視覺領域的最新理論和技術發展、深入挖掘視覺大數據中蘊含的價值,共同探討視覺技術領域發展的新模式,對推動視覺大數據領域的理論創新、行業發展,以及促進領域間的交流具有重要的意義。首屆論壇在北京中科院自動化所舉辦、第二屆論壇在廣州白雲國際會議中心舉辦,來自全國各地高等院校、科研機構、企業的近 300 位精英出席,得到了社會各界的廣泛關注。
論壇五:類腦智能論壇
簡介:類腦智能是利用神經計算來模擬人類大腦處理信息的過程,被認為是下一代人工智慧的重要方向,也是當前人工智慧領域的熱點方向。人工智慧的發展需要真正地了解大腦,學習大腦的思考方式。那麼,到底機器人會不會擁有像人類一樣的智能?對於大腦的借鑑和研究,一直是人工智慧發展的一個方向,而實現具有人類意識的人工智慧更是人類長久以來的目標。本論壇我們將邀請6位專家從不同的角度來介紹類腦智能的研究進展、類腦研究中的難點問題,並對今後的研究進行展望。
論壇六:女科學家學術論壇
簡介:中國圖象圖形學學會女科技工作者委員會致力於鼓勵、推薦、扶持圖像圖形領域的優秀的女性學者與年輕的科技工作者,從而形成一個由 CSIG 男性、女性科技工作者共同組成充滿活力的團體。 在 ICIG 2019 上舉辦的女性論壇聚焦圖像和圖形領域的前沿技術,以及領導力、職業生涯規劃經驗分享等。
會議註冊網址http://conf.csig.org.cn/fair/358
雷鋒網 AI 科技評論 雷鋒網