無需綠幕,微軟用AI為線上活動、AR/VR打造更自然虛擬舞臺

2021-01-09 砍柴網

來源：映維網作者顏昳華

如果你看了今年微軟的Build大會，你可能在「舞臺」中發現其中一項創新技術。劇透警報：這個舞臺是假的。主持人都呆在安全的家裡。利用華盛頓大學的背景摳圖過程和和Azure Kinect傳感器，微軟製作出仿如真實存在的大會演講。

日前，微軟人工智慧負責人大衛·卡莫納（David Carmona）撰文介紹了這次創新背後的故事，下面是映維網的具體整理：

我最喜歡的遊戲是《帝國時代》。我是在大約20年前通過同事入坑，而我現在依然與我的兒子一起對戰，但他總是毫不留情地把我幹翻。從封建時代到城堡時代再到帝國時代，升級文明是遊戲的一個神奇時刻。每一個時代都帶來了新的技術，並為你抵禦對手和贏得戰爭的戰略開闢了全新的途徑。

我有時候認為我們現在的世界同樣是介於這樣一個過時期。就如同《帝國時代》一樣，新的時代將帶來新的技術，並允許我們用來應對外部幹擾和重新規劃我們的戰略。對於Covid-19新冠肺炎，我們發現自己正處身於一個飽受幹擾的時刻，而這迫使著我們重新思考應該如何行事。現場活動就是其中之一。

疫情使得用戶無法親臨大型現場活動，所以我們一直在尋找全新的方式來與客戶溝通。再說一次，如果你參加了Build大會，你已經親身體驗了我們微軟全球活動團隊是如何將一切轉移到虛擬空間。

我們採用了一種實驗性的方法來展示我們的內容，並且通過利用其他人的創新，我們構建了一種在「虛擬舞臺」中展示活動環節的獨特方式。

這個概念來自於2017年Adobe Research和華盛頓大學發表的兩篇背景摳圖論文。這種方法允許任何人使用人工智慧模型預測主體周圍需要摳圖的元素。它基本上取代了背景，不需要綠幕。

所以, 我們利用我們的Azure Kinect傳感器和一個基於華盛頓大學研究的人工智慧模型，以背景摳圖過程作為基礎，並為我們的演講者創造一種可以輕鬆在家錄製演示內容並出現在虛擬舞臺的全新方法。

Azure Kinect攝像頭通過紅外線捕獲深度信息，這種數據有助於提高人工智慧模型的精度。我們使用一個名為Speaker Recorder的應用程式來管理來自Azure Kinect攝像頭的兩個視頻信號：RGB信號和深度信號。錄製完成後，我們通過命令行工具應用AI模型。具體的細節請查看微軟人工智慧實驗室。

我們使用的人工智慧模型是基於華盛頓大學最近發表的研究成果。這所大學開發的一種深度神經網絡可以拍攝兩幅圖像，一幅包含背景，另一幅包含人員。神經網絡的輸出是一個平滑的透明掩模。

這個神經網絡是基於圖像訓練，掩模工作則是手動完成。華盛頓大學的研究人員採用了Adobe提供的一個數據集，而其中的大部分圖片都是設計者手工創建的透明掩模。

通過這種方法，神經網絡可以學習如何平滑頭髮等區域。但它存在一定的局限性。如果此人穿著與背景顏色相似的服飾，系統會將其渲染為圖像中的洞，從而破壞幻覺。

所以，華盛頓大學的研究人員將把這種方法和另一種方法結合起來。第二個神經網絡嘗試通過觀察圖像來猜測輪廓。在我們的虛擬舞臺中，我們知道屏幕有一個人，所以神經網絡將嘗試識別那個人的輪廓。添加第二個神經網絡可以消除顏色透明度問題，但頭髮或手指等小細節可能是一個問題。

有趣的是，華盛頓大學的研究人員創造了一種稱為Context Switching（情景切換）的架構。根據情況，系統可以選擇最佳解決方案，並從兩個方案中獲得最佳結果。

在我們的示例中，由於我們使用的是Azure Kinect，所以我們可以更進一步，用Kinect提供的輪廓替換第二個神經網絡，因為存在捕獲的深度信息，所以結果更加精確。

另一種稱為對抗性網絡的人工智慧技術進一步改進了模型。我們將神經網絡的輸出與另一個識別圖像真假的神經網絡相連接。結果是一個可以創造更自然圖像的神經網絡。

人工智慧模型、情景切換和神經網絡創造了更為自然的舞臺效果

結果？就是你在Build創新空間中看到的虛擬舞臺。虛擬舞臺的用途無窮無盡，這個過程允許我們靈活地將其應用到更長形式的會議之中，就像我們在微軟人工智慧虛擬峰會中的主題演講一樣。如果你想了解我們是如何為虛擬峰會利用舞臺，請關於6月2日上午9點的Microsoft LinkedIn直播。

整個訓練過程和代碼請訪問GitHub。誰知道呢，或許虛擬舞臺的虛擬活動將是我們邁向下一個時代的方式。

我好像聽到我的兒子正在叫我再來一盤《帝國時代》……

原文連結：https://yivian.com/news/75346.html

相關焦點

今日起,有關AI/AR/VR/MR的知識你一定要知道

ai 首先，AI。Artificial Intelligence：人工智慧的簡稱。ar 其次，AR。Augmented Reality:增強現實的簡稱。它將計算機生成的虛擬物體或關於真實物體的非幾何信息疊加到真實世界的場景之上，實現了對真實世界的增強。
VR/AR行業投資機會系列文章: 域名篇

動輒幾百倍上千倍甚至上萬倍。好的域名是稀缺資源就跟美女一樣，供不應求，眾星捧月，能抱得美人歸的必然是人中龍鳳，非富即貴，非高即帥。因此域名不僅僅是一個網站地址，品牌門牌號，更是一個公司品牌的構建組成以及實力的象徵。
VR虛擬實境在遊戲行業的應用優勢

虛擬實境技術最先在娛樂領域落地，大家最熟悉的3d電影，ar互動遊戲等，近幾年，vr技術在網頁遊戲中的應用也逐漸生成，那麼虛擬實境在遊戲領域的應用優勢有哪些呢虛擬實境技術可以大大增強遊戲的真實感、沉浸感，結合手、眼、耳多感官上刺激人的興奮感。
綠幕中的你上躥下跳,該配合你演出的我視而不見

The Future Group聯手FreemantleMedia打造了一款挪威遊戲節目《Lost In Time（迷失時間）》，這是挪威首次將MR綠幕技術引入電視領域。把不同的參賽者傳送至不同時期，在各個不同的場景之中參與別樣的比賽項目，為觀眾帶來更為有趣的電視節目。
微軟/微美全息推出AR/VR可穿戴設備提升更逼真的產品體驗

為了改善這種情況，微軟的研發部門開發出了一套名為Haptic PIVOT腕戴觸感反饋方案（b站視頻）。希望以活動的機械結構，來更逼真的模擬出物體的握持感。Haptic PIVOT本質上是由機械轉軸和集成了電容觸控感應器的握把組成，後者是用於探測你拿起或放開虛擬物體的動作。
本周大新聞|Niantic要打造3D世界地圖,首個手勢FPS VR遊戲

本周大新聞，AR方面，Niantic CEO近期詳解3D地圖方面的工作，目標打造3D世界地圖；索尼近期公布容積攝影新成果，可為運動員拍攝炫酷場景視頻；高德地圖AR導航，支持手機與行車記錄儀協作；谷歌搜索AR動物新增8種澳大利亞動物；HBO用AR為新劇預熱營銷；遠程協作平臺TeamViewer Tensor加入AR協作能力。
這可能是國內第一個綠幕晚會,頂尖特效只為獻給大話玩家

讓小編印刻深刻的有三場節目：第一場是「國家級」的舞蹈演員孟慶暘帶來的《月光愛人》獨舞，在小編原本的想像中舞蹈表演一般都是在舞臺，附以燈光進行呈現的，但節目上用綠幕技術還原出的唯美CG場景實實在在把小編給驚豔到了。
本周大新聞|Niantic要打造3D世界地圖,首個手勢FPS VR遊戲來襲

本周大新聞，AR方面，Niantic CEO近期詳解3D地圖方面的工作，目標打造3D世界地圖；索尼近期公布容積攝影新成果，可為運動員拍攝炫酷場景視頻；高德地圖AR導航，支持手機與行車記錄儀協作；谷歌搜索AR動物新增8種澳大利亞動物；HBO用AR為新劇預熱營銷；遠程協作平臺TeamViewer Tensor加入AR協作能力。
5G、MR技術加持線上演出「三維虛擬舞臺」給觀眾更真實現場感

2020年受疫情的影響，眾多線下演藝活動紛紛轉移到線上，而為了吸引觀眾向線上遷移，5G、MR、VR等新技術快速在各種線上演出中得以運用，以此給觀眾帶來更真實的現場感。12月3日20點，由咪咕音樂打造的原創音樂盛典——「Real Me·動感地帶2020來電之夜」在線上開演。AJ賴煜哲、柏松、陳紅鯉、鄧典、高嘉朗、劉鳳瑤、ONER 、宋樂謙、VOGUE5、葉炫清十組音樂人同臺競技，內地說唱女歌手VAVA毛衍七作為助力嘉賓出席。
微軟與日本Line合作打造AI藝人明星飯碗不保?

4月4日消息，微軟與日本Line合作打造出的AI藝人りんな將於4月17日發行首張個人單曲《Max New Memory》，除了外表形象以真實人物呈現，線上互動、歌唱等都用電腦合成，未來可能會誕生更多類似初音未來的虛擬偶像。
什麼是VR? 什麼是AR? AR和VR哪一個更高級?

Virtual Reality(虛擬實境，簡稱VR)：VR技術是在計算機上生成一個三維空間，並利用這個空間提供給使用者關於視覺、　　原標題：什麼是VR？什麼是AR？ AR和VR哪一個更高級？　　AR和VR的區別是什麼?什麼是VR?什麼是AR?哪一個更高級一些呢?
虛擬活動年終盤點|近期國內8場AR/XR活動剖析

Credit：DNT團隊作為線上活動的開場秀，xR技術也能帶來極致夢幻與亮眼的觀看體驗。本案中，通過xR擴展現實技術，將實車展示與虛擬場景相結合，展現車輛在不同角度鏡頭下的立體感。這是一個小魔術，汽車靜止在舞臺上，通過攝像機的移動和背景畫面的變化，營造出汽車行駛的視錯覺。舞臺地面與舞臺兩側、背後的LED屏共同構成了一個「四折幕」，因為考慮到汽車重量，地面選用投影來呈現畫面。
虛擬實境技術應用到線上展會優點有哪些?

傳統電子化展廳不能提供全方位立體化展示，線下展廳有時間、地域的限制，投入成本高，使用vr線上展廳，搭建一個空間無限的網上虛擬展廳，讓參觀者身臨其境全方位、多角度的參展，並且能獲得線下展廳同樣的震撼感。使用vr線上展廳優點：360度全方位展示公司產品及服務，多感官感受產品材質、功能。不需要建立線下實體展廳，沒有地域、空間限制，實現24小時永不閉館。全新技術的加成，側面體現企業實力，通過全新體驗更具吸引力。
虛擬動點:當虛擬活動遇到OptiTrack技術,打造創新聚會方式新嘗試

虛擬動點：當虛擬活動遇到OptiTrack技術，打造創新聚會方式新嘗試享譽海內外的ChinaJoy作為中國數字娛樂的線下盛會,於2020年7月31日至8月3日在上海如期舉辦
這樣實現無需與人溝通,也能得到基本信息

assistant也繼承了谷歌優秀的圖像識別技術，可以自動為你尋找手機攝像頭。另外，根據以往經驗，她每次需要提供一系列信息，但我們可以在你說出第一個詞的時候從相應搜索上找到詞語。這樣實現無需與人溝通，也能得到基本信息。它還將通過精準攝像頭來定位人類說話的方向。
便攜虛擬演播室之便攜全身摳像組合綠幕

而藉助於鄭州昱陽電子的便攜摳像綠幕就可以在一個非常小的物理空間中變幻出無窮的視覺空間。可廣泛適用於自媒體視頻特效（神馬抖音特效都不是事）、直播行業、電視演播室、實訓教室、虛擬實境教學、遊戲直播互動等。此外由於虛擬場景的製作都在計算機內保存著，大大降低了場景的製作費用！
不僅能取代綠幕,AR技術還有望顛覆後期特效?

不得不佩服這部劇的特效團隊，因為三條龍不僅外形看起來自然逼真，在動作，還有與人的交互上看起來就像真的動物一樣。「龍母與龍」不過，不管後期特效有多厲害，現場拍攝常常是另一番景象。在拍攝過程中，飾演龍母的Emilia Clarke實際上騎的並不是「龍」，而是攝影棚內鋪著綠幕的機械牛，Clarke還曾打趣稱，機械牛就像她的龍一樣，這麼多年來都有感情了。
從Oculus Rift到微軟HoloLens,VR/AR取得了哪十大進步?-虎嗅網

8.3000美元的微軟Hololens AR平臺雖然微軟和Ocules合作，在Oculus Rift和Gear VR上移植了《我的世界》遊戲，Rift頭顯可以連接Xbox One手柄進行操作，無疑微軟也在規劃著自己的HoloLens自己的全息AR平臺。
科普AI/AR/VR/MR,這些黑科技縮寫你要知道!

它將計算機生成的虛擬物體或關於真實物體的非幾何信息疊加到真實世界的場景之上，實現了對真實世界的增強。比如，用戶戴著AR眼鏡，當他看到真實世界中的一家餐廳，眼鏡會馬上顯示這家餐廳的特點、價格等信息。vr自助機第三，VR。Virtual Reality：虛擬實境的簡稱。
用真實虛擬攝像頭讓虛擬VR錄影簡單易用

Gartner從未放棄過仿真，最終發現在虛擬實境中增加一個Vive控制器操控的虛擬相機能夠展現最好的效果。但是這種方法其實很不利於拍攝，因為控制器本身並沒有取景器，這樣一來你就必須先觀察外圍正在工作的距離監視器才能知道控制器的指向。現在，Gartner解決了這個問題，他將智慧型手機賦予了虛擬相機中類似取景器的功能，如此一來虛擬相機便能完全展示出他想要的效果。

無需綠幕,微軟用AI為線上活動、AR/VR打造更自然虛擬舞臺

相關焦點

今日起,有關AI/AR/VR/MR的知識你一定要知道

VR/AR行業投資機會系列文章: 域名篇

VR虛擬實境在遊戲行業的應用優勢

綠幕中的你上躥下跳,該配合你演出的我視而不見

微軟/微美全息推出AR/VR可穿戴設備 提升更逼真的產品體驗

本周大新聞|Niantic要打造3D世界地圖,首個手勢FPS VR遊戲

這可能是國內第一個綠幕晚會,頂尖特效只為獻給大話玩家

本周大新聞|Niantic要打造3D世界地圖,首個手勢FPS VR遊戲來襲

5G、MR技術加持線上演出 「三維虛擬舞臺」給觀眾更真實現場感

微軟與日本Line合作打造AI藝人 明星飯碗不保?

什麼是VR? 什麼是AR? AR和VR哪一個更高級?

虛擬活動年終盤點|近期國內8場AR/XR活動剖析

虛擬實境技術應用到線上展會優點有哪些?

虛擬動點:當虛擬活動遇到OptiTrack技術,打造創新聚會方式新嘗試

這樣實現無需與人溝通,也能得到基本信息

便攜虛擬演播室之便攜全身摳像組合綠幕

不僅能取代綠幕,AR技術還有望顛覆後期特效?

從Oculus Rift到微軟HoloLens,VR/AR取得了哪十大進步?-虎嗅網

科普AI/AR/VR/MR,這些黑科技縮寫你要知道!

用真實虛擬攝像頭讓虛擬VR錄影簡單易用

微軟/微美全息推出AR/VR可穿戴設備提升更逼真的產品體驗

5G、MR技術加持線上演出「三維虛擬舞臺」給觀眾更真實現場感

微軟與日本Line合作打造AI藝人明星飯碗不保?