Google Pixel 2拍照黑科技:單攝搞定背景虛化+內部潛伏神秘晶片

2021-02-14 量子位
安妮 夏乙 發自 凹非寺
量子位 出品 | 公眾號 QbitAI

Google最新親兒子Google Pixel 2系列一發布,拍照效果的好評就已鋪天蓋地。

憑藉著幾乎毫無亮點的單攝像頭,這款手機在DxOMark手機相機評分榜上碾壓iPhone 8和Galaxy Note 8,拿下這個榜單的史上最高分:98。

有這麼好?

Pixel 2拍照的「好」,有兩點可以非常直觀地感受到:一是雖然沒有時下流行的雙攝像頭,卻可以實現背景虛化的人像模式;

二是憑藉HDR+,在弱光下、或者光線強弱差異明顯的情況下也能還原出豐富的細節。

關於人像模式背後的機器學習和計算攝影黑科技,Google今天在官方博客上發文詳解,另外還宣布了一點與HDR+相關的小驚喜。

一起來學習一下吧~

單攝如何搞定背景虛化

和iPhone等對手一樣,背景虛化應用在「人像模式」的拍照中。吶,下面這張圖顯示的就很直觀了。

 沒有經過人像模式處理(左)經過處理後(右)的同一張HDR+照片

Pixel 2上的人像模式到底是如何加工圖片的?這還得分四步走。

第一步:生成HDR+圖片

人像模式始於一張清晰的圖片。

因此,谷歌使用了計算攝影技術HDR+提升拍攝到圖片的質量,幾乎所有的Nexus/Pixel手機都自帶這個功能。

HDR+技術通過拍攝一系列曝光不足的圖片避免強光過強,調整和平衡這些幀減少陰影中的噪音。在保持局部對比度、合理減少整體對比度的同時,還增加了這些區域裡的陰影。

即使在昏暗的燈光下,此階段最終生成的圖片仍是一幅動態範圍高、噪音低、細節清晰的圖片。

通過調整和平衡幀來減少噪音在天文攝影技術中已經應用了很多年了,但谷歌Pixel的實現方式不太一樣。因為照片是在手機上拍攝的,因此需更加小心避免移動時產生的重影。下面就是一個用HDR+捕捉到的高動態範圍的場景。

 應用了HDR+技術(右)和沒有應用(左)圖像對比,兩圖均為Pixel 2拍攝。HDR+避免了天空處的過度曝光,並且增加了拱廊中的細節第二步:基於機器學習的前後景分割

得到一張清晰的HDR+圖像後,下一步需要確定照片中哪些像素屬於前景(通常為人物)、哪些屬於背景。

看似簡單的一個步驟實際非常棘手,因為它與電影中的色鍵技術(chroma keying)不同,我們無法推測照片中的背景是什麼顏色。在此種艱難情況下,機器學習登場。

研究人員用TensorFlow訓練了一個神經網絡,負責分辨照片中的哪些像素屬於人物。這個卷積神經網絡(CNN)帶有skip connection,讓信息在網絡的早期和後期階段之間輕鬆傳輸,在早期階段,網絡推理顏色、邊緣等low-level特徵,而在後期階段,網絡推理面貌和身體部位等high-level特徵。

像這種結合至關重要,神經網絡不僅需要推斷照片中是否有人,還需要準確識別哪些像素屬於這個人。

在此之前,這個CNN已經接受過近百萬人照片數據的訓練,研究人員甚至讓它識別圖像中的帽子和太陽鏡等物件。

 左圖為HDR+處理的照片,右圖分出了神經網絡輸出的處理後圖像,其中分出了圖像的前景和背景。

欣慰的是,CNN清晰劃出了女主人公的頭髮和茶杯的邊緣,將之與背景區分開。如果在此基礎上將背景進行模糊處理,可以下圖效果:

 合成的淺景深圖像

圖像中特別需要注意的有幾點。

首先,雖然背景包含了不同景深的物體,模糊的程度是一致的。

其次,如果用單反來拍,圖中的盤子和餅乾比較靠近鏡頭,也會出現模糊的效果,而Google的神經網絡雖然知道餅乾不是人像的一部分,但是因為它在人像下方,也不能認作是背景的一部分,Google團隊對這種情況進行了特別處理,讓這部分像素保持相對清晰。可惜這種處理有時候就不太對,比如說這張照片中,盤子和餅乾相關的像素就應該更模糊一點。

第三步:從雙像素到深度映射

現在有必要了解一下每個點圖像中的深度了,在這裡可以用立體算法計算深度。

Pixel 2非雙攝手機但也能拍出帶景深的圖片,因為它裡面添加了一種叫Phase-Detect Auto-Focus (PDAF)的像素技術,也可以稱為雙像素自動對焦(dual-pixel autofocus)。它的原理很容易理解。

想像一下,如果強行將手機的後置攝像頭的鏡頭分成兩半,那麼鏡頭左側的視角和右側略有不同。雖然這兩種視角相差不足1毫米(大概鏡頭直徑),但這細微的不同足以計算出立體程度,並生成深度映射。

這相當於將圖像傳感器晶片上的每個像素分割成兩個較小的並排像素,並分別從晶片上讀取它們,原理如圖所示:

 在Pixel 2的後置攝像頭上,每個像素的右側都會通過鏡頭左側來觀察,每個像素的左側都會通過鏡頭右側觀察

如上圖所示,在一張照片中,PDAF像素通過鏡頭左右兩側給你不同的視角,如果你是豎著拿手機拍照,它就是鏡頭的上下兩半部分。

舉個例子吧,下圖中分別為上部分(左)和下部分(右)捕捉的圖片效果。

 考驗眼力的時刻到了

單肉眼確實很難將這兩張圖片分開,從最右邊的GIF能看到細小的差別。

目前,PDAF技術已經應用在很多手機相機和單眼相機中,在錄製視頻時幫助使用者更快聚焦。在Pixel 2中,該技術被用於計算深度映射。

具體地說,研究人員用左側和右側圖像作為立體算法的輸入,類似於谷歌處理360°全景視頻所用的Jump Assembler。這種算法首先執行基於子像素的精確定位,生成低解析度深度圖,然後使用雙邊求解器將其插入到高解析度中。

這類似於之前應用到谷歌的鏡頭模糊特徵中的技術。

由於Pixel 2相機拍攝的左右視圖非常相近,所以得到的深度信息不準確,尤其是在光線較暗的情況下,圖像的噪聲很高。

為了減少這種噪聲,提高深度精度,研究人員將左右兩部分圖像進行了調整和平衡,之後再應用於立體算法中。

 左:用上下兩部分圖像計算深度映射。右:黑色表示無需模糊,紅色越亮就表示越需模糊,藍色表示焦點平面前的特徵第四步:拼合上述處理形成完整圖像

終於可以將模糊分隔與深度映射結合起來了,它們共同決定在HDR+圖片中對哪些像素進行模糊處理。

我們希望圖像中的人像(上圖淺色區域)清晰,背景(深色區域)按照比例模糊。上圖中紅色區域顯示了每個像素的模糊程度。

模糊的概念理解起來很容易,每個像素都被替換為一個顏色相同但大小不同的半透明disk。如果這些disk像之前描述的那樣按深度排序,得到近似於真實的光學模糊效果。

 結合HDR圖像、模糊分隔和深度映射生成的最終淺景深圖像彩蛋:第一款自研移動晶片

除了上述種種,萬萬沒想到的是,Google還在親兒子體內還潛藏了個彩蛋:

Pixel Visual Core

Google今天在官方博客上透露了這個小秘密:Pixel 2隱藏著一個尚未激活的圖像處理和機器學習協處理器,也是Google自研的第一款移動晶片,用來加速相機的HDR+計算。這款處理器就叫Pixel Visual Core。

上面其實已經提到過,沒有HDR的情況下,你在晴朗明亮的天空下拍張照片,會有兩種結果:要麼天空曝光成一片白,要麼你的臉黑黑一片、看不清五官。HDR的出現,讓相機能在同一張照片中,儘可能豐富地記錄下不同亮度物體的細節。

而Google的HDR+除了應對這種情況之外,還能解決陰暗環境中拍攝照片模糊或者滿是噪點的問題。

早在2014年,Google就在Nexus 5和Nexus 6的相機App中推出了這項功能。它的實現方式說起來有點簡單粗暴:你按下拍照按鈕,相機瞬間拍下一組照片,然後快速將它們合併成一張,存儲起來。

和其他相機上的HDR一樣,HDR+也有一個缺陷:處理速度。而這一代親兒子內置的Pixel Visual Core就為HDR+計算提供了加速。

Google在官方博客上介紹說,他們開發Pixel Visual Core,是為了「擴展HDR+的使用範圍,處理最具挑戰的圖像和機器學習應用,降低HDR+處理的延遲,甚至提高能效。」

 Pixel Visual Core結構圖解

如上圖所示,Pixel Visual Core的中心部分是Google設計的圖像處理單元(Image Processing Unit, IPU)。IPU是從零開始設計的特定領域可編程處理器,共有8個核心,每個核心有512算術邏輯單元(ALU)。

在行動裝置上,ALU每秒能進行超過3萬億次運算。Pixel Visual Core將HDR+計算的速度提升了5倍,與在應用處理器上運行相比,功耗只有1/10。

Google介紹稱,IPU有這樣的能效,關鍵在於硬體和軟體的緊密耦合。與傳統的處理器相比,IPU用軟體控制了硬體的更多細節,這帶來了更簡潔的設計和更高的能效。

但是,這種緊密耦合也讓IPU難以用傳統的程式語言進行編程。為此,IPU利用特定領域的語言來減輕開發人員和編譯器的負擔:用Halide來進行圖像處理,用TensorFlow處理機器學習。 Google還做了一個編譯器,來y歐化硬體代碼。

定義的Google編譯器優化底層硬體的代碼。

不過,Pixel Visual Core現在依然在休眠,要等到Android 8.1推送之後,這款處理器就能用了。之後,Google會第三方開發者開放Pixel Visual Core,開發者也可以通過Android Camera API,讓自己的App用上Pixel 2的HDR+技術。

Google還強調,HDR+加速只是Pixel Visual Core的第一項應用,接下來的各種其他應用也都已經在開發中。

小視頻

關於Pixel 2攝像頭的情況,還可以看看上面這段來自YouTube的視頻+繁體字幕(字幕的細調沒搞定……就當個參考看吧),其中主要講述了如下幾個重點內容。

量子位AI社群10群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot3入群;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進群請加小助手微信號qbitbot3,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

相關焦點

  • 新iPhone SE只有單攝,人像虛化是如何實現出色景深效果的?
    現在想必大家也發現人像虛化鏡頭很實用,超廣角和長焦鏡頭能夠更好的構圖或者適用更多的場景,那麼只有一顆攝像頭的新iPhone SE有沒有什麼亮點? 咦,你還別說,我發現了一大亮點「新iPhone SE僅憑藉單鏡頭就實現了人像效果,不論是前置還是後置都有很不錯的實時人像虛化和預覽,而且拍照也做到了比較好的虛化直出」。
  • 單攝像頭的Pixel 2,憑什麼在拍照上碾壓iPhone 8?
    Google親兒子Pixel 2系列一經發布,拍照效果的好評就已鋪天蓋地。這款手機在DxOMark手機拍照評分榜上碾壓iPhone 8和Galaxy Note 8,拿下這個榜單的史上最高分:98分。  拍照真的有這麼好?說Pixel 2系列拍照很「好」,主要體現在以下兩點:  一是雖然沒有時下流行的雙攝像頭,卻可以實現背景虛化的人像模式;  二是憑藉HDR+,在弱光或者光線強弱差異明顯的情況下也能還原出豐富的細節。
  • Pixel 2 XL,軟體為王
    正好,pixel 2 系列幾乎同期推出,程序君便改換門庭,投入 Pixel 2 XL(以下簡稱 2XL)的懷抱。月初拿到了 2XL,天天機不離手,各種發朋友圈曬功能。朋友說,少得瑟,有那時間都能寫篇文章了。想想也是,於是在拖了一又四分之一周之後,有了這篇文章。一般的評測文章都會來個開箱報告,以圖服人。
  • 「雙攝」與「三攝」之間拍照技術,當下到底誰最有優勢?
    「雙攝」與「三攝」之間拍照技術,當下到底誰最有優勢? 李倩 發表於 2018-05-29 09:35:46 從2016年開始流行「雙攝」拍照普及,成為旗艦機型標配,最為明顯的就是更出色的背景虛化效果。
  • iPhone 12 跳票,華為 Mate40 缺芯,Google Pixel 5...
    另據 MacRumors 報導,英國電信高管 Marc Allera 在一個內部演示視頻中對員工表示:距離蘋果下一次重大發布活動——5G iPhone 只有幾天時間了,這將是對 5G此前在上一代 Pixel 4 手機上,Google 上馬了 Pixel Neural Core 晶片、Titan M 安全晶片和 Soli 雷達傳感器等黑科技元素(儘管未必提升了產品體驗),大大增加了這款手機的技術含量。
  • 原來這就是HTC和索尼不做雙攝的原因
    儘管是單攝,兩款手機依舊可以拍出背景虛化的微距圖,100%放大後可以看出,兩款手機摳圖較為精準,和雙攝成像所差無幾。    再說HTC,早在2011年3月,HTC就推出了支持裸眼3D技術的雙攝手機,當時的雙攝技術,是為了拍攝3D照片與3D視頻,可以說HTC是鼻祖級雙攝廠商。那它為何不再用雙攝,而是用單攝做出了世界上拍照最好的手機產品?編者猜想其原因之一很可能在於HTC的雙攝技術斷代了,似乎受困於手機業務的下滑表現,無力再做全新的雙攝研發。當下HTC被谷歌收購,今後會不會推出雙攝產品我們不得而知。
  • 背景虛化遇到瓶頸了?最全面的背景虛化攻略!!
    那麼不難理解,背景虛化就是控制一下景深大小,讓景深變小一些,就可以了。拍攝儘可能靠近被攝物,拍攝距離越近,虛化越好,如果距離夠近,甚至手機也可以獲得背景虛化的效果。如果距離夠近,我們眼睛都可以看到背景虛化的效果,比如你將你自己手指放到你眼睛前面,看看背景是不是虛化了,然後手指慢慢離遠眼睛,虛化就會越來越不明顯了。所以說,拍攝距離是影響背景虛化的第一點要素,距離越近虛化越好。
  • 背景虛化很簡單,一看就懂!
    因此,虛化可分為:前景虛化和後景虛化,具體看你是想把被攝物擺在前面還是後面。景深,指的是被攝物成像的清晰範圍,它和我們今天講的背景虛化關係密切。景深越小(淺),背景虛化效果越強,畫面中的主體越突出;相反,景深越大(深),背景虛化效果越差,畫面中的主體越不鮮明,特別是如果拍人,模特顏值一般般,背景又複雜的時候,存在感就越弱了。所以,拍女朋友一定要挑個漂亮、稍簡單點的背景,把背景可勁兒虛化,不然把她拍成路人甲就別怪我了。對於江湖小白來說,背景虛化有沒有不燒腦又容易上手的訣竅呢?當然有,今天我就全部教給你。
  • 從雙攝到四攝,手機拍照到底哪家強?
    關於手機自帶的功能方面,我想除了通話之外,恐怕使用最頻繁的就是拍照功能了,這也是為什麼所有廠家都在不斷宣傳自己拍照能力的原因。以現在的手機拍照市場來看,雙攝早已不稀奇,四攝已經被很多人接受了,隨之而來的還有人像虛化、場景識別、一鍵美顏等等,那麼這麼多拍照功能,到底哪家的拍照實力最強呢?
  • 在背景虛化這件事上,雙攝手機距離相機還有多遠? 極客頭條
    以索尼剛剛發布的 FE100mm f/2.8 鏡頭為例,它擁有較長的焦距(100mm)以及 f/2.8 的大光圈,配合對應的 α7 系列全畫幅機身(大底),就可以實現非常出色的背景虛化效果。不過在智慧型手機中,受限於體積,是無法實現比較淺的景深的。
  • 手機拍照,怎麼拍出人物突出、背景虛化的照片?
    有一位攝友留言:怎麼用手機拍攝出人清楚,背景虛化的照片?人物突出、背景虛化的拍攝效果其實是淺景深帶來的畫面效果,所以要通過獲得淺景深,從而滿足自己預期的拍攝效果。首先,回顧下景深的知識,景深就是畫面主體前後的清晰範圍,淺景深就是清晰範圍較小,從而讓拍攝主體成像清晰,背景前景等在清晰範圍之外而虛化模糊。影響景深的主要因素有三:光圈、焦距、拍攝距離。若想要獲得淺景深的拍攝效果,需要將相機的光圈開大(數值變小,如F2.8)、或者拉長焦距(如從18mm變為200mm,就可以看到明顯的區別)、或者近距離拍攝(將相機靠近拍攝主體)。
  • Pixel 4 全爆料:浴霸、挖孔屏,還有 Google 埋藏多年的黑科技
    畢竟在外界看來,不擅長硬體的 Google,最堅實的王牌就是黑科技。比如最明顯的,Google 的 Pixel 系列就一直堅持後置單攝,用 AI 算法彌補拍照能力,讓 Pixel 3 有足夠的底氣正面剛蘋果 iPhone XS 雙攝。同時,從今年 Google I/O 發布 Pixel 3a 系列,我們也能看出 Google 是要真心好好經營智慧型手機。
  • Google 官宣 Pixel 4 兩大黑科技:優於蘋果的人臉解鎖、目測火不起來的隔空操作
    並且這兩項功能都與 Google 的「黑科技」項目 Project Soli 有關。據 Google 博客信息,Pixel 4 正面屏幕上方的「額頭」將預留一定空間用於放置人臉識別、手勢操作的傳感器和晶片,頗有當年 iPhone X 的感覺,區別在於 Google 手機沒有「劉海屏」的痕跡。
  • 手機虛化效果太假!4招教你實現單反奶油般虛化!
    可是攝影師都愛用虛化功能拍照,虛化效果順滑細膩,拍多久都不覺得單調!人像虛化 攝影師喜歡用大光圈拍人像。因為我們的場景經常是雜亂的,虛化背景,讓焦點更突出。虛化拍人像十分柔和。它通過雙攝拍攝不同焦段的照片,記錄景深信息,然後通過算法來合成一張比較符合光學規律背景虛化的照片。現在部分手機還添加了光圈選項,可以根據被攝主體調整虛化強度等。部分安卓手機當使用人像模式拍攝時,物距太近會自動切換超廣角拍攝。
  • 背景虛化怎麼用?
    背景虛化就是使景深變淺,使焦點聚集在主題上。要想虛化背景,但一般的DC是不具備大光圈這個功能的,而傻瓜型的相機是無法達到虛化背景的效果的,一般的DC機最好的虛擬方法便是用微距拍攝,當然還可以通過其他的方法來實現。
  • 如何背景虛化
    1.背景虛化方法:大光圈+大變焦+快門快速度+點對焦+開微距+遠背景。  2.拍攝條件:  (1)讓背景遠離拍攝主體,拍攝主體與背景要有一定的距離才能虛化掉背景。  (2)相機距離被拍攝物體的距離儘可能要小於被拍攝物體後面存在的空間距離。在符合鏡頭的最近對焦距離的條件下,儘量靠近拍攝。  (3)使用鏡頭的長焦距,把要照的人物從遠處「拉過來」。變焦倍率越大,虛化效果也就越明顯。長焦相機很容易拍出虛化效果。  (4)使用微距鏡頭、定焦鏡頭。物體離鏡頭越近背景虛化效果越好。但要保證在「最小拍攝距離」外。
  • Google Pixel 2、Google Pixel 2 XL和iPhone X!
    Telstra是Google兩款新機Pixel 2和Pixel 2 XL的獨家電信合作夥伴。兩款機型都配備了性能更為卓越的攝像頭,拍照輕鬆且效果絕佳。若使用Pixel 2手機拍照,還可將照片存入Google相冊,獲得網上無限儲存空間。
  • 谷歌Pixel 3 XL、Moto One曝光,還有一款奇葩設備
    昨天,知名爆料人Onleaks分享了一張Pixel 3的結構透視照,確認了其後置單攝像頭、後指紋的設定。他還透露,資料是從製造工廠拿到的CAD定稿,可靠度不用質疑。根據此前的渲染,Pixel 3 XL將搭載一塊6.2英寸19:9的劉海屏,pixel 3則是5.4寸16:9傳統設計。
  • 虛化效果還不錯 iPhone7 Plus人像模式解析
    在上周我曾經寫了一篇長文《雙攝是噱頭還是真福利iPhone7拍照體驗》,對月初發布的兩款新iPhone的拍照能力進行了全面檢視。通過我多場景的實拍及對比,我認為iPhone7和iPhone7 Plus的成像水準仍然處於智慧型手機圈的第一集團,但與前代產品相比進步空間有限。
  • 華為再出手, 逆天首發"天文望遠鏡級"拍照手機! 黑科技暗夜拍照, 50倍變焦, 能拍月亮銀河! 全世界徹底看傻眼了!
    小編真心沒能忍住內心的激情澎湃先讓我大喊一聲:中國黑科技又震驚世界了!>超黑科技拍照手機這一次真的是顛覆了所有人對於手機拍照極致巔峰的認知中國人真的霸佔世界科技的中心了!華為手機的黑科技簡直秒殺全世界!