本期主要對數字成像系統進行概述總結,行文主要分為:數字成像系統組成、攝像頭關鍵部位概述、ISP概述、關於攝像頭相關的技術指標概述以及總結。現在網際網路資源比較豐富,本文只提出每個部分的關鍵知識點,讀者如果有興趣可以進一步深入檢索進行學習。
對於人眼來說我們觀察到一個物體很容易。初中物理和生物知識已經告訴我們當我們觀察到光源下的物體時,比如對於變換光照來說我們眼睛可以通過補償光照以自適應環境亮度變化、物體遠近移動我們可以通過自主對焦以關注到物體移動。簡單來說是因為眼周圍肌肉引起瞳孔擴大縮小進而控制進光量,深究則是由於眼部的各種錐狀細胞、杆狀細胞等進行光感應進而能完成快速的物體成像。而數字成像系統也是和人眼成像有異曲同工之處。
如下是一個成像系統的關鍵組成:
以手機拍照為例:當打開手機準備拍照,鏡頭(Lens)會首先把被攝景物投影在圖像傳感器(Sensor)上,與此同時,影像處理器(ISP)會通過測光、測距算出合適的參數並指示鏡頭對焦,隨著你按下拍照鍵,圖像傳感器(Sensor)會完成一次曝光,並通過影像處理器(ISP)變成圖片,再經手機應用的後期處理,最終呈現在屏幕上,這就是消費者看到的JPG圖像。
上圖幾個關鍵概念解釋如下:
Lenses&Spaces:
即鏡頭,鏡頭是將拍攝景物在傳感器上成像的器件,它通常由幾片透鏡組成,相信如果了解工程光學的人對這個概念一定不陌生。從材質上看,攝像頭的鏡頭可分為塑膠透鏡和玻璃透鏡。
Voice Coil Motor(VCM)音圈馬達:
手機攝像頭廣泛使用VCM實現自動對焦功能,通過VCM可以調節鏡頭的位置,呈現清晰的圖像。其裡面實現原理主要是通過固定磁場加電流產生力進而引起馬達運動然後對焦,通過步進方式在空間尋找對焦位置並通過對焦算法確定何時停止尋找對焦位置。關於AF對焦在詳解3A算法部分會有詳細講解。
CMOS Image Sensor(CIS):
Sensor即傳感器,傳感器是攝像頭組成的核心,也是最關鍵的技術。此圖用的是CMOS傳感器(已包含DSP處理器),攝像頭傳感器主要有兩種,一種是CCD傳感器,一種是CMOS傳感器,兩者區別在於:
CCD的優勢在於成像質量好,但是由於製造工藝複雜,成本居高不下,特別是大型CCD,價格非常高昂。在相同解析度下,CMOS價格比CCD便宜,但是CMOS器件產生的圖像質量相比CCD來說要低一些。一般手機廠商都是採用CMOS傳感器。如果要了解CMOS傳感器工作原理,可參考工程光學相關內容,但需要提及的是CMOS實際上也就是通過光電感應原理將光信號轉換為電信號,現在攝像頭拍照數據流到達Sensor,傳感器(Sensor)只能感應到光照強度的大小,這意味只能是獲取黑白(0,1)照片,但是現在大部分照片都是彩色的,這是怎麼回事呢?原來有一個叫Bayer的人發明了一種「顏色濾波矩陣」,如下:
其巧妙地將這個矩陣加持在傳感器上,只讓相應顏色波長的光子通過。仿照了人眼對於顏色的特殊模式要求,到此即形成了不同模式的Raw圖,所謂Raw圖即原始未經加工過的圖,Raw圖的形成下一節會詳解其生成過程,RAW圖接下來會經過「大腦」——ISP晶片。
ISP是Image Signal Processor的縮寫,全稱是影像處理器。在相機成像的整個環節中,它負責接收感光元件(Sensor)的原始信號數據,可以理解為整個相機拍照、錄像的第一步處理流程。
ISP晶片的主要作用就是對傳感器輸入的信號進行運算處理,最終得出經過線性糾正、噪點去除、壞點修補、顏色插值、白平衡校正、曝光校正等處理後的結果。ISP晶片能夠在很大程度上決定手機相機最終的成像質量,通常它對圖像質量的改善空間可達10%-15%。
一般來說各個廠家ISP整體線程流會集成各種3A算法、降噪等算法,isp pipeline大同小異,一般的pipeline流程如下:
上述是一個基本的isp pipeline流程圖,其根據處理節點的不同分為RAW域、YUV域、RGB域。其中isp pipeline最關鍵的是3A算法,即AE、AF、AWB,但從上述圖發現沒有AE和AF?實際上這兩個算法在raw圖施加到pipeline上時候已經提前調試好了,因為只有AE曝光穩定,AF對焦準確,對於Raw域和YUV域進行的圖像處理才有意義,否則都沒有穩定的光電感應和準確對焦,何來更高的圖像質量?關於ISP相關的說明文檔很多,本文作為概述就不一一涉及,有興趣的可以Google關於ISP相關的圖像處理算法。
攝像頭成像是一門涉及工業製造、軟硬體結合的科學,故對於攝像頭硬體有一套相應的硬體指標,各個大廠都不相同,但按照類別可以分類如下:
解析度(Resolution)、視場角(Fov)、焦距(Focus length)、聚焦能力(Focusing Range)、光圈係數、失真(Restortion)。
a.靈敏度(sensitivity mv/lux.sec):即1 lux照度下,1秒像素產生的電壓值,其反應傳感器的光電轉換效率;
b.動態範圍(Dynamic Range dB):一個動態範圍大的傳感器能準確記錄影像從亮部到暗部的複雜變化,sensor動態範圍很大程度上取決於單個像素麵積大小;
c.暗電流(Dark shading pA.cm2):即在完全黑暗情況下,1s內像素產生電壓值,其更多反映傳感器材料性能;
d.信噪比(dB):信號電壓與噪聲電壓的比值;
e.幀率(frame per second):一秒出幀數;
f.功耗(power consumption mw);
g.尺寸;
h.白平衡能力;
可見衡量sensor性能的指標很多,每一項的選型都對攝像頭成像產生很大的影響,同時各個指標之間又是相互制衡的關係,所以各個大廠在對攝像頭選型時候一般會根據產品定位去做選型,會考慮性價比。
Camera模組主要性能參數:
1、視覺解析度(Visual Resolution)
2、色彩還原(Color)
3、白平衡(White Balance)
4、灰階(Gray Scale)
5、成像均衡性(Imaging Uniformity)
6、曝光亮度差(Exposure)
7、缺陷像素(Defect pixels)
8、畸變(Tv Distortion)
9、對角線視場角(Maximum Angle of field of View)
10、幀率(Frame Rate)
各個Camera廠商會根據攝像頭成像效果進行一套評估,即客觀測試標準書,測試涉及光源、拍攝對象、評測算法。光源包括CIE標準光源,涉及D65、D50、螢光、A光、H光;拍攝對象包括ISO 1000圖卡、24色卡、灰階卡等;評測算法一般通過評測軟體計算,如imatest、DXO評測軟體等。
數字成像系統是一門系統性工程,其主要研究的是成像的技術。
總結成像過程就是:經過鏡頭聚光成像,sensor將光信號進行光電轉換,AD處理,曝光增益控制,以及各種圖像信號處理,最後按照一定時序和格式輸出的數字圖像信號。
上述核心在於sensor,其類似於傳統相機的底片,而sensor的組成一般是三層結構:微鏡頭、濾色片、感光像素陣列。Sensor出的圖是raw圖,其需要經過ISP晶片中一系列算法處理後才能得到我們平時看到的jpg圖像,而此時只是行百裡者半九十,還需要根據各種成像指標進行圖像效果質量測試,包括客觀圖卡測試硬體性能和主觀場景測試算法成像效果,上述所有全系列指標都通過後才能完成一個完整的數字成像系統設計和實現進而可以量產交付。
值得一提的是,正是因為目前數字成像技術的廣泛應用,在各個大的手機廠商催生了相應的工程師崗位:如模組工程師、整裝工程師、驅動工程師、算法工程師、效果工程師、測試工程師等。通過這些工種可以發現,其基本上屬於整個數字成像系統的流水線所有關鍵節點,正是這些工程師的整體配合,才會有消費級電子產品如手機拍照的誕生。
[1] 數字成像系統-姜卓. 2017.
從零開始學習三維視覺核心技術SLAM,掃描查看介紹,3天內無條件退款
早就是優勢,學習切忌單打獨鬥,這裡有教程資料、練習作業、答疑解惑等,優質學習圈幫你少走彎路,快速入門!
交流群歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、算法競賽、圖像檢測分割、人臉人體、醫學影像、計算攝影、自動駕駛、綜合等微信群(以後會逐漸細分),請掃描下面微信號加群,備註:」暱稱+學校/公司+研究方向「,例如:」張三 + 上海交大 + 視覺SLAM「。請按照格式備註,否則不予通過。添加成功後會根據研究方向邀請進入相關微信群。請勿在群內發送廣告,否則會請出群,謝謝理解~
為什麼會出現雙攝像頭手機?
智慧型手機雙攝像頭工作原理解析:RGB+RGB, RGB+Mono
智慧型手機雙攝像頭原理解析:廣角+長焦
智慧型手機雙攝像頭原理解析:RGB +Depth
智慧型手機雙攝像頭產業鏈
未來智慧型手機攝像技術發展趨勢:硬體
未來智慧型手機攝像技術發展趨勢:應用
計算攝影技術:身懷絕技的掃地僧
計算攝影 | 從入射光到照片:數位相機成像的秘密
計算攝影 | 圖像合成與融合
最新AI乾貨,我在看