麒麟9000全球首創ISP+NPU融合架構強在哪兒?超越極限的「慧眼」

2021-01-21 快科技

【影像飛躍:麒麟9000彪悍的另一面】

這兩年,手機SoC領域群雄逐鹿、精彩紛呈,2020年我們陸續見證了華為麒麟9000、蘋果A14、高通驍龍888等一眾「好漢」的輪番登場,其中華為麒麟9000可以說是最特殊,也是最值得研究的一個。

作為全球第一款5nm工藝的5G SoC完整解決方案,麒麟9000在性能、連接、AI、影像、安全等各個方面都實現了創新式的突破,尤其是在影像領域大殺四方,其賦能的華為Mate 40 Pro+、Mate 40 Pro兩款手機在DxOMark榜單上分別以139分、136分傲居第一、第二!

不過,以往談論一款手機影像能力的高低,我們往往會把目光都集中在CMOS傳感器、攝像頭的配置上,卻很容易忽視在幕後默默貢獻的ISP(圖像信號處理器)。事實上在手機影像系統中,ISP在很多場景的重要性更甚於攝像頭。

打個形象的比方,如果把攝像頭視作能打仗的士兵,ISP就是指揮戰鬥和戰爭的軍官——沒有合理的指揮,再強的士兵也是無頭蒼蠅;如果攝像頭是看清世界的「眼睛」,ISP就是掌控一切的「大腦」。

而在另一方面,我們剛才一直說「影像」而非「拍照」,是因為用戶追求越來越多的,不僅僅是要把照片拍好,更要把視頻拍好,畢竟這是一個視頻的時代,動起來才更精彩。

麒麟9000其中一項獨到之處,恰恰就是將ISP提升到了一個全新的層次,尤其是業界首次實現ISP+NPU的融合架構,不但拍照強悍無與倫比,更讓視頻捕捉煥然一新。

比如超強的細節還原,比如顯著的降噪能力,比如極高的能效,尤其是在暗光環境下堪稱升級版的「夜視儀」,再次走在了時代的最前沿,只留給友商一個遠去的背影。

正是有了這樣強悍的根基,華為Mate 40 Pro系列不但拍照水平一騎絕塵,視頻捕捉更是獨領風騷,雙雙霸佔DxOMark榜單前兩名。

【低調的勞模:ISP要幹的事兒太多了】

要想理解麒麟9000 ISP+NPU融合架構的精妙之處,我們需要把時鐘往回撥一下,先了解幾個基本概念術語,看看ISP是多麼不容易。

眾所周知,圖像傳感器(Image Sensor)是數位相機、智慧型手機拍照、拍視頻的「眼睛」(相機裡是CCD/手機裡是CMOS),最終呈現的色彩、細節都取決於它,其原理是通過一個一個的感光點,對光進行採樣和量化。

但很多人可能並不知道,圖像傳感器其實是「色盲」,如果只用它拍出來的照片就是黑白的,需要搭配色彩濾波器(CFA)才能獲得色彩信息。

1976年,柯達的拜耳發明了RGB CFA,也就是色彩濾波器 ,如上圖可理解為雙層結構:上層紅(R)綠(G)藍(B)三色的色塊就是色彩濾波器,白光透過濾波器後分離出紅綠藍三原色;下層灰色的色塊則是感光光電二極體(PD)部分,負責將濾波器送來的光信號轉換為電信號,再由後續各種算法進一步處理,並最終成像。

可以說,濾波器的表現如何,是照片、視頻色彩、細節還原的基礎。

當然,從濾波器濾出的RGB色彩,到最終照片上的精彩,需要經過各種複雜算法、技術的處理,這其中有三個是起著決定性因素的。

一是Demosaic插值算法。

RGB拜耳陣列中的每一個像素只能採集一個顏色通道信息,另外兩種顏色信息需要通過插值算法,結合相鄰其他顏色的像素信息計算出來,這樣一個像素的色彩才是完整的。

這個過程有點「去馬賽克」的味道。

二是自動白平衡(AWB)。

由於色溫的影響,白色並不是一直純白無瑕,在低色溫下會偏黃,高色溫下則會偏藍。如果不進行校準使之恢復平衡,色彩就會完全混亂,畢竟白色是三原色和任何色彩的基礎。

於是就有了白平衡,可以讓任何色溫下白色物體的RGB三原色比例關係都是標準的1:1:1,呈現準確的白色。

白平衡算法很多,最常見得有灰度世界算法、完美反射算法、動態閾值算法這麼三種。

三是色彩校正矩陣(CCM)。

相機或者說圖像傳感器是機械式的,而人眼是生物式的,二者的感光曲線截然不同,或者說RGB響應曲線並不一致。

白平衡只能處理白色,其他顏色的準確度則需要CCM來校準,也可以用來調節色彩風格,就是各種不同的「濾鏡」。

CCM的原理和過程很複雜,這裡就不展開了,具體算法大致可以分為模型法、經驗法這麼兩類。

說了這麼多,其實無論插值算法還是AWB、CCM,都需要一顆強大、優秀的ISP,才能越做越好,讓最終呈現的色彩更貼近大自然,或者看起來更養眼。

【麒麟990系列:ISP+NPU初步聯手、RYYB物盡其用】

多年來,華為一直在全力提升手機的影像水平,尤其是近幾年始終處於行業最前列,這其中不僅有攝像頭的貢獻,更有ISP層面的創新。

2015年,華為第一次完成自研ISP,應用於麒麟950,此後每一代都經歷一次蛻變,逐漸成為華為手機拍照登頂世界的根基。

到了麒麟990系列,已經內置全新ISP 5.0,吞吐率提升15%,能效提升15%,照片和視頻降噪能力提升30%、20%,手機端首發單反級降噪技術BM3D,全球首發雙域聯合視頻降噪技術。

同時還有創新的華為自研達文西架構NPU(神經處理單元),兩個大核加一個微核的特殊架構,兼顧高性能與高能效,並且ISP、NPU已經開始初步聯合,探索全新的AI攝影。

而基於麒麟990 5G的華為P30系列創新引入了RYYB CFA超感光圖像傳感器,其中Y代表黃色,取代傳統的RGGB格式中的G綠色,光譜響應更寬、光譜覆蓋更廣、能感應更多光子,總體進光量因此提升了30-40%,暗光場景信噪比更佳,夜拍效果更上一層樓。

不過,RYYB作為新生事物並不容易駕馭,傳統ISP的插值算法、AWB、CCM很難處理Y黃色像素的豐富色彩信息,精準還原難度非常大。

為此,華為一方面在後續的Mate 30系列上採用了RYYB、RGGB相搭配平衡的設計,另一方面引入基於AI神經網絡的插值算法、AWB、CCM,並整合在麒麟990 ISP流水線的圖像處理過程中,為傳統ISP流程增加了計算攝影處理,再經過大量的RYYB傳感器RAW數據訓練之後,可以有效找到物體細節、色彩分量之間的複雜映射關係。

可以說,如果只是單純地變革圖像傳感器,而不能在硬體、算法上同步革新,不但不能提升手機的影像水平,反而會陷入混亂。

麒麟990正是憑藉強勁的NPU性能,逐步完善了對於全新複雜RYYB CFA的支持,釋放了其對色彩處理的強大潛力,尤其是在視頻實時處理方面邁出了一大步,提升了4K視頻的暗光細節表現、色彩還原效果。

【麒麟9000:ISP+NPU深度融合、超越人眼極限】

在最新一代的麒麟9000處理器上,華為更進一步,全球首創實現了ISP+NPU的融合架構,沒有像友商那樣單純地追求堆積更多ISP,而是通過精密設計的融合架構,將ISP處理流水線、NPU矩陣計算有機地融合在一起,不但拍照更加遊刃有餘,更是實現了實時視頻的像素級處理。

這樣的融合架構對於靜態照片處理已經不費吹灰之力,這裡不再贅述,重點看看視頻處理。

畢竟,照片都是單獨的一幀,視頻則是連續變化的靜態幀組成的,處理24FPS的視頻相當於每秒處理24張照片,而對視頻進行像素級的實時處理,無論對於硬體設計還是軟體算法都提出了空前的考驗。

在傳統的ISP視頻流處理過程中,受制於ISP性能有限、硬體模塊相互隔離、處理帶寬不充分等因素,ISP只能老老實實地逐幀處理,一切排隊進行。

加入NPU助力之後,可以加速處理這一過程,但處理過程中以幀為單位,依然需要排隊。比如當ISP處理第一幀時,NPU需要等待ISP處理完成後才能接替。

麒麟9000改變了這一切,不但集成最新的ISP 6.0,還支持四流水線並行,吞吐量提升50%,視頻降噪能力提升48%,3A(自動對焦/自動曝光/自動白平衡)處理能力提升100%,而最大亮點當屬首創了ISP+NPU融合架構。

ISP+NPU融合後,直接將數據、信息完全打通,使用硬體直連的方式,將原本獨立的NPU計算直接融合ISP的處理流水線中,再結合大容量、高帶寬的智能緩存SmartCache 2.0,使得輸入數據流、輸出數據流都連續不斷,整個過程中沒有任何停頓和等待,數據可以無縫緩衝、實時處理,效率提高了不止一個檔次。

同時,ISP+NPU融合架構改變了逐幀排隊處理的傳統方式,對每一幀進行切片(Slice),也就是拆分成更小的單元,處理的基本單元不再是一整幀,而是一個個小的切片,從而將每一幀內部、不同幀之間完全打通,加速數據的傳輸與處理。

這樣一來,ISP+NPU聯合就實現了基於幀內分塊的視頻流智能處理。

如上圖,假設每個視頻幀都拆分成四個切片,ISP可以先處理其中兩個切片,快速處理完之後交給NPU進一步加工,此時ISP就可以同時處理該幀的剩餘兩個切片,以及下一幀的頭兩個切片,如此往復循環,從而大大縮短等待時間,提高處理效率。

當然,每個視頻幀拆分成幾個切片、NPU/ISP每次處理幾個切片,都是極其靈活的,可以根據每一幀的不同數據量、處理難度來智能切割,還可以在同一幀內應用多種不同算法,流水線效率不可同日而語的同時,還可以得到更豐富的處理效果。

很自然的,這種聯合處理對於ISP、NPU的協同效率提出了極高的要求,畢竟稍有不慎反而會影響整個流程的順暢性。麒麟9000憑藉豐富的ISP研發經驗、自研華為達文西架構2.0 NPU的強勁AI算力,一切都搭配得天衣無縫。

數據顯示,麒麟9000在處理器4K視頻的時候,可以在33毫秒甚至更低的時間間隔內完成計算任務,尤其是在夜景等會產生海量數據的複雜環境下,可以充分發揮ISP+NPU融合架構的極高處理效率,實現豐富細節的精準色彩還原。

如果你覺得這些理論分析有些難以理解,這裡我們來看一個實際例子,感受下ISP+NPU融合架構的神奇魅力。

如上動圖,圓圈中的願景物體是一個迷你風車,四個葉片又長又細還是深色調,又處在偏暗的環境中,一般情況下即便只是拍照,也很難清晰捕捉到其色彩細節,甚至可能根本就看不清對象本身,更不用說拍視頻。

但是在麒麟9000平臺上,得益於ISP+NPU融合架構一整套方案的智能化處理,可以看到在捕捉的視頻中,風車扇葉異常清晰,色彩清晰,銜接過渡自然,和背景區分明顯,運轉動作也是如行雲流水一般的順暢,甚至連扇葉頭部、尾部因為運動快慢不同而導致的模糊程度不同,都展現得淋漓盡致,可能連人眼都捕捉不到這麼逼真、翔實的細節。

【ISP+NPU融合:幹活更多 功耗控制更好】

那麼,ISP+NPU融合架構之後,要幹的活兒更多了,會不會更加耗電?這裡就體現了融合架構的另一個好處,計算性能上去了,功耗還能很好地得到控制,更好地完成更多任務。

眾所周知,手機拍攝視頻的時候是相當耗電的,遠高於靜態拍照,但是麒麟9000經過多重努力,實現了「馬兒跑得快、馬兒不多吃」的神奇效果。

一是針對大量數據輸入場景進行智能切塊處理,從而大幅降低網絡中間層對計算內存的需求;

二是切片級的數據交互,有效控制算法時延,再結合SmartCache緩存,有效控制視頻場景的功耗。

【融合架構背後的難度 超出你的想像】

你可能會說,這一切看起來似乎也沒什麼難的,但是晶片層面的創新,從來和簡單二字無關,ISP+NPU融合的難度和技術挑戰也是常人難以想像的,簡單來說主要是如何達成算法效果、計算性能、計算能耗三者的平衡。

為此,在設計硬體融合架構的同時,為了釋放硬體潛力,華為也在軟體算法上花費了大量心思,做出了大量創新,比如說IPS鏈路的像素級別(pixel level)的AI算法,搭檔算力強悍的AI晶片,實現高能效的端側軟硬結合完整方案。

同時,如今的影像場景下,數據處理都是海量級別的,而且極為複雜,這就需要整個流程方案具備很強的魯棒性(穩健性),而且為了提高處理大數據量的效率,模型結構也要滿足一定的計算約束,必須利用網絡結構搜索、混合量化等技術,讓模型結構與加速硬體高效配合。

特別是在4K超清解析度下捕捉視頻,流水線中的圖像數據量比以往多了幾個數量級,畢竟單幀4K圖像處理就已經對AI提出了很高的要求,更何況視頻場景下需要實時進行多幀處理。

舉例來說,4K 30fps的視頻捕捉場景下,整個ISP鏈路必須在33ms內完成單個幀的計算工作,其中留給AI算法進行計算處理的時間就更短,真正的電光火石之間就要處理到位,而一旦計算效率、性能不能滿足,視頻處理過程的效率就會急劇下降,反應在用戶體驗上就是嚴重的卡頓,這自然是無論如何不能接受的。

另外,任何硬體設計、算法設計都要考慮功耗,必須在可控範圍內,否則就會導致明顯的手機發熱。相信大家都有感觸,日常連續拍照、拍視頻的時候,手機會明顯發熱,更何況加入如此複雜的計算流程。

因此,為了達成最佳的影像效果和用戶體驗,突破性的算法效果、快速高效的計算性能、優秀可控的計算能耗,三者是缺一不可的,而麒麟9000 ISP+NPU融合架構,恰恰幾乎完美地做到了這一點,才有了最終呈現在我們眼中的精彩影像。

【一路坐強的麒麟:未來可期】

總的來說,華為手機這幾年在影像能力上持續穩居世界最前列,拿第一拿到手軟,坐榜首坐到寂寞,不但來自於精妙的攝像頭系統,更離不開麒麟晶片、ISP處理器、NPU神經處理單元的鼎力支持。

正是源於這持續不斷的革新,我們才通過小小的手機,越發清晰地看清、記錄整個世界的精彩,留下那一個個令人難以忘懷的瞬間。

從整個行業來看,目前做到從芯到端協同升級的,也只有蘋果、華為這兩家頂級巨頭,而蘋果陶醉在自己的封閉生態內,華為則呈現的是一個開放的世界。

眼下,華為麒麟的發展遇到了前所未有的桎梏,原本無限光明的前景蒙上了厚厚的陰影,但打鐵還需自身硬,經過多年來的一步步穩紮穩打,相信華為麒麟有實力面對任何艱難險阻。

期待麒麟的下一站更精彩!

相關焦點

  • 華為Mate40系列正式發布 麒麟9000承載太多全球第一
    伴隨著華為Mate40系列正式發布,其最為關鍵的麒麟9000處理器也正式揭開了神秘的面紗。作為全球第一顆、也是唯一一顆基於最先進的5nm工藝製造的5G SoC平臺,麒麟9000集成多達153億個電晶體,首次突破150億大關,也是全球電晶體最多、功能最完整的5G SoC。
  • 全球首發5納米麒麟9000晶片,超越蘋果高通
    對於華為來說,目前唯一能夠做好的事就是把2020年度旗艦Mate40正常的發布出來了,但在這之前,華為還要幹一件大事,幹一件最後令華為這麼多年來堅持自研所驕傲的大事,那就是全球首發5納米的麒麟9000處理器。
  • 全球首款5nm 5G SoC!麒麟9000晶片有多強?一文讀懂
    內核解析:24個GPU堆出「核彈」在測試之前先來了解一下麒麟9000。麒麟9000的CPU部分採用8核心, 1+3+4階梯架構設計。其中「1」是大核A77,主頻高達3.13GHz,性能非常搶眼;「3」也是A77,但主頻稍低為2.54GHz;「4」則是A55,主頻為2.05GHz。
  • 全面剖析麒麟9000:華為Mate 40碾壓了誰?
    本文主要探討麒麟9000這顆晶片——雖然電子工程專輯此前已經在這款手機的全球發布會期間,對這顆晶片做了簡單的探討,我還是希望能夠更全面地來呈現這顆,未來回看可能具有歷史意義的SoC。 本文篇幅較長,主體上分成5個部分。
  • 小米11性能揭秘,極限畫質《原神》能否戰勝麒麟9000成看點
    全球首發Android最強芯——驍龍888,對比上代旗艦驍龍865全面提升,擁有最強的超大核、有史以來最大幅的GPU性能升級、地表最強的AI算力。雷軍曬出的跑分成績顯示,GeekBench 5跑分中,驍龍888的CPU單核成績1135,多核成績3818,這兩項得分都奪得Android平臺之最,領先麒麟9000 13.2%、4.9%。高通的Adreno系列GPU,算是移動平臺圖形處理器的「金字招牌」。搭配驍龍888的是名為Adreno 660的新一代GPU。
  • 「驍龍888」PK「麒麟9000」,誰是最強5nm安卓芯
    工藝從工藝上來講,驍龍888和麒麟9000都採用迄今為止業界能達到的集成度最高、可規模化量產的製造工藝——5nm製程。區別在於麒麟9000由臺積電代工,而高通則由三星代工,這也是三星首次獲得高通旗艦晶片的訂單。
  • 最終時間已確定,9月3日全球首發麒麟9000晶片,華為最後的高端!
    9000 5G晶片,並公布Mate 40系列的發布時間,這也是華為最後的「高端芯」。根據華為消費者CEO餘承東的描述,麒麟9000將是華為最後一款高端晶片,華為沒有晶片了。其實在晶片命名上,我們就已經能看出麒麟9000將是「絕唱」,按照華為的命名原則,「9」代表著旗艦型號,三個零則預示著終結,按照正常的命名原則,這款晶片應該叫「麒麟1000」,代表著華為5G晶片的開端。當然,這一切的幕後推動者,就是美國無情的制裁。
  • 麒麟9000演繹AI實時超分,540p渣畫質秒轉1080p
    麒麟9000AI超分技術升級,帶來實時超高畫質體驗在麒麟9000發布會上,華為展示了基於麒麟9000實現的AI視頻超分技術。3、智能檢測對象,完成局部優化麒麟9000高品質的AI超分效果離不開其強大的檢測網絡。通過智能檢測技術,麒麟9000能輕鬆地識別畫面噪聲並進行去噪。在後兩組場景中,麒麟9000分別對人物的耳環、衣飾、髮絲以及落葉進行細節上的修復。
  • 截胡華為麒麟9000,蘋果首發5nm技術,晶片性能全球第一
    北京時間9月16日凌晨1點,蘋果2020年秋季新品發布會如期而至,此次蘋果共推出了4款產品,分別為Apple Watch Series6 、Apple Watch SE、iPad Air44和iPad 8,雖然iPhone12系列沒有亮相令人遺憾,但蘋果卻截胡華為麒麟9000,首發
  • 搭載麒麟9000,售價比iPhone12貴太多
    作為全新的嘗試和全新的設計理念,華為MateX首創了全球摺疊手機的設計理念,這也算得上是華為首次對傳統手機外形的突破設計。自從華為發布了華為MateX和華為MateXs之外,三星和摩託羅拉等手機廠商也發布了多個版本的摺疊手機,並且這些摺疊手機也受到了消費者的追捧。
  • 華為發布全球首款5nm手機晶片
    10月29日,華為面向全球正式發布新一代旗艦手機晶片麒麟9000,這是業界最高集成度5nm 5G SoC。麒麟9000採用全球頂級5nm工藝製程,集成153億電晶體;麒麟9000是業界最成熟的5G SA解決方案;麒麟9000全新升級Cortex-A77 CPU,大核主頻突破3.1GHz;麒麟9000升級華為達文西架構2.0 NPU;麒麟9000升級Kirin ISP 6.0,業界首次實現ISP+NPU融合架構。
  • npu處理器有什麼用
    npu有什麼用   NPU是一種專門應用於網絡應用數據包的處理器,採用了「數據驅動並行計算「的架構,可以用來處理視頻、圖像類的海量多媒體數據。   手機上的nup可以當做一種神經網絡處理單元,是模擬生物神經而構建的一種專業晶片,為深度學習而生,可以讓手機在人工智慧領域獲得更強的運算和處理能力。
  • 麒麟9000初露頭角,即將面世,mate40系列與榮耀magic系列有福了
    海思麒麟系列晶片作為華為的一款自研系列晶片,即將迎來它的最後一款產品——麒麟9000,對於這款晶片,大家已經期待了很久,各種媒體對於這款晶片的傳言也已經很多了,一直以來華為方面對於這款晶片的保密工作做得都很好,而最近終於又有了這款晶片的消息,華為將在9月3日的IFA2020大會上展出麒麟
  • 餘承東:華為Mate40系列將搭載麒麟9000,或成最後一款高端機!
    並且餘承東表明華為Mate40系列手機搭載的處理器名稱並不是之前外界猜測的麒麟1020,而是麒麟9000。雖然現在數碼產品的數字編號都愛跳著取,但是直接從麒麟990跳到麒麟9000這個命名模式確實讓大眾吃了一驚。
  • 華為麒麟9000新機曝光,花粉:幸虧沒買Mate40
    自小米11系列發布之後,關於驍龍888、蘋果A14、麒麟9000三大手機晶片之間的對比就成了數碼圈熱議的話題。通過各大數碼測評博主提供的數據顯示:單論性能,搭載驍龍888的小米11表現確實可圈可點,但在極限測試環境下還是有著「火麒麟」的稱號。相比而言搭載麒麟9000的Mate40Pro的表現中規中矩,在保證性能的同時,功耗控制做得非常優秀。
  • 華為9月10號將舉行發布會,但麒麟9000/Mate40均將缺席
    3.麒麟910(華為Mate2)、2014年 2014年初,首款以「麒麟」命名的晶片——麒麟910發布。麒麟910基於28nm工藝製程打造,是全球首款4核手機處理器,GPU為Mali-450MP4。
  • 一圖看懂華為麒麟 9000:Mate 40 Pro 系列首搭載,全球首款 5nm 5G...
    IT之家11月9日消息 在Mate40系列發布會上,華為正式發布了麒麟9000和麒麟9000E SoC 5G 晶片,採用全新5納米工藝,帶來速度更快、發熱更低、能效更強的運行體驗,讓你的5G生活更高效。現在華為麒麟官方帶來了一圖看懂麒麟9000。
  • 麒麟、三星迎來對手!12月1日,高通驍龍875即將亮相
    作為高通第一款5nm旗艦,驍龍875與麒麟9000系列晶片和三星獵戶座1080一樣,均採用EUV 5nm工藝製程,但不同點在於,驍龍875和三星1080是由三星代工,而麒麟9000則交付給了臺積電。對比麒麟9000和三星1080,驍龍875會帶給消費者怎樣的驚喜?
  • 都是5nm晶片,為何麒麟9000比蘋果A14差,還不如A13
    眾所周知,目前全球也就只有2款5nm的晶片,分別是蘋果的A14,以及華為的麒麟9000。但對比來對比去,大家發現都是5nm的晶片,但麒麟9000差A14還是很遠的,不管是CPU、還是GPU,都差得遠。甚至綜合起來看,麒麟9000可能還不如蘋果去年的7nm晶片A13,所以讓人很是詫異。
  • 華為Mate40不是絕唱,麒麟9000新機即將登場,價格卻貴到買不起
    受美國禁令影響,麒麟9000或成為華為近兩年最後的高端旗艦晶片。而搭載這顆晶片的華為Mate40系列也有可能成為絕唱,一時間,華為Mate40成為外界重點關注的對象。但根據最新消息近日還有一款麒麟9000新機即將登場。