2020年12月1日,高通正式發布了他們最新一代的旗艦5G SoC——驍龍888。在當時的發布會後,我們三易生活已經對驍龍888的技術特性與拍照設計進行了一些深挖。但畢竟在那個時候,這款全新旗艦方案的具體性能數據尚未公布,因此外界對於它的實際水準還是有著諸多猜測。
開發用機的外觀以及硬體配置
好在兩個多星期的時間後,高通方面終於以視頻+技術文檔的方式,正式公布了驍龍888的性能測試成績。雖然這次的測試還是基於一臺並不屬於任何品牌,使用了12GB LPDDR5內存+512GB快閃記憶體存儲配置的開發用機,但它已經足夠讓我們看到驍龍888一部分的真實性能表現。
為什麼我們要說是「一部分真實性能」?一方面,這是因為驍龍888這次的跑分成績的確非常亮眼。安兔兔綜合性能成績平均達到73.5萬分,Geekbench5單核成績平均達1132、多核則平均為3786,GFXBench曼哈頓場景平均高達169幀/秒,安兔兔AI測試成績相比上代近乎翻倍,是競品5nm旗艦晶片的五倍還多。換句話說,從CPU到GPU,再到AI性能,驍龍888都實現了巨大的提升與相比競品的領先。
但另外一方面,從我們三易生活目前拿到的相關資料來看,驍龍888這次公布的跑分成績甚至還很可能不是「全力」。因為高通方面特別有提到,為了體現更接近實際日常使用中的性能表現,所有的驍龍888測試設備這次都完全採用了默認電源設定,換句話說,也就是沒有開啟許多機型上常見的「性能模式」或「遊戲模式」,而是僅以平衡模式跑出的以上這些成績。
這意味著什麼?簡單來說,這代表著驍龍888很可能同時做到了頂級性能與超高的能效比,同時也意味著當相關機型正式上市的時候,大家看到的跑分成績還會有進一步上漲的空間。那麼問題就來了,高通究竟用了怎樣的「黑科技」,讓驍龍888實現了如此驚人的性能與能效表現呢?
它的CPU與眾不同:X1定製超大核解析
為什麼驍龍888的實測性能會如此之高?如果大家此前關注過我們三易生活的相關報導可能還記得,驍龍888這次在製程與架構上都進行了全面進化。一方面,它使用了最新的5nm製程,首次在高通旗艦5G方案中實現了5G SoC的一體化設計,有效改善了整套方案的能效比;另一方面,在對性能影響至關重要的架構上,驍龍888這次不僅用上了最新的Cortex-A78大核心,還首發了全新的Cortex-X1超大核。
其實說起Cortex-A78,許多朋友都應該不會感到陌生。作為ARM去年發布的大核架構Cortex-A77「直系後代」,同功率下性能提升20%(數據源自ARM官方資料)的Cortex-A78,如今已經被高通、三星、聯發科三家選定為次世代SoC所使用的CPU大核方案。但大家如果環顧市場就會發現,相比於Cortex-A78的「快速普及」,定位更高的Cortex-X1目前卻僅有高通驍龍888採用,那麼這是為什麼呢?
在ARM官方的資料中,我們其實很容易就能找到答案。這是因為Cortex-A78屬於正常產品線更迭的產物,也就是所謂的「Roadmap core(路線圖核心)」,客戶只要肯掏錢,都能直接買到。而Cortex-X1則不然,它是ARM新推出定製設計服務的最新產物,屬於「Custom core(定製核心)」的一種。說白了,就是由高通提出需求,雙方共同設計出來的超高性能方案。這也就解釋了為什麼驍龍888能夠首發X1超大核,以及為目前還沒有第二家晶片廠商宣布跟進的原因。
那麼與「公版」的Cortex-A78相比,定製超大核Cortex-X1到底有哪些優勢呢?簡單來說,它可以視為Cortex-A78的「滿血超級增強版」。相比A78,X1超大核架構將宏運算(Mops)的帶寬增加了30%,將矢量加速單元(NEON)從兩組128bit直接加倍為四組128bit,將所有的緩存配置全部加倍。於此同時,它的亂序執行設計完全不同於A78的小規模節能思路,而是採用了更類似蘋果A系列或三星「貓鼬」的224條超大規模設計,以此來將重負載下的單核性能推向極致。
事實上根據ARM方面早前公布的數據顯示,與Cortex-A78架構相比,Cortex-X1的調度帶寬增大了33%,整數運算能力提升了23%,浮點運算和機器學習能力更是大漲100%之多。考慮到我們前文中所說Cortex-A78對比Cortex-A77「僅有」20%的性能提升幅度,不難意識到Cortex-X1所具備的這種巨大性能進步,給驍龍888的CPU部分帶來了多大的優勢。
Adreno 660很強,但它更大的優勢在於夠「穩」
看完CPU部分,讓我們將目光投向驍龍888的GPU。眾所周知,在目前整個Android生態中,高通是唯一一家具備自主研發GPU能力的廠商。這意味著他們不需要被動等待Mali或者PowerVR的GPU授權「上新」,然後再去做適配,而是能夠根據自己的SoC需求去進行「堆料」,同時讓GPU與晶片的其他部分達成一個更合理的總體能效比。
驍龍888的實測幀率為168-170幀/秒
GFX Bench目前的排行榜
這樣的優勢體現在驍龍888上,會是怎樣的的一個結果呢?簡單來說,驍龍888這次集成的Adreno 660 GPU在GFX Bench 「曼哈頓3.0」離屏測試中的平均幀率為169幀。我們只需簡單在GFX Bench官網上查詢一下就可以發現,驍龍888均衡模式下的3D成績,就已經領先A14(iPhone 12 Pro)28.2%,相比華為麒麟9000(Mate40 Pro 5G)更是高出了47.3%之多。
很顯然,驍龍888在5nm這個技術節點上,再次拿下了3D遊戲性能無可動搖的霸主地位。但是請允許我們提醒一下大家,驍龍888在實際遊戲中的幀率和體驗領先程度,很可能還遠不止47%「這麼一點」。
為什麼我們敢這樣說?一方面,我們必須再次強調,今天公布的驍龍888性能測試成績,是在平衡模式的電源管理設定下測得,而如今主流智慧型手機產品在運行遊戲時,必然都會自動開啟「性能模式」或「遊戲模式」,使得其性能釋放更加激進。
另一方面,高通不僅能夠自研GPU硬體,同時也有能力為自己的GPU提供驅動更新,以及自研的遊戲開發與優化工具。特別是高通為旗下高端平臺推出的Snapdragon Elite Gaming開發包,如今已經得到谷歌方面的支持,並將專門用於優化手遊性能表現的Android GPU Inspector工具也整合了進來。這相當於Adreno GPU得到了谷歌官方「欽點」,使其更容易得到來自遊戲引擎提供商以及遊戲開發者的優先適配和性能優化。
事實上根據我們目前已知的信息顯示,高通的Adreno GPU至少已與Unity、Messiah、NeoX和虛幻等,多個行業主流遊戲引擎都有進行合作優化。而驍龍888使用的Adreno 660 GPU還專門新增了在高畫質、高幀率遊戲中,能有效降低系統負載,進一步提高流暢度的可變渲染率技術。
試想一下,當基於驍龍888的旗艦機型面世時,它們將能夠從已經準備好的手遊A中,得到可變渲染技術帶來的額外30%以上的性能(幀率)提高效果,而其他原本就不支持此技術,或是沒有做到引擎級優化的GPU則不能從新技術中得到好處。這樣一來,驍龍888的實際遊戲表現優勢豈不就更大了。
性能翻倍的AI引擎,新設計讓效率突破瓶頸
那麼,驍龍888的第六代AI引擎有什麼特點呢?簡單來說,它的優勢主要表現在兩個方面,一是本身的硬體算力特別高,二是計算效率進步明顯。
論算力,驍龍888這次官方公布的AI引擎總算力高達26TOPS,這比驍龍865(15TOPS)足足提升了73.3%,比同世代的其他5nm旗艦方案更是高出了一倍以上。
但如果我們將驍龍888這次的安兔兔AI測試成績與驍龍865進行對比,就會發現一個問題,驍龍888的平均AI測試成績高達911883分,比官方榜單上的驍龍865(460413分)足足提升了98%。也就是說,驍龍888的實際AI性能提升幅度,甚至大於了理論上的算力增長幅度。那麼這又是為什麼呢?
安兔兔AI性能榜單
原因很簡單,因為高通在驍龍888上大改了從CPU到GPU、再到DSP、NPU,甚至ISP在內的全部計算部件的AI處理架構,讓它們不僅僅是算力更高,同時能效比和處理延遲也得到了大幅改善。
比如說驍龍888這次搭載的Hexagon 780 DSP,就是架構完全改頭換面的新設計產品。在以往的驍龍平臺內部,DSP裡會集成有張量、矢量和標量等多個功能不同的AI加速核心,它們各自都從內存裡讀取所需的AI數據,根據數據類型「各幹各的」。但問題在於,很多時候一項AI運算任務同時需要涉及到好幾種運算模型,這就會造成三種加速核心需要反覆讀寫內存、交換數據,最終使得計算效率降低、延遲變大。
針對這一情況,Hexagon 780首次實現了將三種不同的AI計算核心合併為一個「融合加速器」,其標量和張量加速計算能力分別比前代提升了50%和100%。同時高通又在這塊DSP單元內部加入了大容量的共享內存,使得融合加速器無需訪問內存,就能直接在內部完成不同計算任務的數據交換,以大幅降低計算過程中的內存延遲。
經過這樣的重新設計,驍龍888的DSP單元在執行AI計算任務時,單個應用的可用內存比原來增加了16倍,關鍵數據的傳輸效率更是比前代高出了1000倍之多。而這種效率上的極大提升,不僅讓原本就很高的算力得到更充分的發揮(表現在跑分上就是73%的算力提升帶來了98%的性能增長),更使得整個AI計算體系在執行本地計算時的能效比大增300%,不僅更快,而且還更省電,能持續高性能地運作更長時間了。
讓高性能落到實處,這才是驍龍888的殺手鐧
如果你是一位對新技術、新產品充滿激情與好奇心的發燒友,相信驍龍888今天公布的性能表現就已經足夠讓你感到興奮了。因為無論是從哪一款跑分軟體、哪一個跑分項目的成績來看,驍龍888都創造了智慧型手機行業的新紀錄。
但如果你是一位更理性的手機玩家、或者更關注實際表現的手遊達人,那麼驍龍888今天的跑分成績發布,或許會引發你更深層次的思考。
是的,驍龍888的跑分真的很高,高通卻並沒有刻意地通過極致的電源設定或者強力的冷卻系統來刻意「壓榨」分數,而是專門強調這是非高性能模式下的跑分結果。
是的,驍龍888的性能也真的很強,但這種強卻並非通過高主頻來實現。事實上,驍龍888的CPU超大核主頻「只有」2.84GHz,比很多採用上代老架構的產品都要更低。
很顯然,如果高通不這樣做,那麼驍龍888理論上還可能輕鬆跑出更高的成績,在宣傳層面上更加好看一些。但高通最終選擇了「講實話」,選擇了追求更接近真實的使用場景,能真正在遊戲、追劇、導航等場景下,長期維持不降頻、不縮水的性能表現,作為驍龍888的設計依據。
而這種「老實人」的產品設計思路,最終卻還能依然實現遠遠甩開對手的跑分成績。或許,這才是驍龍888在性能設計上真正的可怕之處。