展銳春藤是一顆支持雙屏異顯的晶片:比如說在便利店收銀支付,收銀員看到的與顧客看到的屏幕內容是不一樣的,這就要求設備本身能夠做到「雙屏異顯」。雙屏異顯實際上還有很多應用場景,它們的特點可能包括了雙觸摸、不同解析度和尺寸的雙屏組合等。v8JEETC-電子工程專輯
在上周萊迪思半導體舉辦的主題活動上,展銳發言人提到了這種雙屏異顯的支持方案。「我們考察過很多晶片,有的是價格太貴,有的是功能單一——只支持某種解析度,而且性能存在不確定性,沒有大規模量產的。」「萊迪思的「CrossLink晶片正好適用。」v8JEETC-電子工程專輯
「包括支持不同解析度組合,雙1080p/720p等,橫屏豎屏任意組合。而且也支持雙觸控屏。另外是單軟多硬,一套軟體可以支持好幾套屏。根據硬體上一些屏的特性或者一些ADC接口,可以自動認出是哪一組屏,軟體自動加載驅動程序,也就實現了一款軟體適應多種屏幕。這些方案都是我們和萊迪思反覆討論的。」「用萊迪思的CrossLink的FPGA方案,實現單、雙MIPI轉換。」「我覺得我們這個方案,在業界可以說是外擴MIPI成本最低、性價比最高的方案。」v8JEETC-電子工程專輯
除了展銳的這個例子之外,上汽發言人也在活動上與萊迪思的合作。「我們項目中有個支持12路視覺的SoC晶片。」「它支持的MIPI-CSI接口很有限。」「儘管單路MIPI接口帶寬是足夠的,但要支持12個攝像頭,前面的MIPI橋接很困難。」對此,「我們用了CrossLink-NX產品,這個方案是把12路攝像頭接進來,變成4路MIPI,經過CrossLink-NX之後,對接後面的高算力SoC。不需要外接一系列外設,封裝也很小,在板子上加這樣一個方案。」v8JEETC-電子工程專輯
前面這兩個列舉的,都是萊迪思CrossLink-NX FPGA晶片的典型應用。這次活動,包括會後針對萊迪思三位高層的採訪,也讓我們也有機會去深入理解萊迪思的FPGA應用於哪些領域,以及萊迪思作為低功耗FPGA市場的主要參與者,其真正的市場在哪裡。v8JEETC-電子工程專輯
從萊迪思半導體FY2020前三個財季的財報來說,雖說因為整體大環境的關係,這家公司營收是有持續的同比下滑的,不過下滑幅度比較小——FY2020Q3季度的營收為1.03億美元,比去年同期下滑0.4%,前面兩個季度的同期水平大致相當。v8JEETC-電子工程專輯
不過以non-GAAP的淨利潤(Net Income)成績來看,數字在這三個季度都呈上漲趨勢,看起來似乎主要是因為毛利率的增長。FY2020Q3淨利潤2663.5萬美元,同比增長16.1%(Non-GAAP),其產品毛利率(Gross Margin)已經漲至61.5%。而FY2019Q1,這個數字還是58.6%。這表明萊迪思有在疫情期間做出一些策略調整,且卓有成效。v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
另外,萊迪思中國銷售副總裁王誠在活動中提到:「今年萊迪思股價在全球大幅上漲,很大原因是中國的業績在每個季度都屢創新高。在今年這個特殊環境下,我們依然做到了業績的增長。」v8JEETC-電子工程專輯
事實上,萊迪思的季報沒有詳細反映區域收益。從FY2019的年報來看,萊迪思營收的74%都來自亞洲地區,歐洲和北美各佔12%與14%。這其中中國應該是佔了相當大比重的。「萊迪思美國、中國的marketing,所有新產品定義第一時間是看萊迪思中國的要求,因為我們中國生意佔萊迪思全球接近50%,成長很健康。即便今年疫情影響,我們也還在增長。」v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
萊迪思中國銷售副總裁王誠v8JEETC-電子工程專輯
萊迪思半導體上海有限公司副總裁/總經理任崎也在接受採訪時也提到:「FPGA領域,萊迪思是唯一一家在國內有研發集團的公司,這個團隊真正在做晶片設計和開發,非常核心。我們未來發布比較高端的產品,是中國團隊在做。」王誠補充說:「我們是唯一一個具有本土全功能研發團隊的企業,全功能是指硬體軟體,包括相關測試。」萊迪思亞太區總裁Jerry Xu則強調:「我們團隊結構除了R&D之外,國內有三十人是做solution的,這種研發投入在歐洲或者美國都是沒有的。」在中國市場的業務增長,想必很快應該就能在本月月末將發布的萊迪思年報上看到展現。v8JEETC-電子工程專輯
藉此機會我們也來看看萊迪思的業務範圍。萊迪思涉足的市場主要包括通訊與計算(Communications and Computing)、工業與汽車(Industrial and Automotive)、消費(Consumer)。v8JEETC-電子工程專輯
具體到產品上,萊迪思主要的產品是FPGA(包括通用FPGA的ECP家族,控制與安全FPGA的MachXO家族,超低功耗FPGA的iCE40家族,以及針對高速視頻與傳感器應用的CrossLink家族)、視頻連接ASSP(較早的產品布局,現下似乎已經不再更新)、IP授權與服務。前文談到的CrossLink就屬於萊迪思FPGA產品的其中一支。v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
萊迪思亞太區總裁Jerry Xuv8JEETC-電子工程專輯
再細一點說萊迪思的市場機會,這個時代背景下主要包括了(1)數據中心市場成長,萊迪思的解決方案在企業與數據中心伺服器應用的控制和連接功能點上;(2)5G部署致通訊基礎設施需求增長,萊迪思的解決方案在關鍵系統中,可用於各種功能的控制和連接;(3)智能工廠、智能家居、汽車市場,萊迪思低功耗、小尺寸解決方案,對於電池供電系統、傳感器應用,以及嵌入式視頻等領域,都是比較理想的解決方案;(4)AI作為市場熱點,萊迪思有邊緣端的AI inference解決方案,具體到面部識別、圖像識別、視頻分析等;(5)通訊、計算、工業、汽車與消費市場,硬體安全需求在提升,這部分萊迪思也提供解決方案。v8JEETC-電子工程專輯
這幾點應該是現如今萊迪思的主要增長點。本文我們嘗試談談其中的第4點,即在AI相關的熱點應用中,萊迪思的低功耗FPGA能做些什麼。畢竟萊迪思的FPGA產品不像賽靈思、Intel或者英偉達的AI加速產品那樣,可以做到超高算力,其定位更偏低功耗市場。v8JEETC-電子工程專輯
我們有在採訪中特別問及萊迪思FPGA的低功耗,究竟是怎麼做的。針對CrossLink-NX這款產品,還是要從萊迪思的Nexus平臺說起。這個平臺是萊迪思在2019年年末發布的。據說在這個平臺誕生之初,是萊迪思與現有不少客戶交流討論需求後的產物。v8JEETC-電子工程專輯
在系統層級,Nexus是一整套解決方案,包含了設計軟體、預製的軟IP,以及評估板、開發套件、參考設計等。主要面向的是嵌入式視覺,以及傳感器橋接、傳感器聚合以及圖像處理這樣的解決方案。v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
Nexus平臺(或者說CrossLink-NX)幾個比較典型的應用v8JEETC-電子工程專輯
在FPGA晶片層面,Nexus平臺針對低功耗邊緣計算做了一些架構特性上的改進,以優化系統性能。比如說該平臺有DSP模塊,以及更高容量的片上存儲——適用於較高能效的計算,典型如AI inference算法。v8JEETC-電子工程專輯
電路設計層面,包括可編程的能效優化,和針對瞬時啟動應用的快速配置等。另外比較重要的一點是,Nexus平臺的FPGA晶片採用28nm FD-SOI工藝。此前我們撰寫過不少有關FD-SOI工藝的文章,這項工藝的重要特性就是更低的功耗。萊迪思官方的數據是,相比bulk工藝(體矽平面結構)降低一半的功耗,以及軟錯誤率僅有bulk工藝的1%。v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
「這個工藝和傳統CMOS工藝最大的區別,就是它的源極與漏極之間植入了超薄的一層氧化層,這層超薄氧化層大大降低了電晶體漏源之間的漏電流,同時對萊迪思的可靠性、軟錯誤率起到了很大的幫助作用。」任崎表示。從公開信息來看,28nm FDS工藝應該主要是來自三星Foundry。不過除了三星Foundry以外,在更早工藝的合作上,萊迪思的合作夥伴還包括了聯電(和旗下的USJC)、Epson以及臺積電。v8JEETC-電子工程專輯
而除了工藝帶來的功耗紅利,電路設計、晶片架構方面也有相應的優化。在晶片架構上,「這裡舉一個例子。傳統的FPGA,要做高密度運算,常常需要DSP、Fabric、EBR(embedded block RAM)進行操作,需要外掛DDR來滿足存儲器需求。但這些都會提高延時,對功耗也有影響。」任崎說,「針對高效計算的需求,尤其近年來客戶對AI應用的需求,萊迪思對構架做了優化。」v8JEETC-電子工程專輯
「大家可以很容看到整個Data Path延遲降低,性能提高,功耗也有很多改善,這是萊迪思在構架方面的一個例子。」如上圖所示,似乎一部分調整是將外掛的RAM,帶到了片上(官網資料中提及CrossLink-NX系列產品中,LIFCL-40的Large Memory為1024Kb,EBR為1512Kb)。此外,任崎也列舉了Nexus平臺的應用場景,如人員檢測,在工業安全、安防、汽車自動駕駛等領域,「動態地、高速地在圖像上識別人物。」v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
萊迪思現場對比的競品是Xilinx Spartan 7和Intel Cyclone 10。這兩款產品實際上是Xilinx和Intel於2017年量產的同檔競品。只不過這兩家的確後續並未在同代工藝上再做更新,而萊迪思專攻了這部分市場,顯然是能夠找準市場機會的。而且似乎在結合工藝、電路設計以及晶片架構的紅利之後,萊迪思的是,Nexus平臺相較這兩者最高可降低75%的功耗。v8JEETC-電子工程專輯
低功耗的價值也不僅限於晶片本身,王誠提到:「低功耗可以簡化散熱片的設計、降低運營成本,更重要的是低功耗能帶來更低的溫升。功耗很低的時候,我們採用相同的封裝技術,這時候溫升非常小,就能給應用提供更好的環境溫度容忍度。」「比如馬達控制,汽車的發動機引擎環境溫度可能達到105℃甚至更高,傳統28nm、40nm就做不到這樣的應用。FD-SOI以低功耗、低溫升,做到對105℃環境溫度的容忍。這在工業、汽車等溫度敏感的領域,都會有更好的應用。」v8JEETC-電子工程專輯
如前所述,Nexus作為一個平臺不僅是FPGA晶片本身,還包括了軟體工具、軟IP、參考設計和套件。而且「我們在Nexus平臺上,做了很多基於應用的解決方案,包括人工智慧、嵌入式視覺、安防等,都是希望幫助萊迪思的客戶更方便地去用萊迪思的產品,並將產品推向不同的應用領域。」比如後文將要提到的sensAI解決方案。v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
萊迪思半導體上海有限公司副總裁/總經理任崎v8JEETC-電子工程專輯
萊迪思Nexus平臺的首款產品就是CrossLink-NX FPGA了,文首提及的兩個客戶案例都是CrossLink-NX的具體應用。CrossLink-NX FPGA誕生的初衷,應該就是嵌入式視覺開發者有在設計中增加AI/ML技術的需求,期望能夠跑人員計數或者是存在檢測一類的應用。v8JEETC-電子工程專輯
這其中的主要挑戰在於,更多的傳感器、高解析度和幀率的攝像頭加入到了嵌入式視覺系統中;組件通常採用MIPI標準。v8JEETC-電子工程專輯
CrossLink-NX FPGA的特點在於,突出的能效、小尺寸、較高的可靠性,以及針對邊緣嵌入式視覺解決方案所需的「高性能」。王誠在演講中將其概括為低功耗、高性能、高可靠性——這應該也是萊迪思全系FPGA產品的著力點。本文的前一個段落就著重了「低功耗」特點。CrossLink-NX面向的應用領域包括了工業、汽車、計算、移動,以及安防監控等。v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
上面這張圖是CrossLink-NX的簡單配置和框圖,其中的亮點主要在FPGA fabric,以及I/O支持上。這顆晶片包含至多近40000個邏輯單元(LIFL-40),每個單元170bits存儲(據說是類似FPGA產品中最高的memory-to-logic比),以及用於數據處理的DSP模塊。這些是實現邊緣AI/ML計算的基礎。v8JEETC-電子工程專輯
針對這部分,萊迪思提及,相比Intel、賽靈思的競品,CrossLink-NX的MIPI D-PHY連接帶寬,以及每個邏輯單元的存儲容量都有優勢;另外還對比了,應用CrossLink-NX方案,以及應用了MCU的零售安全攝像頭,在人員計數方面,前者性能有10倍優勢——不過MCU作為一種通用計算晶片,效率上的差異也在情理之中。v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
然後是I/O支持的部分。CrossLink-NX支持至多8個MIPI D-PHY lanes,速率2.5Gbps。可編程I/O有額外的最多到12 MIPI D-PHY lanes。而且其I/O配置少於3ms時間,整個設備可在15ms內配置完成,這對於一些任務關鍵型的嵌入式視覺應用(如工業、汽車)是比較重要的。這類設備通常需要即時地響應,確保安全性。展銳和上汽針對CrossLink-NX的應用應該主要就是其I/O支持的展現。v8JEETC-電子工程專輯
「我們最早的一些產品也有快速I/O響應的特性,即瞬間加載,瞬間I/O就會有工作信號出來。」王誠補充了對I/O性能的解釋,「萊迪思可以成為電路板上第一個供電,馬上部署起來的器件,完成對電路板上CPU、外圍器件、電源(上電順序與監控)或其他的控制。時間是在毫秒級,其他品牌需要幾十、上百毫秒。萊迪思的I/O喚醒時間短,比其他品牌快50倍以上。」——針對這一點,活動現場也有專門的demo演示:v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
AI/ML性能,以及I/O性能,即是萊迪思宣稱「高性能」的主要體現了。最後還有個「高可靠性」,這一點實則在前一段闡述低功耗的部分就有提及了,即適用於較廣的溫度範圍(-40℃~125℃),和軟錯誤率(FIT,故障時間,10億器件運行小時)僅相當於競品的1%。這與FD-SOI也是有很大關係的。「萊迪思在過去4年發了10億枚晶片,仍然能夠保證很好的質量控制。」王誠說。v8JEETC-電子工程專輯
前文談的「高性能」,仍然是限定在低功耗領域的。在邊緣AI加速競爭上,並不與GPU或其他高算力產品衝突。王誠在接受採訪時提到:「FPGA方案的魅力在於,可以從成本、性能、方案上調整,可以和別人配,也可以自己做。如果應用只是要看多少人戴不戴口罩,那麼算力不大,自己做FPGA成本更低;如果是把所有特徵都提出來,這就不適合自己做晶片了,選擇GPU可能更合適。」v8JEETC-電子工程專輯
與此同時,FPGA又能做差異化。Jerry Xu提到:「客戶要做自己的差異化,比如馬達控制,要控制電流、控制速度和位置。往往電流控制是比較標準化的東西,但客戶又要做差異化。所以可能用傳統的DSP或MCU,我們的FPGA就配合做co-processor,結合在一起,我做電流的加速控制,它做位置和速度,既得到應有的性能又保持差異化特點。這是FPGA的靈活性體現出來的。」v8JEETC-電子工程專輯
任崎則補充了當前將AI inference放到邊緣的根本:「現在有個重要的指標,就是數據處理的成本。我們在這方面有很大的優勢:低功耗。做不到低功耗就很難做邊緣,成本相對低,整個系統的成本就降下來了。」v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
這三段話實則解釋了數據處理從雲,部分下放到邊緣(或端)的重要原因;CrossLink-NX這類FPGA晶片在邊緣AI inference過程裡扮演何種角色;以及其競爭優勢與定位在哪裡。當然這裡,我們主要談的是CrossLink-NX參與邊緣AI計算的特性。v8JEETC-電子工程專輯
我們此前提及過多次的一個話題就是,考慮算力、功耗、效率、靈活性、成本等問題,在晶片的選擇上,哪一類晶片會是優選。這一點的確還是要根據不同應用場景來做判斷的。比如ASIC固然有著更高的效率,但靈活性差——尤其在神經網絡模型不斷變遷的當下;而且就niche市場,或者企業單獨做解決方案這一點來看,還是成本過高的。v8JEETC-電子工程專輯
所以FPGA存在其特定的市場空間:文首提到的市場增長點,都非常適用於FPGA這一類晶片——萊迪思則有屬於這其中另一個市場定位的選手。v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
活動開場時,萊迪思CEO Jim Anderson就提到在產品布局中「基於應用的解決方案棧(solution stacks)」。其中的sensAI還獲得過我們EDN評選的2018年Hot 100產品。sensAI就是一個完整的解決方案棧,屬於建基於FPGA硬體之上更完整的系統級解決方案。v8JEETC-電子工程專輯
下午場的技術演講部分也詳細談到了sensAI,這裡作為一個理解萊迪思產品布局的示例和表現萊迪思全面能力的部分,我們簡單地聊一聊。上面這兩張圖即是sensAI棧不同層面的內容和服務,包括FPGA即周邊硬體本身、IP核、軟體工具、參考設計、定製化設計服務等;以及可定製的參考設計,和不同組件在AI所處的位置。v8JEETC-電子工程專輯
硬體這裡就不再列舉了(除了FPGA晶片,典型如嵌入式視覺開發套件,以及各種用於原型設計的模塊化硬體平臺),軟體工具-神經網絡編譯器支持Caffe、TensorFlow這些主流的ML框架,「這樣的標準訓練完成後,通過我們的編譯器可以產生在萊迪思FPGA上運行的文件。」「這也在不停的更新過程中,我們很快會宣布下一個版本推出。」v8JEETC-電子工程專輯
v8JEETC-電子工程專輯
另外還有各種IP,上面這張圖是萊迪思做的CNN Plus加速器IP。事實上,除了CrossLink-NX之外的更多晶片上(如iCE40,ECP5等),都有CNN加速器方案提供,「也有持續不斷的新方案推出,讓性能做到更好」。v8JEETC-電子工程專輯
而在sensAI解決方案本身的更新上,「我們其實從2017年就開始做,2018年宣布第二版,一年會有兩個版本。今年上半年官網上了3.0版,明年和後年還會不斷更新。」v8JEETC-電子工程專輯
「Solution stack其實是融合我們的晶片,針對不同行業、不同應用,客戶可以很快去學習應用萊迪思的產品,也可以很快把他們的產品推向目標市場。」任崎說,「上海近百人的研發團隊一半都在做軟體。」王誠補充道:「萊迪思除了在傳統軟體以外,也加上了更多的算法配套設計。軟體投入也是我們重要的投入之一。」sensAI這類解決方案棧,應該就是萊迪思在市場部署中,最到位的能力體現了。v8JEETC-電子工程專輯
責編:Luffy Liuv8JEETC-電子工程專輯