具有X86到ARM二進位翻譯的SoC系統設計

2020-12-13 電子產品世界

二進位翻譯也是一種編譯技術，它與傳統編譯器的差別在於其編譯處理對象不同。傳統編譯器處理的是某一種高級語言，經過編譯處理生成某種機器的目標代碼。

本文引用地址：http://www.eepw.com.cn/article/201706/348380.htm

二進位翻譯是一種直接翻譯可執行二進位程序的技術，能夠把一種處理器上的二進位程序翻譯到另外一種處理器上執行。它使得不同處理器之間的二進位程序可以很容易的相互移植，擴大了硬體／軟體的適用範圍，有助於打破處理器和支持軟體之間的相互扼制的局面。二進位翻譯技術的優點為：不需要重編譯源碼就可以實現軟體從舊平臺到新平臺的移植；快速為新機器提供軟體，包括移植作業系統和編譯器；充分利用新機器的特性優化代碼；減少培訓費用，因為使用的是相同的軟體，所以不必在新平臺上重新培訓員工；降低了多平臺軟體的費用。

1 SOC架構設計

1．1 處理器的確定

通用處理器與硬體邏輯是SoC設計的主流架構。在一些需要大量數據處理的應用中，這樣的架構並不能滿足要求。實際上，由於不同的任務在很大程度上互相獨立運行，可以將具有內在執行並行性的任務分解為緊密聯繫的子任務，不同的內核可以執行不同的子任務，多核架構在1個周期內可以執行多個指令。這種並行處理使得整個系統的性能與使用單核處理器串行處理相同任務相比，有了很大改進。另外，多核架構設計可以復用現有的單核處理器作為處理器核心，從而可以縮短設計和驗證周期，節省開發成本，符合SoC設計的基本思路。多核架構是未來SoC發展的一個趨勢。

該設計採用雙核架構，採用當代流行的處理能力較好的ARM處理器ARM7TDMI-S和ARM926EJ-S，ARM內核最大的優勢在於高速度、低功耗。

ARM7TDMl-s具有3級流水線結構，支持Win-dows CE，Linux等作業系統。ARM926EJ-S是ARM公司在2000年推出的功能最強大的ARM9處理器，實現5級流水，它與外部通信接口為雙AHB總線結構，即指令AHB總線和數據AHB總線。該設計中ARMTDMI-S主要負責控制、作業系統平臺和任務的調度。ARM926EJ-S則主要負責各種任務的執行。

1．2 使用的總線標準

由於SoC中集成了大量的IP核，設計的關鍵在於如何實現各IP模塊之間的互連。目前，SoC中IP核的互連一般採用總線結構，通過消息通信。

採用ARM公司的AHB與APB為片上總線。AMBA總線體系結構是當前SoC體系設計結構設計的開放標準，由於AMBA被越來越多的公司採用，已迅速成為SoC結構和IP庫開發的標準。

在具體實現時，採用AHB加APB的兩級總線結構。AHB用來支持高速設備，支持多主從設備。多個主設備之間通過仲裁機制保證優先級，從設備通過地址解碼機制被選中，並響應主設備發起的總線事務。APB用支持基於寄存器訪問的低速設備。AHB與APB兩條總線通過總線橋連接在一起，實現兩條總線之間的協議轉換。圖1為SoC的系統結構框圖。

1．3 各IP在系統中的功能

除了兩個處理器外，SoC中各IP核功能如下：翻譯模塊：實現將X86指令翻譯成為ARM指令的功能。

SMI：外部存儲與微處理器之間的橋梁，支持RoM作為系統的非易失性存儲介質，支持片外SRAM作為系統的外圍高速存儲。

中斷控制器：用來支持系統內部與外部的中斷控制，如中斷電平／邊沿觸發、中斷電平極性與中斷使能等。

Internal Memory：片內SRAM，大小為1 KB，但可以通過修改Verilog的描述來改變其大小。

Default Slave：用於當master訪問未定義的地址空間時，給出一個應答信號。

Retry Slave：是一個可以產生重試回應及等待命令的slave範例，若需要類似的模組，可以利用它來完成。

Watchdog：保證系統安全的監控模塊，軟體需在預定的時間內訪問相應的寄存器，否則硬體將產生內部信號自動復位。

GPIO控制器：用來支持擴展外設，拓寬SoC的使用範圍。

RemapPause：主要分成兩個處理單元，前者負責控管地址是否重新對應的機制，後者負責管理系統的省電模式。

Timer：定時器，支持捕獲、Matchout輸出、外部時鐘驅動。

2 X86到ARM二進位翻譯模塊

該設計使用的翻譯模塊通過編寫Verilog HDL實現，能將部分X86指令翻譯成ARM指令，實現了某些X86應用程式到ARM架構的移植。圖2為解碼器內部結構圖。

該翻譯模塊首先從ROM中取出X86指令，翻譯成ARM指令後存人RAM中，所有指令翻譯完成後，翻譯模塊產生一個終端，使處理器執行RAM中的指令。即所有指令先翻譯完成，處理器才執行，該翻譯過程屬於靜態二進位翻譯。其中Decoder是整個解碼模塊的核心，負責翻譯指令。Decoder模塊採用有限狀態機控制數據通路的方式實現．根據指令的功能和尋址方式進行狀態分類，然後輸出ARM指令。例如，把寄存器尋址的算術指令可分為一類：

ADD EAX，EBX

SUB EAX，EBX

因為這些指令的尋址方式一樣，功能近似，只是操作碼不一樣，可以歸併為一個狀態，在某一狀態內建立映射關係翻譯成為ARM指令。

考慮到AHB總線可能處於比較忙碌的狀態，對於X86指令和翻譯出的ARM指令分別設置2個FIFO。FIFO1和FIFO2各自有2個存儲器，其中一個存儲指令，另一個存儲與指令對應的地址。對FIFO進行操作會同時對指令和地址進行操作，以保持指令和地址的對應。

此外，ARM核需要向解碼模塊發送信號，通過設置Communicate模塊中的寄存器控制指令解碼器的工作：

設置X86指令的起始地址；設置X86指令的終止地址；設置ARM指令的初始存放地址；設置ARM指令複雜指令段的初始地址；設置使指令解碼器開始工作的標誌寄存器，高電平表示工作；判斷指令解碼是否結束，結束後向ARM核發送中斷；ARM核接收中斷信號後，將標誌寄存器置低，翻譯模塊結束本次工作。

本文的SoC系統中沒有使用DMA對X86指令和ARM指令進行存取，而是由翻譯模塊主動進行讀和寫。因而有2個Master總線接口，通過AHB _1_1interface讀取X86指令，由AHB_2_1 interface將ARM指令寫入RAM中。Communicate模塊與總線的通信接口為Slave口，用於接收ARM核發送的4個地址，一旦接收到這4個地址，翻譯模塊中的start_flag信號置高，表示開始工作。

3 片上總線結構

在ARM SoC體系結構中，有Master和Slave這兩個重要的概念。Master是ARM SoC體系結構中的主單元，他可以向總線發出請求並且對傳輸進行初始化，例如對存儲器進行讀／寫操作，典型的Master可以是CPU，DSP，DMA。Slave是ARM SoC體系結構中的從單元，典型的Slave為片上或者片外存儲器，它們都有自己惟一的地址範圍。Master發起讀／寫操作時，在初始化中會給出讀／寫操作的地址，而地址解碼器則根據這個地址決定哪個Slave被Master選中，然後相應的Slave做出相應。

在AHB系統中，若有2個Master常需要AccessBus，則系統的Performance必定會下降。為了解決這個問題。ARM提出了Multi-layer AHB，其基本構想是2個Master走不同的Bus去訪問Slave，如果訪問的Slave不同，則兩個Master可以同步的進行Transfer。若彼此訪問一個Slave，則根據優先級去判斷要先處理誰的Transfer。

該總線結構使用了Multi_layerbus switch(BusMatrix)模塊。AHB BusMatrix的設計可以分為3個部分：輸入級、解碼級和輸出級。圖3為該設計所使用的結構，其中，輸入和輸出的個數可以根據系統的Master和Slave靈活調整。

可以看出，每個Layer都有一個解碼器來決定Master要訪問哪一個Slave，通過多路選擇器實Master和Slave之間的Transfer。。每個Slave口都有自己的仲裁器，該仲裁器使用固定優先級，最高優先級的Layer可以優先訪問對應的Slave。

隨著系統中Master和Slave的增多，Busmatrix模塊的複雜度也會明顯增加，如果按照系統所有的Mas-ter和Slave的個數來確定輸入／輸出口的個數，Busma-trix將會非常複雜，因此對系統結構進行優化變得非常必要。根據系統工作情況可以發現，翻譯模塊的Slave埠僅被ARM7核訪問，即向翻譯模塊存取指令所需的地址，控制其工作，該Slave可以看作是ARM7核私有的，而不被其他Master訪問。有些Slave只有在特殊情況下才被訪問，因此可以將多個Slave看作一個Slave掛在BusMatrix上。優化後的SoC硬體架構如圖4所示。

4 結語

這裡給出了一種具有X86到ARM二進位翻譯和執行功能的SoC系統。利用Multi-layer bus SWitch(BusMatrix)模塊實現Multi-layer。總線結構，在多個核不訪問同一個Slave時，可以同時執行各自功能，有效提高系統的性能，且該總線結構的可擴展性強。同時根據系統工作的特點，對總線結構進行了優化，減小了總線的複雜度。

具有X86到ARM二進位翻譯的SoC系統設計

相關焦點

基於SoC的X86到ARM二進位翻譯和執行功能的系統設計

ARM首次成功模擬運行x86-ARM,二進位轉換器,模擬器,x86...

ARM架構和X86架構二者之間的區別是什麼

一文看懂arm架構和x86架構有什麼區別

Win10 ARM版如何運行x86程序?IT之家帶你一文讀懂

當年基於動態翻譯x86的企業倒閉了,龍芯為什麼還要堅持

Android逆向學習|對ARM指令的一次學習

一次搞定 Arm Linux 交叉編譯

gcc、arm-linux-gcc和arm-elf-gcc的關係?

ARM指令學習筆記

搞不清楚PowerPC、x86和ARM,別說你懂嵌入式!

將兩個 Crosswalk* Android* APK 文件提交到 Google Play Store*...

在 Linux 上分析二進位文件的 10 種方法

ARM vs x86 vs RISC-V,未來屬於誰?

如何實現二進位轉十進位的設計

性能大躍進幹翻x86!ARM Neoverse N1伺服器處理器搶先解析

基於AT89C51單片機的十進位計算器系統設計

十進位數的二進位編碼

6.4二進位的應用-現代計算機

為什麼我喜歡 ARM 和 PowerPC? | Linux 中國

具有X86到ARM二進位翻譯的SoC系統設計

相關焦點

基於SoC的X86到ARM二進位翻譯和執行功能的系統設計

ARM首次成功模擬運行x86-ARM,二進位轉換器,模擬器,x86...

ARM架構和X86架構二者之間的區別是什麼

一文看懂arm架構和x86架構有什麼區別

Win10 ARM版如何運行x86程序?IT之家帶你一文讀懂

當年基於動態翻譯x86的企業倒閉了,龍芯為什麼還要堅持

Android逆向學習|對ARM指令的一次學習

一次搞定 Arm Linux 交叉編譯

gcc、arm-linux-gcc和arm-elf-gcc的關係?

ARM指令學習筆記

搞不清楚PowerPC、x86和ARM,別說你懂嵌入式!

將兩個 Crosswalk* Android* APK 文件提交到 Google Play Store*...

在 Linux 上分析二進位文件的 10 種方法

ARM vs x86 vs RISC-V,未來屬於誰?

如何實現二進位轉十進位的設計

性能大躍進 幹翻x86!ARM Neoverse N1伺服器處理器搶先解析

基於AT89C51單片機的十進位計算器系統設計

十進位數的二進位編碼

6.4二進位的應用-現代計算機

為什麼我喜歡 ARM 和 PowerPC? | Linux 中國

性能大躍進幹翻x86!ARM Neoverse N1伺服器處理器搶先解析