基於FPGA的RISC微處理器的設計與實現

2020-12-27 電子產品世界
摘要:基於FPGA和電子設計自動化技術,採用模塊化設計的方法和VHDL語言,設計一個基於FPGARISC微處理器。該微處理器主要由控制器、運算器和寄存器組成,具有指令控制、操作控制、時間控制和數據加工等基本功能,其指令長度為16位定長,採用立即尋址和直接尋址兩種方式。仿真結果表明,基於FPGARISC微處理器的時鐘頻率為23.02MHz,且功能完全達到設計要求。
關鍵詞:RISC微處理器;電子設計自動化;現場可編程門陣列;VHDL語言

20世紀80年代初興起的RISC技術一直是計算機發展的主流,RISC微處理器的一些基本理論則是計算機領域的重要基礎常識,但具體實現仍有難度。電子設計自動化(Electronic Design Automation,簡稱EDA)是現代電子設計的核心技術。利用EDA技術進行電子系統設計的主要目標是完成專用集成電路(ASIC)的設計,而現場可編程門陣列(FPGA)和複雜可編程邏輯器件(CPLD)是實現這一途徑的主流器件。現場可編程通用門陣列(Field Program mableGateArray,簡稱FPGA)的內部具有豐富的可編程資源。FPGA外部連線很少、電路簡單、便於控制。FPGA目前已達千萬門標記(10million-gatemark),速度可達200~400MHz。本文介紹了一種基於FPGA技術用VHDL(VHSICHardw are Description Language)語言實現的8位RISC微處理器,並給出了仿真綜合結果。

微處理器功能、組成及指令集

本文設計的RISC微處理器遵循了RISC機器的一般原則:指令條數少而高效、指令長度固定、尋址方式不超過兩種、大量採用寄存器、為提高指令執行速度、指令的解釋採用硬聯線控制等等。

RISC微處理器的功能和組成
微處理器是整個計算機系統的核心,它具有如下基本功能:指令控制、操作控制、時間控制、數據加工。本文設計的微處理器主要由控制器、運算器和寄存器組成,還包括程序計數器、解碼器等一些其他的必要邏輯部件。控制器是發布命令的「決策機構」,即完成協調和指揮整個計算機系統的操作。相對於控制器而言,運算器接受控制器的命令而進行動作,即運算器所進行的全部操作都是由控制器發出的控制信號來指揮的,所以它是執行部件。存儲器是記憶設備,存儲單元長度是8位,用來存放程序和數據。

微處理器的指令集
微處理器的指令長度為16位定長,每條指令佔兩個存儲單元,尋址方式僅有立即尋址、直接尋址兩種。該RISC微處理器選取了使用頻度較高的8種指令LDA、STO、JMP、ADD、AND、XOR、SKZ、HLT等。指令操作碼佔用指令字的高4位,預留了空間,便於以後指令集的擴展。指令周期是由8個時鐘組成,每個時鐘都要完成固定的操作。部分典型指令的操作流程圖如圖1所示。


圖1 部分指令操作流程

關鍵模塊的設計
RISC微處理器是一個複雜的數字邏輯電路,但其基本部件的邏輯並不複雜,可以把它分為時鐘產生器、指令寄存器、累加器、算術邏輯單元、數據控制器、狀態控制器、程序計數器、地址多路器等單元來考慮。在硬體驗證時還需要建立一些如ROM/RAM和地址解碼器等必要的外圍器件。以下是幾個關鍵模塊的設計。

時鐘產生器的設計


圖2 時鐘產生器電路的設計

時鐘產生器Pulse產生的電路如圖2所示,計算機的協調動作需要時間標誌,它用時序信號體現,時鐘產生器正是產生這些時序信號的器件。圖2中時鐘產生器利用外來時鐘信號clk產生一系列時鐘信號clk1,fetch,aluclk等,並送往微處理器的其他部件。rst控制著微處理器的復位和啟動操作,當rst一進入高電平,微處理器就結束現行操作,並且只要rst停留在高電平狀態,微處理器就維持復位狀態。rst回到低電平後在接著到來的fetch上升沿啟動微處理器開始工作。

由於時鐘產生器對微處理器各種操作實施時間上的控制,所以其性能好壞從根本上決定了整個微處理器的運行質量。本設計採用的同步狀態機的設計方法,使得clk1,fetch,alu_clk在跳變時間同步性能上有顯著提升,為整個系統性能的提高打下良好的基礎。

狀態控制器的設計
狀態控制器的電路圖如圖3所示。從實現的途徑看,RISC微處理器與一般的微處理器的不同之處在於,它的時序控制信號的形成部件是用硬布線邏輯實現而不是採用微程序控制。由於器件本身設計比較複雜,且對各個控制信號的時序有嚴格要求,所以其VHDL程序用有限狀態機FSM來實現。


圖3 狀態控制器電路

結構體程序如下:
  architecturertlofstatctlis
  typemystateis(st0,st1,st2,st3,st4,st5,st6,st7);
  signalcurstate:mystate;
  begin
  process(clk1,ena)
  begin
  iffallingedge(clk1) then
  if(ena=』0』)then
    curstate=st0; incpc=』0』; 
  load_acc=』0』; loadpc=』0』; 
  rd=』0』; wr=』0』; loadir=』0』; 
 datactlena=』0』; halt=』0』;
   else
    case curstate is
     when st0 =>......
     when st1 =>......
     when st2 =>......
     when st3 =>cur_state=st4;
     if(opcode=hlt)then......
           else......
      whenst4=>curstate=st5;
     if(opcode=jmp)then......
     elsif(opcode=addoropcode=ann
oropcode=xoooropcode=lda)then
     elsif(opcode=sto)then...else...
     when st5 =>curstate=st6;
     if(opcode=addoropcode=annor
  opcode=xoooropcode=lda) 
 then......
     elsif(opcode=skzandzero=』1』)
  then......
     elsif(opcode=jmp) then......
     elsif(opcode=sto) then......
     else......
     when st6 =>curstate=st7;
     if(opcode=sto)then......
    elsif(opcode=addoropcode=ann
 oropcode=xoooropcode=lda) 
 then......
    else......
   when st7 =>curstate=st0;
   if(opcode=skzandzero=』1』)then......
    else......
   when others=>......
     endcase;
     endif;
   endif;
   endprocess;
  endrtl;

算術邏輯單元ALU的設計
ALU是絕大多數指令必須經過的單元,所有的運算都在算術邏輯單元ALU進行。ALU接受指令寄存器IR送來的4位指令操作碼,根據不同的指令,ALU在信號alu_clk的正跳變沿觸發下完成各種算術邏輯運算。微處理器各部件結構如圖4所示。

軟體綜合與仿真和硬體實現

微處理器的軟體綜合與仿真
該微處理器設計共有11個基本模塊,除前文分析的3個模塊外,還有指令寄存器IR、累加器ACC、程序計數器PC、簡單的存儲器ROM/RAM、地址多路器ADDR等模塊。所有的模塊採用Quartus4.2單獨綜合,並調試通過,且都生成有單獨的*.bsf文件,最後創建一個頂層文件top.bdf,把所有基本模塊的bsf文件連接成如圖4的形式。做完頂層設計後,採用Quartus4.2進行綜合與仿真。系統仿真的部分結果如圖5所示,從圖5可以看出,存放在存儲器不同地址中的2個操作數3CH(00111100)和18H(00011000)相異或時,結果24H(00100100)在信號wr的上升沿觸發下存入存儲器中。我們可清楚地看到每條指令都是在一個指令周期中完成。數據總線data上記錄著指令的運行情況,同時也可看到空閒時其呈高阻狀態。


圖4 微處理器各部件的結構


圖5 仿真波形

主要的程序如下:
地址 機器代碼 彙編語言源程序
  00 11000000 JMP L1 ;L1->PC
  01 00000100
  04 10100000 LDA R2 ;(0E)->R2
 05 00001110
 06 10000000 XORR1,R2;(R1)xor(R2)- >(R1)
 07 00001111
  08 11000001 STO   ;(R1)->(0F)
  0A 00000000 HLT   ;stop
  0B 00000000
  0E 00111100
 0F 00011000

微處理器的硬體實現
基於FPGA的RISC微處理器的最終硬體驗證在杭州康芯公司生產的GW48EDA系統上進行。前面的仿真結果確認無誤後,選用GW48EDA系統的電路模式No.5,查閱此系統的引腳對照表鎖定各引腳,之後需重新編譯一次,以便把引腳鎖定信息編譯進編程下載文件。最後把編譯好的top.sof文件對目標器件FPGA下載,得到滿足設計要求的晶片。本設計的載體選用Altera公司的Cyclone系列FPGA器件EP1C6Q240C6,硬體驗證結果表明,該RISC微處理器時鐘頻率為23.02MHz,其功能完全達到設計要求。

結束語

本文基於FPGA的微處理器具備了RISC微處理器的基本功能,而且其容易優化升級。該微處理器不僅可作為一個模塊用於片上系統的設計,而且也充分展示了使用FPGA和VHDL進行EDA數字系統設計的優越性,具有實用價值。

相關焦點

  • 用matlab來實現fpga功能的設計
    首先,DSP開發人員不熟悉硬體設計,尤其是FPGA。他們使用Matlab驗證算法,運用C語言或彙編語言編程,通常不會使用硬體描述語言(VHDL或Verilog)實現數字設計。其次,雖然VHDL語言也提供了許多高層次的語言抽象,但是基於並行硬體系統的VHDL程序設計與基於微處理器的串行程序設計有很大的不同。
  • 基於JTAG接口實現ARM的FPGA在線配置
    SDR終端的實現往往都是基於可重配置的硬體環境,如現場可編程邏輯陣列(Field Programmable Gate Array,FPGA)、數位訊號處理器(Digital Signal Processor,DSP),而不是專用集成電路(Application Specific Integrated Circuit,ASIC)等特定的硬體電路和晶片。
  • 基於CORDIC 2FSK調製器的FPGA設計
    提出一種基於流水線CORDIC算法的2FSK調製器的FPGA實現方案,可有效地節省FPGA的硬體資源,提高運算速度。最後,給出該方案的硬體測試結果,驗證了設計的正確性。0 引言 頻移鍵控(FSK)是用不同頻率的載波來傳送數位訊號,並用數字基帶信號控制載波信號的頻率。
  • 3G系統中AGC的FPGA設計實現
    agc增益控制算法在數字部分來實現,在本設計中,agc電路可以有效提高鏈路的動態範圍(+25~-105 dBm),提高ADC輸出的SNR,以使DSP能更容易地實現Dw-PTS同步。agc在系統中的位置如圖1虛線框所示:    3 agc系統的fpga實現    根據agc所實現的功能  ,在fpga中將agc模塊分為如下幾個部分來實現:  3.1 數據幹路模塊    從RSP接口來10位二進位補碼數據I1和Q1,與求指數模塊傳送來的預放大增益
  • 基於FPGA的帶Cache的嵌入式CPU的設計與實現
    為了提高CPU的效率和指令執行的並行性,現代微處理器廣泛採用流水線設計,所以,CPU流水線的設計成為決定其性能的關鍵。MIPS(Microprocessor without Interlocked Pipeline STages)是一種典型的RISC(Reduced InstructiON Set Computer)微處理器,在嵌入式系統領域中得到廣泛的應用。
  • 基於FPGA的m序列信號發生器設計
    基於FPGA與Verilog硬體描述語言設計井實現了一種數據率按步進可調、低數據誤碼率、反饋多項式為本文引用地址:http://www.eepw.com.cn/article/263588.htm    1 m序列信號發生器的組成  基於FPGA的m序列信號發生器硬體結構極其簡單,僅需兩個獨立按鍵(一個是復位按鍵與另一個控制數據率切換按鍵)、一個48 MHz的用於提供系統時鐘有源晶振、系統電源、一塊配置晶片、幾個簡單的電阻與電容即可實現。
  • 基於FPGA的RS232行列式矩陣鍵盤接口設計
    一、引言本文引用地址:http://www.eepw.com.cn/article/245960.htm本方案是用VHDL語言來實現的基於RS232按位串行通信總線的行列式矩陣鍵盤接口電路
  • 基於FPGA的任意分頻器設計
    儘管目前在大部分設計中還廣泛使用集成鎖相環(如Altera的PLL,Xilinx的DLL)來進行時鐘的分頻、倍頻以及相移設計,但是,對於時鐘要求不太嚴格的設計,通過自主設計進行時鐘分頻的實現方法仍然非常流行。首先這種方法可以節省鎖相環資源,再者這種方式只消耗不多的邏輯單元就可以達到對時鐘的操作目的。
  • 基於FPGA的實時中值濾波器硬體實現
    在許多實際應用場合,如高清視頻監控、X光圖像的降噪等,需要快速且實時地進行中值濾波,軟體實現達不到實時處理的要求,因此選用硬體實現。 在硬體實現上,文獻[1]、[2]等採用行延遲的方法形成鄰域數據,以實現3×3的中值濾波。文獻[7]為了提高紅外成像跟蹤器設計了大窗口的中值濾波器。
  • 一種基於FPGA的視頻邊緣檢測系統設計
    摘要:對於視頻圖像檢測與識別的需要,提出了一種基於FPGA的視頻邊緣檢測系統設計方案,並完成系統的硬體設計。通過FPGA控制攝像頭進行視頻採集,雙埠SDRAM對圖像數據進行緩存,FPGA再對數據進行實時處理。
  • 基於FPGA的高速流水線浮點乘法器設計與實現
    作為衡量微處理器 性能的主要標準,主頻和乘法器運行一次乘法的周期息息相關。因此,為了進一步提高微處 理器性能,開發高速高精度的乘法器勢在必行。同時由於基於IEEE754 標準的浮點運算具 有動態範圍大,可實現高精度,運算規律較定點運算更為簡捷等特點,浮點運算單元的設計 研究已獲得廣泛的重視。
  • FPGA是什麼
    與傳統邏輯電路和門陣列(如PAL,GAL及CPLD器件)相比,FPGA具有不同的結構,FPGA利用小型查找表(16×1RAM)來實現組合邏輯,每個查找表連接到一個D觸發器的輸入端,觸發器再來驅動其他邏輯電路或驅動I/O,由此構成了既可實現組合邏輯功能又可實現時序邏輯功能的基本邏輯單元模塊,這些模塊間利用金屬連線互相連接或連接到I/O模塊。
  • 基於FPGA的DisplayPort設計與實現
    在顯示市場上,VESA 通過DisplayPort 引領著從 VGA、DVI 以及HDMI 等協議成功升級至高速串行收發器、基於包的層架構協議。與並行協議不同,串行分組協議在實現和維持連接或鏈路方面要多一層複雜性。在 VESA DisplayPort 1.1a 規範中,控制功能被劃分為 Link Policy Maker 和 Stream Policy Maker。
  • 基於小蜜蜂家族GW1NS系列GW1NS-2 FPGA-SoC晶片的軟硬體設計一體化...
    高雲半導體軟硬體設計一體化開發平臺,是基於GW1NS-2 FPGA-SoC 所提供的多種固定或可配置的設備模型庫以及與設備相匹配的軟體驅動器庫,使硬體設計工具與軟體設計工具相結合,從而支持GW1NS-2 FPGA-SoC的硬體架構設計和內嵌微處理器的軟體編譯/並接/查錯(Compile、Link、In-Circuit-Emulation/Debug)等功能;並支持ARM-MDK 與GNU
  • 基於Modelsim FLI接口的FPGA仿真技術
    1、Modelsim 及 FLI接口介紹本文引用地址:http://www.eepw.com.cn/article/273718.htm  Modelsim是 Model Technology(Mentor Graphics的子公司)的 HDL 硬體描述語言仿真軟體,可以實現
  • 基於FPGA的TS over IP的設計與實現
    編者按:隨著網際網路的發展, 數位電視信號的網絡傳輸得到了越來越多的關注,本文設計與實現了一種基於FPGA和MCU(R8051XC2)的TS over IP系統,並對傳統的TS over IP系統進行了改進。
  • 基於FPGA的自然對數變換器的設計與實現
    引言  在需要硬體實現對數運算的場合[1],其精度和速度是必須考慮的問題。目前硬體實現對數變換的方法主要有查表法、泰勒公式展開法和線性近似法。查表法[2]所需要的存儲單元隨著精度的增加或輸入值範圍的增大而成指數增加;泰勒公式展開法[3]需要乘法器,面積大不易實現;線性近似法[4]的精度有限,且需要誤差校正電路,實現較難。
  • 瑞薩電子推出首款基於ARM Cortex-A處理器的mbed微處理器開發板
    瑞薩利用RZ/A1微處理器產品開發出全球首個基於ARM Cortex-A9處理器的mbed微處理器開發板,該產品將方便互聯設備設計人員更快地開發出高性能、高功能型嵌入式系統產品。  "不斷發展的物聯網時代下的設計環境瞬息萬變,為了保持領先地位,開發者必須保持靈活性和創造力。
  • 基於FPGA的可擴展高速FFT處理器的設計與實現
    摘 要:本文提出了基於FPGA實現傅立葉變換點數可靈活擴展的流水線FFT處理器的結構設計以及各功能模塊的算法實現特別是多級流水線處理的FFT結構使得基於FPGA器件的FFT處理器完成不同點數的FFT計算時可以通過增減模塊級數很容易地實現。
  • 基於FPGA的搶答器設計與實現
    I/O 口不足的情況;本設計採用FPGA 來做增強了時序控制的靈活性,同時由於FPGA 的I/O 埠資源豐富,可以在本設計基礎上稍加修改可以設計具有多組輸入的搶答器。(注各組初始成績為10 分)  設計架構  本文以FPGA 為基礎設計的電子搶答器,根據設計功能要求,改設計主要包括搶答輸入鍵盤,數碼管顯示,報警及FPGA 最小系統。搶答器結構簡圖如圖1所示。