数字逻辑与处理器基础大作业

单周期处理器

设计要求

完成一个单周期处理的控制器部分。达到实现MIPS指令集的一个子集，包括：

lw, sw, lui
add, addu, sub, subu, addi, addiu
and, or, xor, nor, andi, sll, srl, sra, slt, sltu, sltiu
beq, j, jal, jr, jalr

处理器结构

回答以下问题
1. 由RegDst信号控制的多路选择器，输入2对应常数31。这里的31代表31号寄存器$ra，在执行以下跳转指令时RegDst信号会置为2，因为跳转指令需保存跳转前的地址，便于在执行完子过程后恢复至原来的位置。
```
jal target
jalr rd, rs
```
2. 由ALUSrc1信号控制的多路选择器，输入1对应的指令[10-6]是移位运算的位移量，在执行以下三种移位指令时ALUSrc1信号会置为1，ALU从指令[10-6]段读取位移量再进行计算。
```
sll rd, rt, shamt
srl rd, rt, shamt
sra rd, rt, shamt
```
3. 由MemtoReg信号控制的多路选择器，输入2对应的是PC+4，执行以下跳转指令时MemtoReg信号会置为2，将PC+4存入寄存器便于以后恢复。
```
jal target
jalr rd, rs
```
4. 图中的处理器结构并没有Jump控制信号，取而代之的是PCSrc信号。PCSrc信号控制的多路选择器，输入2对应的是从寄存器读取的地址，并赋给PC，执行以下两种寄存器跳转指令时PCSrc信号会置为2，跳转至寄存器中的地址。
```
jr rs
jalr rd, rs
```
5. 利用ExtOp信号区分指令[15:0]是有符号型立即数（或地址偏移量）还是无符号型立即数。
```
# ExtOp = 1
lw rt, offset(rs)
sw rt, offset(rs)
addi rt, rs, imm
addiu rt, rs, imm
andi rt, rs, imm
slti rt, rs, imm
beq rs, rt, label

# ExtOp = 0
sltiu rt, rs, imm
```
6. 指令全为0时，当前处理器结构下等价于
```
sll $zero, $zero, 0
```
  即空指令功能，故无需更改处理器结构。
根据对各控制信号功能的理解，得如下真值表

完成控制器

阅读CPU.v，理解其实现方式。

module CPU(reset, clk);
    input reset, clk;

    reg [31:0] PC;
    wire [31:0] PC_next;
    always @(posedge reset or posedge clk)
	    if (reset)
		    PC <= 32'h00000000;
	    else
		    PC <= PC_next;

    wire [31:0] PC_plus_4;
    assign PC_plus_4 = PC + 32'd4;

    wire [31:0] Instruction;
    InstructionMemory instruction_memory1(.Address(PC), 
                                          .Instruction(Instruction));

    wire [1:0] RegDst;
    wire [1:0] PCSrc;
    wire Branch;
    wire MemRead;
    wire [1:0] MemtoReg;
    wire [3:0] ALUOp;
    wire ExtOp;
    wire LuOp;
    wire MemWrite;
    wire ALUSrc1;
    wire ALUSrc2;
    wire RegWrite;

    Control control1(
	    .OpCode(Instruction[31:26]), .Funct(Instruction[5:0]),
	    .PCSrc(PCSrc), .Branch(Branch), .RegWrite(RegWrite), .RegDst(RegDst), 
	    .MemRead(MemRead),	.MemWrite(MemWrite), .MemtoReg(MemtoReg),
	    .ALUSrc1(ALUSrc1), .ALUSrc2(ALUSrc2), .ExtOp(ExtOp), 
	    .LuOp(LuOp),	.ALUOp(ALUOp));

    wire [31:0] Databus1, Databus2, Databus3;
    wire [4:0] Write_register;
    assign Write_register = (RegDst == 2'b00)? Instruction[20:16]: 
                            (RegDst == 2'b01)? Instruction[15:11]: 5'b11111;
    RegisterFile register_file1(.reset(reset), .clk(clk), .RegWrite(RegWrite), 
	    .Read_register1(Instruction[25:21]), 
	    .Read_register2(Instruction[20:16]), .Write_register(Write_register),
	    .Write_data(Databus3), .Read_data1(Databus1), .Read_data2(Databus2));

    wire [31:0] Ext_out;
    assign Ext_out = {ExtOp? {16{Instruction[15]}}: 
                      16'h0000, Instruction[15:0]};

    wire [31:0] LU_out;
    assign LU_out = LuOp? {Instruction[15:0], 16'h0000}: Ext_out;

    wire [4:0] ALUCtl;
    wire Sign;
    ALUControl alu_control1(.ALUOp(ALUOp), .Funct(Instruction[5:0]), 
                            .ALUCtl(ALUCtl), .Sign(Sign));

    wire [31:0] ALU_in1;
    wire [31:0] ALU_in2;
    wire [31:0] ALU_out;
    wire Zero;
    assign ALU_in1 = ALUSrc1? {17'h00000, Instruction[10:6]}: Databus1;
    assign ALU_in2 = ALUSrc2? LU_out: Databus2;
    ALU alu1(.in1(ALU_in1), .in2(ALU_in2), .ALUCtl(ALUCtl),
             .Sign(Sign), .out(ALU_out), .zero(Zero));

    wire [31:0] Read_data;
    DataMemory data_memory1(.reset(reset), .clk(clk), .Address(ALU_out), 
                            .Write_data(Databus2), .Read_data(Read_data), 
                            .MemRead(MemRead), .MemWrite(MemWrite));
    assign Databus3 = (MemtoReg == 2'b00)? ALU_out: 
                      (MemtoReg == 2'b01)? Read_data: PC_plus_4;

    wire [31:0] Jump_target;
    assign Jump_target = {PC_plus_4[31:28], Instruction[25:0], 2'b00};

    wire [31:0] Branch_target;
    assign Branch_target = (Branch & Zero)? PC_plus_4 + {LU_out[29:0], 2'b00}: 
                           PC_plus_4;

    assign PC_next = (PCSrc == 2'b00)? Branch_target: 
                     (PCSrc == 2'b01)? Jump_target: Databus1;

endmodule

完成Control.v

    
module Control(OpCode, Funct,
    PCSrc, Branch, RegWrite, RegDst, 
    MemRead, MemWrite, MemtoReg, 
    ALUSrc1, ALUSrc2, ExtOp, LuOp, ALUOp);
    input [5:0] OpCode;
    input [5:0] Funct;
    output [1:0] PCSrc;
    output Branch;
    output RegWrite;
    output [1:0] RegDst;
    output MemRead;
    output MemWrite;
    output [1:0] MemtoReg;
    output ALUSrc1;
    output ALUSrc2;
    output ExtOp;
    output LuOp;
    output [3:0] ALUOp;

    // Your code below

    assign PCSrc = 
	    (OpCode == 6'h02 || OpCode == 6'h03)? 2'b01:
	    (OpCode == 6'h00 && (Funct == 6'h08 || Funct == 6'h09))? 2'b10:
	    2'b00;

    assign Branch = (OpCode == 6'h04)? 1: 0;

    assign RegWrite = 
	    (OpCode == 6'h2b || OpCode == 6'h04 || OpCode == 6'h02
		    || (OpCode == 6'h00 && Funct == 6'h08))? 0: 1;

    assign RegDst = 
	    (OpCode == 6'h03)? 2'b10:
	    (OpCode == 6'h23 || OpCode == 6'h0f || OpCode == 6'h08
		    || OpCode == 6'h09 || OpCode == 6'h0c || OpCode == 6'h0a
		    || OpCode == 6'h0b)? 2'b01: 
	    2'b00;

    assign MemRead = (OpCode == 6'h23)? 1: 0;

    assign MemWrite = (OpCode == 6'h2b)? 1: 0;

    assign MemtoReg = 
	    (OpCode == 6'h03 || (OpCode == 6'h00 && Funct == 6'h09))? 2'b10:
	    (OpCode == 6'h23)? 2'b01:
	    2'b00;

    assign ALUSrc1 = 
	    (OpCode == 6'h00 && (Funct == 6'h00 || Funct == 6'h02 
		    || Funct == 6'h03))? 1: 0;

    assign ALUSrc2 = 
	    (OpCode == 6'h23 || OpCode == 6'h2b || OpCode == 6'h0f
		    || OpCode == 6'h08 || OpCode == 6'h09 || OpCode == 6'h0c
		    || OpCode == 6'h0a || OpCode == 6'h0b)? 1: 0;

    assign ExtOp = (OpCode == 6'h0b)? 0: 1;

    assign LuOp = (OpCode == 6'h0f)? 1: 0;

    // Your code above

    assign ALUOp[2:0] = 
	    (OpCode == 6'h00)? 3'b010: 
	    (OpCode == 6'h04)? 3'b001: 
	    (OpCode == 6'h0c)? 3'b100: 
	    (OpCode == 6'h0a || OpCode == 6'h0b)? 3'b101: 
	    3'b000;
	
    assign ALUOp[3] = OpCode[0];

endmodule

阅读InstructionMemory.v，根据注释理解指令存储器中的程序。

    
module InstructionMemory(Address, Instruction);
    input [31:0] Address;
    output reg [31:0] Instruction;

    always @(*)
	    case (Address[9:2])
		    // addi $a0, $zero, 12345 #(0x3039)
		    8'd0:    Instruction <= {6'h08, 5'd0 , 5'd4 , 16'h3039};
		    // addiu $a1, $zero, -11215 #(0xd431)
		    8'd1:    Instruction <= {6'h09, 5'd0 , 5'd5 , 16'hd431};
		    // sll $a2, $a1, 16
		    8'd2:    Instruction <= {6'h00, 5'd0 , 5'd5 , 5'd6 , 5'd16 , 6'h00};
		    // sra $a3, $a2, 16
		    8'd3:    Instruction <= {6'h00, 5'd0 , 5'd6 , 5'd7 , 5'd16 , 6'h03};
		    // beq $a3, $a1, L1
		    8'd4:    Instruction <= {6'h04, 5'd7 , 5'd5 , 16'h0001};
		    // lui $a0, -11111 #(0xd499)
		    8'd5:    Instruction <= {6'h0f, 5'd0 , 5'd4 , 16'hd499};
		    // L1:
		    // add $t0, $a2, $a0
		    8'd6:    Instruction <= {6'h00, 5'd6 , 5'd4 , 5'd8 , 5'd0 , 6'h20};
		    // sra $t1, $t0, 8
		    8'd7:    Instruction <= {6'h00, 5'd0 , 5'd8 , 5'd9 , 5'd8 , 6'h03};
		    // addi $t2, $zero, -12345 #(0xcfc7)
		    8'd8:    Instruction <= {6'h08, 5'd0 , 5'd10, 16'hcfc7};
		    // slt $v0, $a0, $t2
		    8'd9:    Instruction <= {6'h00, 5'd4 , 5'd10 , 5'd2 , 5'd0 , 6'h2a};
		    // sltu $v1, $a0, $t2
		    8'd10:   Instruction <= {6'h00, 5'd4 , 5'd10 , 5'd3 , 5'd0 , 6'h2b};
		    // Loop:
		    // j Loop
		    8'd11:   Instruction <= {6'h02, 26'd11};
		
		    default: Instruction <= 32'h00000000;
	    endcase
	
endmodule

MIPS Assembly

    addi $a0, $zero, 12345
    addiu $a1, $zero, -11215
    sll $a2, $a1, 16
    sra $a3, $a2, 16
    beq $a3, $a1, L1
    lui $a0, -11111
L1:
    add $t0, $a2, $a0
    sra $t1, $t0, 8
    addi $t2, $zero, -12345
    slt $v0, $a0, $t2
    sltu $v1, $a0, $t2
Loop:
    j Loop

这段程序执行足够长时间后会陷入死循环，保持程序不结束。

此时各寄存器的值为

寄存器	值	备注
$a0	0x00003039	0: a0 = 0x0 + 0x3039
$a1	0xffffd431	1: a1 = 0x0 + 0xffffd431(按符号位扩展，不抛出溢出异常)
$a2	0xd4310000	2: a2 = a1 << 16
$a3	0xffffd431	3: a3 = a2 >> 16(高位补符号位)
/	/	4: jump to L1 if (a1 == a3)
$t0	0xd4313039	6: t0 = a2 + a0
$t1	0xffd43130	7: t1 = t0 >> 8(高位补符号位)
$t2	0xffffcfc7	8: t2 = 0x0 + 0xffffcfc7
$v0	0x00000000	9: v0 = (a0(12345) < t2(-12345)) ? 1 : 0
$v1	0x00000001	10: v1 = (a0(12345) < t2(4294954951)) ? 1 : 0

已知某一时刻在某寄存器中存放着数0xffffcfc7，无法判断出它是有符号数还是无符号数。因为除了符号扩展可以产生形如0xffffcfc7这样的有符号数数外，利用lui和addi等操作也可以产生这样的无符号数，故无法单纯地由寄存器的值判断它是有符号数还是无符号数，必须结合具体的指令控制信号。

仿真

PC的变化：在每个时钟上升沿，PC <= PC_next，通常情况下PC + 4，遇到beq指令则PC根据beq指令中的偏移量在当前PC基础上作相应变化。
Branch在400~500ns时为1，由于beq指令中offset == 1，故PC_next在PC_plus_4的基础上又增加了4，即PC增加了8。
100~~200ns之间，PC == 4，对应的指令是addiu $a1, $zero, -11215，此时$a1 == 0；200~~300ns期间$a1 == 0xffffd431，因为写寄存器操作发生在时钟上升沿。下一条指令立即用到$a1也不会出现错误，因为下一条指令到来的时钟上升沿，数据已写入寄存器，再读取读到的是正确的数据。
运行足够长时间后，各寄存器的值如下表

寄存器值

$a0 0x00003039

$a1 0xffffd431

$a2 0xd4310000

$a3 0xffffd431

$t0 0xd4313039

$t1 0xffd43130

$t2 0xffffcfc7

$v0 0x00000000

$v1 0x00000001

与预期结果相同。

寄存器	值
$a0	0x00003039
$a1	0xffffd431
$a2	0xd4310000
$a3	0xffffd431
$t0	0xd4313039
$t1	0xffd43130
$t2	0xffffcfc7
$v0	0x00000000
$v1	0x00000001

执行汇编程序

    addi $a0, $zero, 3 	    # a0 = 0 + 3
    jal sum			        # jump to Label: 'sum'
Loop:
    beq $zero, $zero, Loop	# if (0 == 0) jump to Label: 'Loop'
sum:
    addi $sp, $sp, -8		# sp -= 8
    sw $ra, 4($sp)			# sp[1] = ra
    sw $a0, 0($sp)			# sp[0] = a0
    slti $t0, $a0, 1		# t0 = (a0 < 1) ? 1 : 0
    beq $t0, $zero, L1		# if (t0 == 0) jump to Label: 'L1'
    xor $v0, $zero, $zero	# v0 = 0 ^ 0 = 0
    addi $sp, $sp, 8		# sp += 8
    jr $ra					# jump to Register: $ra
L1:
    addi $a0, $a0, -1		# a0 -= 1
    jal sum				    # jump and link Label: 'sum'
    lw $a0, 0($sp)			# a0 = sp[0]
    lw $ra, 4($sp)			# ra = sp[1]
    addi $sp, $sp, 8		# sp += 8
    add $v0, $a0, $v0		# v0 += a0
    jr $ra					# jump to Register: $ra

该汇编程序的功能等价于以下C++程序
```
int sum(int n){
    if (n < 1)
        return 0;
    else
        return n + sum(n-1);
}

int main(void){
    int n = 3;
    sum(n);
    while (1)
        ;
    return 0;
}
```
- 即实现了求1+2+...+n的功能(并保持程序不终止)。
- Loop死循环保持程序不终止。
- sum计算边界条件(n==0)下的返回值，保存$ra,$a0，非边界条件跳转到L1。
- L1调用子过程sum(n-1)，调用完毕，返回n+sum(n-1)。

汇编程序->机器码

指令存储器

地址	指令
0x00400000	addi $a0, $zero, 3
0x00400004	jal sum
0x00400008	beq $zero, $zero, Loop
0x0040000c	addi $sp, $sp, -8
0x00400010	sw $ra, 4($sp)
0x00400014	sw $a0, 0($sp)
0x00400018	slti $t0, $a0, 1
0x0040001c	beq $t0, $zero, L1
0x00400020	xor $v0, $zero, $zero
0x00400024	addi $sp, $sp, 8
0x00400028	jr $ra
0x0040002c	addi $a0, $a0, -1
0x00400030	jal sum
0x00400034	lw $a0, 0($sp)
0x00400048	lw $ra, 4($sp)
0x0040004c	addi $sp, $sp, 8
0x00400050	add $v0, $a0, $v0
0x00400054	jr $ra

机器码 (指令存储器地址从0x00400000开始)

0x20040003
0x0c100003
0x1000ffff
0x23bdfff8
0xafbf0004
0xafa40000
0x28880001
0x11000003
0x00001026
0x23bd0008
0x03e00008
0x2084ffff
0x0c100003
0x8fa40000
0x8fbf0004
0x23bd0008
0x00821020
0x03e00008

beq跳转到Loop标签时，偏移量offset = 0xffff为-1，翻译为机器码即为0x1000ffff
beq跳转到L1标签时，偏移量offset = 0x0003为3，翻译为机器码即为0x11000003
jal直接跳转到指令地址，根据指令存储器，sum地址为0x0040000c，翻译为机器码即为0x0c100003
立即数-1和-8分别被翻译成0xffff和0xfff8。

修改InstructionMemory.v如下

    
module InstructionMemory(Address, Instruction);
    input [31:0] Address;
    output reg [31:0] Instruction;

    always @(*)
	    case (Address[9:2])
		    // addi $a0, $zero, 3
		    8'd0:    Instruction <= 32'h20040003;
		    // jal sum
		    8'd1:    Instruction <= 32'h0c100003;
		    // Loop:
		    // beq $zero, $zero, Loop
		    8'd2:    Instruction <= 32'h1000ffff;
		    // sum:
		    // addi $sp, $sp, -8
		    8'd3:    Instruction <= 32'h23bdfff8;
		    // sw $ra, 4($sp)
		    8'd4:    Instruction <= 32'hafbf0004;
		    // sw $a0, 0($sp)
		    8'd5:    Instruction <= 32'hafa40000;
		    // slti $t0, $a0, 1
		    8'd6:    Instruction <= 32'h28880001;
		    // beq $t0, $zero, L1
		    8'd7:    Instruction <= 32'h11000003;
		    // xor $v0, $zero, $zero
		    8'd8:    Instruction <= 32'h00001026;
		    // addi $sp, $sp, 8
		    8'd9:    Instruction <= 32'h23bd0008;
		    // jr $ra
		    8'd10:   Instruction <= 32'h03e00008;
		    // L1:
		    // addi $a0, $a0, -1
		    8'd11:   Instruction <= 32'h2084ffff;
		    // jal sum
		    8'd12:   Instruction <= 32'h0c100003;
		    // lw $a0, 0($sp)
		    8'd13:   Instruction <= 32'h8fa40000;
		    // lw $ra, 4($sp)
		    8'd14:   Instruction <= 32'h8fbf0004;
		    // addi $sp, $sp, 8
		    8'd15:   Instruction <= 32'h23bd0008;
		    // add $v0, $a0, $v0
		    8'd16:   Instruction <= 32'h00821020;
		    // jr $ra
		    8'd17:   Instruction <= 32'h03e00008;
		
		    default: Instruction <= 32'h00000000;
	    endcase
	
endmodule

仿真

运行足够长时间后，寄存器$a0 == 3,$v0 == 6，与预期结果相符。
PC: 这里默认从0x0开始取指令，与之前假设指令存储器地址从0x00400000开始有冲突，不过不影响最终结果。PC从0开始以4的倍数为单位增加，中途经历几次跳转，最终进入死循环，值为0x8。
$a0: 变化过程3 -> 2 -> 1 -> 0 -> 1 -> 2 -> 3，体现了子过程的调用以及从堆栈中恢复数据的过程。
$v0: 变化过程0 -> 1 -> 3 -> 6，子过程返回的值叠加到$v0产生的结果。
$sp: 变化过程0 -> -8 -> -16 -> -8 -> -16 -> -8 -> -16 -> -8 -> 0，体现了子过程不断在堆栈顶端存取数据的过程，最终$sp恢复为最初的值。
$ra: 变化过程0x0 -> 0x8 -> 0x00400034 -> 0x8，这里地址的变化较大的原因与PC相同，不影响最终结果，体现了子过程的调用与返回。

nuullll / cpu Goto Github PK

cpu's Introduction

数字逻辑与处理器基础大作业

单周期处理器

设计要求

处理器结构

完成控制器

执行汇编程序

cpu's People

Contributors

Stargazers

Watchers

Forkers

cpu's Issues

RegDst value error

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent