当前位置:文档之家› 体系结构作业解题参考

体系结构作业解题参考

体系结构作业解题参考
体系结构作业解题参考

体系结构作业解题参考

第1章习题

6.某处理机时钟频率为f =30MHz ,处理速度为20MIPS ,用它来执行一个已知混合程序。假定每次存储器访问延迟时间为1个时钟周期。问: ⑴ 此处理机的有效CPI 是多少?

⑵ 假定新处理机的时钟频率f 提高到60MHz ,但存储子系统速率不变。这样,每次存储器访问需2个时钟周期。如果30%的指令每条只需要1次访存,而另外5%指令每条需2次访存,且假定已知混合程序的指令数不变,并与原处理机兼容,请定量分析改进后的新处理机性能。 解:⑴ 由

6

10?=

CPI f

MIPS 得

5.110

20103010666

=??=?=

MIPS f CPI ⑵ 设已知混合程序的总指令执行数为IC ,则改进前程序执行所需的总时钟周期数NC O 为

IC IC CPI NC o 5.1=?=

而改进后的混合程序的指令数不变,且每次访存需增加1个时钟周期,故改进后程序执行所需的总时钟周期数NC n 为

IC

IC IC IC IC NC NC o n 9.14.05.1205.013.0=+=?+?+= 所以,改进后,处理机的有效CPI 为

9

.19.1===IC

IC

IC NC CPI n n 故改进后的处理机速度为

58.3110

9.11060106

6

6≈??=?=n n n CPI f MIPS

第2章习题

6.一条线性流水线有4个流水段,每个流水段的延迟时间都为△t 。开始5个 △t ,每间隔一个△t 向流水线输入一个任务,然后停顿2个△t ,如此重复。 ⑴ 画出流水线的时空图。

⑵ 求流水线的实际吞吐率、加速比和效率。 解:⑴ 时空图如下:

⑵ 设流入流水线的任务总数为n ,若以5个任务为一组,则共可分为??

?

???5n 组。

由于两组任务之间间隔2个时钟周期,所以完成n 个任务的总时间为

()t

n n t

n t n T k ???

? ??????

???++=????

?

??-??????+?-+=25121514

所以有

t

n n n

T n P k ????

?

????????++=251=吞吐率 ,

25125242512154???????++????

???+-=???

? ?????????++????? ??-??????+?=n n n n t n n t n t n S 加速比 , 25125144???????++=???? ?

????????++?=

n n n

t n n t n E 效率 。

7.用一条5个流水段的浮点加法流水线计算∑==10

1

i i A F 。每个流水段的延迟时

间均相等,流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。要求用尽可能短的时间完成计算,画出流水线时空图,计算流水线的P 、S 、E 值。

解:流水线时空图如下

由时空图可知,完成全部计算共用了21△t ,共执行了9次加法运算。所以

t

t T n P k ?=?==

73219 , 7

152195=???==t t T T S k o ,

7

351715=?==

k S E 。

10.在一台流水线处理机上执行下面程序。每条指令都要经过“取指”、“译码”、“执行”、“写结果”4 个流水段,每个流水段延迟时间都是5ns 。但在“执行”流水段LS 部件和ALU 部件只能其中一个工作,其中LS 部件完成LOAD 和STORE 操作,ALU 部件完成其它操作。这两个操作部件的输出端和输入端有直接输出通路相互切换连接,且ALU 部件产生的条件码也能直接送入控制器。 I1 SUB R0,R0 I2 LOAD R1,#8 I3 LOOP:LOAD R2,A(R1) I4 MUL R2,R1 I5 ADD R0,R2 I6 DNE R1 LOOP I7 STORE R0,M(X)

假定采用静态分支预测技术,每次都预测转移不成功。要求:

⑴ 画出指令流水线的时空图。

⑵ 计算流水线的吞吐率和加速比,并分别计算译码部件和ALU 部件的使用

效率。

解:⑴ 时空图如下:

⑵ ()秒任务吞吐率/10644.118105593559356

9

?≈??=?==-s t T n P k , 373.259354≈???==

t

t T T S k o 加速比 , %831.14594351≈????=

t

t

E ID ,

()%593.105948311≈????+?=

t

t

E ALU 。

第3章习题

7.第6题中假设所有运算型指令都在译码(ID)段读寄存器,在写结果(WB)段写寄存器,采用顺序发射顺序完成的调度策略。

⑴画出流水线执行指令序列的时空图。

⑵计算执行这个程序所用的时间。

I1 LOAD R0,M(A)

I2 ADD R1,R0

I3 LOAD R2,M(B)

I4 MUL R3,R4

I5 AND R4,R5

I6 ADD R2,R5

解:⑴

⑵执行时间=10ns×11=110ns .

8.第6题中假设所有运算型指令都在译码(ID)段读寄存器,在写结果(WB)段写寄存器,采用顺序发射乱序完成的调度策略。

⑴画出流水线执行指令序列的时空图。

⑵计算执行这个程序所用的时间。

解:⑴

⑵执行时间=10ns×10=100ns .

9.第6题中假设每个操作部件的输出端都有直接数据通路与输入端相连,采用顺序发射乱序完成的调度策略。

⑴画出流水线执行指令序列的时空图。

⑵计算执行这个程序所用的时间。

解:⑴

⑵执行时间=10ns×8=80ns .

11.解:两种静态指令调整方案的时空图如下:

第4章习题

3.解:⑴向量链接图如下

⑵ T=(1+7+1)+(1+3+1)+(1+4+1)+(1+2+1)+(64-1)=87(拍)。

⑶流过时间=1+7+1+1+3+1+1+4+1+1+2+1=24(拍)。

4.解:⑴第1、2两条指令并行执行,然后与第3条指令链接,第4条指令顺序执行。

⑵ T=[(1+6+1)+(1+7+1)+(32-1)]+[(1+6+1)+(32-1)]=87(拍)。

5.⑴ V0←存储器

V1←V2+V3

V4←V5*V6

3条指令全并行执行,总时间为

T=(1+7+1)+(32-1)=40(拍)

⑵ V2←V0*V1

V3←存储器

V4←V2+V3

第1、2条指令并行执行,第3条指令顺序执行。总时间为

T=[(1+7+1)+(32-1)]+[(1+6+1)+(32-1)]=79(拍)

⑷ V0←存储器

V1←1/V0

V3←V1+V2

V5←V3*V4

4条指令全部链接执行。总时间为

T=(1+6+1)+(1+14+1)+(1+6+1)+(1+7+1)+(32-1)=72

⑸ V0←存储器

V1←V2+V3

V4←V5*V6

S0←S1+S2

4条指令全部并行执行。总时间为

T=(1+7+1)+(32-1)=40(拍)

⑹ V3←存储器

V2←V0+V1

V3←V2*V1

V5←V3*V4

第1、2条指令并行执行,第3、4条指令均顺序执行。总时间为

T=[(1+6+1)+(32-1)]+[(1+7+1)+(32-1)]+[(1+7+1)+(32-1)]=119

7.某机有16个向量寄存器,其中V0—V5分别放有A、B、C、D、E、F,向量长度均为32,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。采用链接技术,先计算

(A+B)*C,在流水线不停顿的情况下,接着计算(D+E)*F。

⑴设寄存器入/出各需1拍,此链接流水线的流过时间为多少拍?

⑵假设每拍为50ns,完成这些计算并把结果存入相应寄存器,此部件的实际吞吐率是多少MFLOPS?

解:写出向量操作序列如下:

V6←V0+V1

V7←V6*V2

V8←V3+V4

V9←V8*V5

显然可将第1、2两条指令链接,第3、4两条指令链接;且第2组操作紧随第1组操作流入流水线,使流水线不停顿。

⑴流过时间=1+2+1+1+3+1=9(拍)。

⑵ 总时间T=[(1+2+1)+(1+3+1)+(64-1)]* 50ns =3600ns , 完成的浮点运算总次数N=2*64=128,所以,该部件的实际吞吐率为

MFLOPS s

T N P 56.351036001289

=?==-

8.在某向量机上计算D=A*(B+C ),设A 、B 、C 均为长度为128的向量,并已存放在相应寄存器中,都利用浮点功能部件和链接技术。该机向量寄存器长度为64。

⑴ 完成计算任务所需要的最短时间为多少拍? ⑵ 实际吞吐率是多少MFLOPS ?

解:本题的向量需要分两段处理,每段长度均为64。设各向量存放的向量寄存器为:A 存于V0和V1,B 存于V2和V3,C 存于V4和V5,D 存于V6和V7,且该机有足够的向量寄存器。则完成计算所需的操作序列如下:

V8←V2+V4 V6←V0*V8 V8←V3+V5 V7←V1*V8

⑴ 显然可将第1、2两条指令链接,第3、4两条指令链接。设加法功能部件时间为6拍,乘法功能部件时间为7拍,向量寄存器入/出各需1拍,则总时间为

T=[(1+6+1)+(1+7+1)+(64-1)]*2=160(拍)

⑵ 完成计算任务所做的浮点操作总次数为N=2*128=256。设该机的时钟频率为f ,则其实际吞吐率为

MFLOPS f

T f N P 6

610

16025610??=??=

4.设E为交换函数,S为均匀洗牌函数,B为蝶式函数,PM2I为移数函数,函数的自变量是十进制数表示的处理机编号。现有32台处理机,其编号为0,1,2, (31)

⑴分别计算下列互连函数:

E2(12)S(8)B(9)PM2I+3(28)E0(S(4))S(E0(18))⑵用E0和S构成均匀洗牌交换网(每步只能使用E0和S一次),网络直径是多少?从5号处理机发送数据到7号处理机,最短路径要经过几步?请列出经过的处理机编号。

⑶采用移数函数构成互连网,网络直径是多少?结点度是多少?与2号处理机距离最远的是几号处理机?

解:⑴E2(12)=E2(01100)=(01000)2=8,

S(8)=S(01000)=(10000)2=16,

B(9)=B(01001)=(11000)2=24,

PM2I+3(28)=28+23 mod 32=4,

E0(S(4))=E0(S(00100))=E0(01000)=(01001)2=9,

S(E0(18))=S(E0(10010))=S(10011)=(00111)2=7.

⑵依题意,均匀洗牌交换网的互连函数设计为:S(E0(X))。

S(E0(00000))=00010,S(E0(00001))=00000,

S(E0(00010))=00110,S(E0(00011))=00100,

S(E0(00100))=01010,S(E0(00101))=01000,

S(E0(00110))=01110,S(E0(00111))=01100,

S(E0(01000))=10010,S(E0(01001))=10000,

S(E0(01010))=10110,S(E0(01011))=10100,

S(E0(01100))=11010,S(E0(01101))=11000,

S(E0(01110))=11110,S(E0(01111))=11100,

S(E0(10000))=00011,S(E0(10001))=00001,

S(E0(10010))=00111,S(E0(10011))=00101,

S(E0(10100))=01011,S(E0(10101))=01001,

S(E0(10110))=01111,S(E0(10111))=01101,

S(E0(11000))=10011,S(E0(11001))=10001,

S(E0(11010))=10111,S(E0(11011))=10101,

S(E0(11100))=11011,S(E0(11101))=11001,

S(E0(11110))=11111,S(E0(11111))=11101。

以上互连关系用图形描述如下:

0→2→6→14→30→31→29→25→17→1

3→4→10→22→15→28→27→21→9→16

5→8→18→7→12→26→23→13→24→19

11→20

所以有:网络直径=∞;从5号结点发送数据到7号结点,最短路径要经过3步,即5→8→18→7。

⑶ 采用移数函数构成互连网,结点间的互连关系是: PM2+0:(0 1 2 3 … 29 30 31) PM2-0:(31 30 29 28 … 2 1 0) PM2+1:(0 2 4 6 … 28 30) (1 3 5 7 … 29 31) PM2-1:(30 28 26 … 4 2 0) (31 29 27 … 5 3 1) PM2+2:(0 4 8 12 16 20 24 28)(1 5 9 13 17 21 25 29)

(2 6 10 14 18 22 26 30)(3 7 11 15 19 23 27 31) PM2-2:(28 24 20 16 12 8 4 0)(29 25 21 17 13 9 5 1)

(30 26 22 18 14 10 6 2)(31 27 23 19 15 11 7 3) PM2+3:(0 8 16 24)(1 9 17 25)(2 10 18 26)(3 11 19 27)

(3 12 20 28)(5 13 21 29)(6 14 22 30)(7 15 23 31) PM2-3:(24 16 8 0)(25 17 9 1)(26 18 10 2)(27 19 11 3)

(28 20 12 3)(29 21 13 5)(30 22 14 6)(31 23 15 7) PM2±4:(0 16)(1 17)(2 18)(3 19)(4 20)(5 21)(6 22)(7 23)

(8 24)(9 25)(10 26)(11 27)(12 28)(13 29)(14 30) (15 31)

设有8个结点,结点之间的互连关系固定为(0,6)(1,7)(2,4)(3,5)。 ⑴ 写出对应这种互连关系的互连函数的一般形式。

⑵ 如采用动态多级立方体网络实现这种结点之间的互连,画出网络结构图,并指出其控制方式和各级开关的状态。 解:⑴ 互连函数的一般形式为

012012)(x x x x x x F

⑵ 采用2×2开关模块,网络结构图如下:

采用级控制方式,各级开关的状态为:L 2L 1L 0=110 。

体系结构作业解题参考

体系结构作业解题参考 第1章习题 6.某处理机时钟频率为f =30MHz ,处理速度为20MIPS ,用它来执行一个已知混合程序。假定每次存储器访问延迟时间为1个时钟周期。问: ⑴ 此处理机的有效CPI 是多少? ⑵ 假定新处理机的时钟频率f 提高到60MHz ,但存储子系统速率不变。这样,每次存储器访问需2个时钟周期。如果30%的指令每条只需要1次访存,而另外5%指令每条需2次访存,且假定已知混合程序的指令数不变,并与原处理机兼容,请定量分析改进后的新处理机性能。 解:⑴ 由 得 ⑵ 设已知混合程序的总指令执行数为IC ,则改进前程序执行所需的总时钟周期数NC O 为 而改进后的混合程序的指令数不变,且每次访存需增加1个时钟周期,故改进后程序执行所需的总时钟周期数NC n 为 所以,改进后,处理机的有效CPI 为 故改进后的处理机速度为 第2章习题 6.一条线性流水线有4个流水段,每个流水段的延迟时间都为△t 。开始5个 △t ,每间隔一个△t 向流水线输入一个任务,然后停顿2个△t ,如此重复。 ⑴ 画出流水线的时空图。 ⑵ 求流水线的实际吞吐率、加速比和效率。 解:⑴ 时空图如下: ⑵ 设流入流水线的任务总数为n ,若以5个任务为一组,则共可分为??? ???5n 组。由于两组任务之间间隔2个时钟周期,所以完成n 个任务的总时间为 所以有 t n n n T n P k ???? ? ????????++=251=吞吐率 , 25125242512154???????++???????+-=??? ? ?????????++????? ??-??????+?=n n n n t n n t n t n S 加速比 , 25125144???????++=???? ? ????????++?=n n n t n n t n E 效率 。

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法?答:细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示: (1 用两给出条指 (1) (24? 变八级流水线(细分) ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。如果每段经过一次所需的时间都是△t ,问: (1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况? (2)此流水线的最大吞吐率为多少?如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少? (3)当每段时间不变时,如何提高流水线的吞吐率?人连续处理10个任务时,其吞吐率提高多少? 解:(1)会发生流水线阻塞情况。

(2) (3)重复设置部件 吞吐率提高倍数= t t ??2310 75 =1.64 3.5 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ,画出时空图,并计算其吞吐率、加速比和效率。 +B 4;再计算由图可见,它在18个△t 时间中,给出了7个结果。所以吞吐率为: 如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。 段23 时间 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性:是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI:每条指令执行时所花费的平均时钟周期。 3.体系结构:即计算机的属性,即概念性结构与功能特性。 4.Amdahl定理:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。 5.信息存储的整数边界:信息在主存中存放的起始地址必须是该信息(字节数)的整数倍。 6.指令系统的正交性:指在指令中各个不同含义的字段,在编码时应互不相关,相互独立。 7.流水线技术:是指将一个重复的时序过程,分解成为若干子过程,而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术:在某条指令产生一个结果之前,其他指令并不直接需要该计算结果,如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方,那么就可以避免暂停的技术就叫定向技术。 9.相关:衡量两个随机变量之间相关程度的指标。 10.向量流水处理机:是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向:将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。 12.指令集的并行:当指令之间不存在相关时,它们在流水线中是可以重叠起来并行执行。 13.记分牌技术:流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法:寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法:由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。这时,需要被迫腾出其中的某一块,以接纳新调入的块。

体系结构 习题解答范文

第一章计算机体系结构的基本概念 1.层次结构——计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为 2.计算机体系结构:程序员看到的计算机的属性,即概念性结构和功能特性。 3.实质是计算机系统中软硬件界面的确定。 4.翻译——(基于层次结构)先把N+1级程序全部变换成N级程序之后,再去执行N级程序, 在执行过程中,N+1级程序不再被访问。 5.解释——每当一条N+1级指令被译码后,就直接去执行一串等效的N级指令,然后再去取下 一条N+1级指令,依此重复执行。 6.体系结构——程序员所看到的计算机的属性,即概念性结构与功能特性。主要研究计算机 系统软件和硬件的功能分配以及如何最佳、最合理地实现分配给硬件的功能。 8.透明性——在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的 概念称为透明性。 9.系列机——在一个厂家生产的具有相同的体系结构,但具有不同的组成和实现的一系列不 同型号的机器。 10.软件兼容——同一个软件可以不加修改地运行于体系结构相同的各档机器上,而且它们所 获得的结果一样,差别只在于运行的时间不同。 11.兼容机——不同厂家生产的、具有相同体系结构的计算机。 12.计算机组成——计算机体系结构的逻辑实现。 13.计算机实现——计算机组成的物理实现。 14.存储程序计算机(冯·诺依曼结构)——采用存储程序原理,将程序和数据存放在同一存 储器中。指令在存储器中按其执行顺序存储,由指令计数器指明每条指令所在的单元地址。 15.并行性——在同一时刻或同一时间间隔内完成两种或两种以上性质相同或不同的工作。 16.时间重叠——在并行性中引入时间因素,即多个处理过程在时间上相互错开,轮流重叠地 使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。 17.资源重复——在并行性中引入时间因素,是根据“以数量取胜”的原则,通过重复设置资源, 尤其是硬件资源,大幅度提高计算机系统的性能。

网络体系结构及OSI基本参考模型典型例题分析解答

— 网络体系结构及OSI基本参考模型典型例题分析解答 一、填空题 1.计算机网络层次及其协议的集合称为网络的___。 2.为进行计算机网络中的数据交换而建立的____、标准或____的集合称为网络协议。的全称为____,的参考模型是由____制定的标准化开放式计算机网络层次结构模型。 包括____、服务定义和____三级抽象。 的体系结构定义了一个七层模型,从下到上分别为物理层、数据链路层、____、运输层、会话层、____和____。 6.网络协议包含三要素,这三要素分别是语义、____和____。 ) 二、单项选择题 1.在网络协议中,涉及数据和控制信息的格式、编码及信号电平等的内容属于网络协议的()要素。 A)语法B)语义C)定时D)语用 体系结构定义了一个()层模型。 A)8 B)9 C)6 D)7 3.在OSI的7层模型中,主要功能是在通信子网中实现路由选择的层次为(). A)物理层B)网络层C)数据链路层D)运输层 4.在OSI的7层模型中,主要功能是协调收发双方的数据传输速率,将比特流组织成帧,并进行校验、确认及反馈重发的层次为()。 A)物理层B)网络层C)数据链路层D)运输层 5.在ISO的7层模型中,主要功能是提供端到端的透明数据运输服务、差错控制和流量撞控制的层次为()。 A)物理层B)数据链路层C)运输层D)网络层 6.在ISO的7层模型中,主要功能是组织和同步不同主机上各种进程间通信的层次为(). A)网络层B)会话层C)运输层D)表示层 7.在OSI的7层模型中,主要功能是为上层用户提供共同的数据或信息语法表示转换,也可进行数据压缩和加密的层次为()。 A)会话层B)网络层C)表示层D)运输层 ' 8.在开放系统互连参考模型中,把传输的比特流划分为帧的层次是()。 A)网络层B)数据链路层C)运输层D)分组层 9.在OSI的7层模型中,提供为建立、维护和拆除物理链路所需的机械的、电气的、功的和规程的特性的层次是()。 A)网络层B)数据链路层C)物理层D)运输层 10。在OSI的7层模型中,负责为OSI应用进程提供服务的层次是() A)应用层B)会话层C)运输层D)表示层 11。在创I的7层模型中,位于物理层和网络层之间的层次是()。 A)表示层B)应用层C)数据链路层D)运输层 12。在OSI的7层模型中,位于运输层之上的层次是()。 A)表示层B)数据链路层C)会话层D)应用层 13。允许计算机相互通信的语言被称为()。 A)协议B)寻址c)轮询D)对话

计算机系统结构网上作业

计算机系统结构作业参考答案 一、 1、试述现代计算机系统的多级层次结构。 计算机系统具有层次性,它由多级层次结构组成。从功能上计算机系统可分为五个层次级别:第一级是设计级。这是一个硬件级,它由机器硬件直接执行。 第二级是一般机器级,也称为机器语言级。它由微程序解释系统.这一级是硬件级。 第三级是操作系统级,它由操作系统程序实现。这些操作系统由机器指令和广义指令组成,这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。 第四级是汇编语言级。它给程序人员提供一种符号形式的语言,以减少程序编写的复杂性。这一级由汇编程序支持执行。 第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。 答:一般原则: (1)确定指令系统时,只选择使用频度很高的指令及少量有效支持操作系统,高级语言及其它功能 的指令,大大减少指令条数,一般使之不超过100条; (2)减少寻址方式种类,一般不超过两种; (3)让所有指令在一个机器周期内完成; (4)扩大通用寄存器个数,一般不少于32个,尽量减少访存次数; (5)大多数指令用硬联实现,少数用微程序实现; (6)优化编译程序,简单有效地支持高级语言实现。

基本技术: (1)按RISC一般原则设计,即确定指令系统时,选最常用基本指令,附以少数对操作系统等支持最有用的指令,使指令精简。编码规整,寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现,功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即:为了减少访存,减化寻址方式和指令格式,简有效地支持高级语言中的过程调用,在RISC机器中设有大量寄存嚣,井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令,即可让本条指令执行与下条指令预取在时间上重叠。另外,将转移指令与其前面的一条指令对换位置,让成功转移总是在紧跟的指令执行之后发生,使预取指令不作废,节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配,减少访存次数。不仅要利用常规手段优化编译,还可调整指令执行顺序,以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别 (1)全相连映像 主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分,Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同,Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关,Cache必须对每个块和块自身的地址加以存储。当请求数据时,Cache控制器要把请求地址同所有的地址加以比较,进行确认。 (2)直接映像 把主存分成若干区,每区与Cache大小相同。区内分块,主存每个区中块的大小和Cache 中块的大小相等,主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中,即相同块号的位置。主存地址分为三部分:区号、块号和块内地址,Cache地址分为:块号和块内地址。直接映像方式下,数据块只能映像到Cache中唯一指定的位置,故不存在替换算法的问题。它不同于全相连Cache,地址仅需比较一次。 (3)区别: 全相连映像比较灵活,块冲突率低,只有在Cache中的块全部装满后才会出现冲突,Cache 利用率高。但地址变换机构复杂,地址变换速度慢,成本高。 直接映像的地址变换简单、速度快,可直接由主存地址提取出Cache地址。但不灵活,块冲突率较高,Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成?

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

软件体系结构作业

姓名:王皓 学号: 第一章: 1.根据自己的经验,谈谈对软件危机的看法。 软件危机是指软件生产方式无法满足迅速增长的计算机需求,开发和维护过程出现的一系列问题。 以下几个原因导致:(1)软件自身特点 (2)开发人员的弱点 (3)用户需求不明 — (4)缺乏正确理论指导 (5)开发规模越来越大 (6)开发复杂度越来越高 可以通过软件生命周期的模型和软件工具的使用来缓解危机,通过程序自动化和软件工业化生产的方法实现软件标准化的目标,进一步缓解软件危机带来的影响。 软件危机有利有弊,除了带来许多麻烦,也给我们带来许多挑战,克服危机的过程,我们在技术上和创新上都有了一个提升,也算是间接为软件产业的发展做了贡献。 2.什么是软件重用,软件重用的层次可以分为哪几个级别 软件重用:是指在两次或多次不同的软件开发过程中重复使用相同或相似软件元素的过程。可以分为三个层次: 《 (1)代码重用(2)设计结果重用(3)分析结果重用 3.什么是可重用构件相对于普通的软件产品,对可重用构件有何特殊要求 可充用构件表示软件重用过程中,可重用的软件构件元素。 可重用构件的特殊要求: (1)可重用构件应该具有功能上的独立性与完整性; (2)可重用构件应该具有较高的通用性; (3)可重用构件应该具有较高的灵活; ; (4)可重用构件应该具有严格的质量保证; (5)可重用构件应该具有较高的标准化程。 4.基于构件的软件开发的优势是什么基于构件的软件开发面临哪些

挑战和困难 优势:基于构件的软件将软件开发的重点从程序编写转移到了基于已有构件的组装,更快地构造系统,减轻用来支持和升级大型系统所需要的维护负担,从而降 低了软件开发的费用 困难和挑战:没有可依据的参考,可用资源和环境缺乏,开发难度高,而各方面需求增长速度与日剧增,更新和升级的跟进是一个不小的挑战.此外,在同 一系统采用多个开发商提供的构件,它们之间的兼容性可能是开发过程中所 要面对的一个严峻的问题 挑战和困难: (1)在同一系统采用多个开发商提供的构件,它们之间的兼容性可能是开发过程中所要面对的一个严峻的问题; * (2)采用随处可以购买到的构件可能会使开发出来的软件产品丧失技术上的独创性和市场上的竞争力; (3)第三方的构件开发商可能歇业,这会使购买的构件失去维护服务。这些都是在购买第三方构件进行软件开发时无法回避的问题,因此需要对这些风险进行充 分的估计。 5.简述3种应用最为广泛的构件技术规范COM、CORBA和EJB的各自特点。 CORBA的特点: (1)实现客户与服务对象的完全分开,客户不需要了解服务对象的实现过程以及具体位置。 (2)应用程序间的统一接口。 (3)采用面向对象的软件实现方法开发应用系统,实现对象内部细节的完整封装,保留对象方法的对外接口定义。 ! (4)分层的设计原则和实现方式。 COM的特点: (1)语言无关性。 (2)可重用性。 EJB的特点: (1)可移植性。 (2)平台独立性。 ! (3)简化了分布式对象的开发、部署和访问。 6.就项目管理方面而言,软件重用项目与非重用项目有哪些不同之处。 使用软件重用技术可减少重复工作,提高软件生产率, 缩短开发周期。同时,由 于软构建大多经过严格的质量认证,因此有助于改善软件质量,大量使用构建,软件

软件体系结构考试参考试题

壹 . 名词解释(参考斯佳分享的名词解释文档) 1.ADL(Architecture Description Language) 体系结构描述语言 2. SOA(Service-Oriented Architecture) 面向服务架构 3. DSSA (Domain Specific Software Architecture) 特定领域软件体系结构 4.CORBA(Common Object Request Broker Architecture) 公共对象请求代理体系结构 5. UML(Unified Modeling Language) 统一建模语言 6.XML(Extensible Markup Language ) 可扩展标记语言 7.B/S(Browser/Server) 浏览器/服务器C/S(Client/Server) 客户端/服务器 8.HMB(Hierarchical [?ha??'rɑ:k?kl] message bus) 层次消息总线 9.SA (Software Architecture) 软件体系结构 10.OMG(Object Management Group) 对象管理组织 11.SOAP(Simple Object Access Protocol) 简单对象访问协议 12.WSDL(Web Services Description Language) web服务描述语言 13.SOAD(Service Oriented Analysis And Design) 面向服务的分析与设计 14.DCOM(Distributed Component Object Model) 分布式对象组件模型 https://www.doczj.com/doc/0615690867.html, (Module Interconnection Language) 模块内连接语言 贰 . 判断题 1、软件重用是指重复使用已有的软件产品用于开发新的软件系统,以达到提高软件系统的开发质量与效率,降低开发成本的目的。答案:√ 依据页码:P4 2、软件体系结构充当一个理解系统构件和它们之间关系的框架,特别是那些始终跨越时间和实现的属性。 答案:√ 依据页码:P28 5、构件可以由其他复合构建和原子构件通过连接而成。() 答案:√ 依据页码:P37 6、体系的核心模型由5种元素组成:构件、连接体、配置、端口和角色() 答案:√ 依据页码:P37 7、软件体系结构的核心由5种元素组成:构件、连接件、配置端口和角色。其中,构件、连接件和配置是最基本的元素() 答案:√ 依据页码:P37 8、开发视图主要支持系统的功能需求,即系统提供给最终用户的服务() 答案:X 依据页码:P32、33 9、构件、连接件以及配置是体系结构的核心模型最基本的元素() 答案:√ 根据页码:P37

高级计算机体系结构作业汇总(非标准答案)

1.Explain the Concepts Computer Architecture 系统结构 由程序设计者所看到的一个计算机系统的属性。即计算机系统的软硬件界面。 Advanced CA 高级系统结构 新型计算机系统结构。基于串行计算机结构,研究多指令多数据计算机系统,具有并发、可扩展和可编程性。为非冯式系统结构。 Amdahl law Amdahl定律 系统中某部件由于采用某种方式时系统性能改进后,整个系统性能的提高与该方式的使用频率或占的执行时间的比例有关。 SCALAR PROCESSING 标量处理机 在同一时间内只处理一条数据。 LOOK-AHEAD 先行技术 通过缓冲技术和预处理技术,解决存储器冲突,使运算器能够专心与数据的运算,从而大幅提高程序的执行速度。 PVP 向量型并行计算处理机 以流水线结构为主的并行处理器。 SMP 对称多处理机系统 任意处理器可直接访问任意内存地址,使用共享存储器,访问延迟、带宽、机率都是等价的。MPP 大规模并行计算机系统 物理和逻辑上均是分布内存,能扩展至成百上千处理器,采用专门设计和定制的高通信带宽和低延迟的互联网络。 DSM 分布式共享存储系统 内存模块物理上局部于各个处理器内部,但逻辑上是共享存储的。 COW 机群系统 每个节点都是一个完整的计算机,各个节点通过高性能网络相互连接,网络接口和I/O总线松耦合连接,每个节点有完整的操作系统。 GCE 网格计算环境 利用互联网上的计算机的处理器闲置处理能力来解决大型计算问题的一种科学计算。 CISC 复杂指令集计算机

通过设置一些复杂的指令,把一些原来由软件实现的常用功能改用硬件实现的指令系统实现,以此来提高计算机的执行速度。 RISC 精简指令集计算机 尽量简化计算机指令功能,只保留那些功能简单,能在一个节拍内执行完的指令,而把复杂指令用段子程序来实现。 VMM 虚拟机监视器 作为软硬件的中间层,在应用和操作系统所见的执行环境之间。 SUPERCOMPUTER 超级计算机 数百数千甚至更多的处理器组成的能计算普通计算机不能完成的大型复杂问题的计算机。SVM 共享虚拟存储器 存储器虚拟化为一个共享的存储器,并提供单一的地址空间。 MAINFRAME 大型计算机 作为大型商业服务器,一般用于大型事务处理系统,特别是过去完成的且不值得重新编写的数据库应用系统方面。 COMPUTER SYSTEM ON CHIP 片上计算机系统 在单个芯片上集成的一个完整系统。 PARALLEL ARCHITECTURE INTO SINGLE CHIP 单片并行结构 在单个芯片上采用的并行体系结构 MOORE law Moore定律 当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。 UMA 一致存储访问 采用集中式存储的模式,提供均匀的存储访问。 NUMA 非一致存储访问 内存模块局部在各个结点内部,所有局部内存模块构成并行机的全局内存模块。 COMA 全高速缓存存储访问 采用分布式存储模式,通过高速缓存提供快速存储访问。 CC-NUMA 全高速缓存非一致性均匀访问 存在专用硬件设备保证在任意时刻,各结点Cache中数据与全局内存数据的一致性。NORMA 非远程存储访问

计算机系统结构期末考试题目

第一章: 1.计算机系统结构的定义 答:由程序设计者看到的一个计算机系统的属性,即概念性结构和功能特性。 2.透明性概念 答:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,称为透明性现象。 3.兼容性向后兼容 兼容性:同一个软件可以不加修改地运行于系统结构相同的各档机器,可获得相同的结果,差别只在于不同的运行时间。 向后兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律 答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答:每条指令的平均时钟周期数。 6.MIPS 答:每秒百万条指令数!MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答:每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念 答: 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分 答:①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD(实际不存在)④多指令流多数据流MIMD 10.计算机系统设计的定量原理(四个) 答:①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算 答:CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长 加速比=(采用改进措施后的性能)/(没有采用改进措施前的性能) =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点 硬件实现:速度快、成本高;灵活性差、占用内存少 软件实现:速度低、复制费用低;灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

软件体系结构作业 完整版

第一章: 1.根据自己的经验,谈谈对软件危机的看法。 软件危机是指软件生产方式无法满足迅速增长的计算机需求,开发和维护过程出现的一系列问题。 以下几个原因导致:(1)软件自身特点 (2)开发人员的弱点 (3)用户需求不明 (4)缺乏正确理论指导 (5)开发规模越来越大 (6)开发复杂度越来越高 可以通过软件生命周期的模型和软件工具的使用来缓解危机,通过程序自动化和软件工业化生产的方法实现软件标准化的目标,进一步缓解软件危机带来的影响。 软件危机有利有弊,除了带来许多麻烦,也给我们带来许多挑战,克服危机的过程,我们在技术上和创新上都有了一个提升,也算是间接为软件产业的发展做了贡献。 2.什么是软件重用,软件重用的层次可以分为哪几个级别? 软件重用:是指在两次或多次不同的软件开发过程中重复使用相同或相似软件元素的过程。可以分为三个层次: (1)代码重用(2)设计结果重用(3)分析结果重用 3.什么是可重用构件?相对于普通的软件产品,对可重用构件有何特殊要求? 可充用构件表示软件重用过程中,可重用的软件构件元素。 可重用构件的特殊要求: (1)可重用构件应该具有功能上的独立性与完整性; (2)可重用构件应该具有较高的通用性; (3)可重用构件应该具有较高的灵活; (4)可重用构件应该具有严格的质量保证; (5)可重用构件应该具有较高的标准化程。 4.基于构件的软件开发的优势是什么?基于构件的软件开发面临哪些挑战和困难? 优势:基于构件的软件将软件开发的重点从程序编写转移到了基于已有构件的组装,更快地构造系统,减轻用来支持和升级大型系统所需要的维护负担,从而降低了软件开发的费 用 困难和挑战:没有可依据的参考,可用资源和环境缺乏,开发难度高,而各方面需求增长速度与日剧增,更新和升级的跟进是一个不小的挑战.此外,在同一系统采用多个开 发商提供的构件,它们之间的兼容性可能是开发过程中所要面对的一个严峻的问题挑战和困难:

体系结构作业解题参考

体系结构作业解题参考 第1章习题 6.某处理机时钟频率为f =30MHz ,处理速度为20MIPS ,用它来执行一个已知混合程序。假定每次存储器访问延迟时间为1个时钟周期。问: ⑴ 此处理机的有效CPI 是多少? ⑵ 假定新处理机的时钟频率f 提高到60MHz ,但存储子系统速率不变。这样,每次存储器访问需2个时钟周期。如果30%的指令每条只需要1次访存,而另外5%指令每条需2次访存,且假定已知混合程序的指令数不变,并与原处理机兼容,请定量分析改进后的新处理机性能。 解:⑴ 由 6 10?= CPI f MIPS 得 5.110 20103010666 =??=?= MIPS f CPI ⑵ 设已知混合程序的总指令执行数为IC ,则改进前程序执行所需的总时钟周期数NC O 为 IC IC CPI NC o 5.1=?= 而改进后的混合程序的指令数不变,且每次访存需增加1个时钟周期,故改进后程序执行所需的总时钟周期数NC n 为 IC IC IC IC IC NC NC o n 9.14.05.1205.013.0=+=?+?+= 所以,改进后,处理机的有效CPI 为 9 .19.1===IC IC IC NC CPI n n 故改进后的处理机速度为 58.3110 9.11060106 6 6≈??=?=n n n CPI f MIPS

第2章习题 6.一条线性流水线有4个流水段,每个流水段的延迟时间都为△t 。开始5个 △t ,每间隔一个△t 向流水线输入一个任务,然后停顿2个△t ,如此重复。 ⑴ 画出流水线的时空图。 ⑵ 求流水线的实际吞吐率、加速比和效率。 解:⑴ 时空图如下: ⑵ 设流入流水线的任务总数为n ,若以5个任务为一组,则共可分为?? ? ???5n 组。 由于两组任务之间间隔2个时钟周期,所以完成n 个任务的总时间为 ()t n n t n t n T k ??? ? ?????? ???++=???? ? ??-??????+?-+=25121514 所以有 t n n n T n P k ???? ? ????????++=251=吞吐率 , 25125242512154???????++???? ???+-=??? ? ?????????++????? ??-??????+?=n n n n t n n t n t n S 加速比 , 25125144???????++=???? ? ????????++?= n n n t n n t n E 效率 。

计算机体系结构习题答案解析

第1章计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。 解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。 CPI:每条指令执行的平均时钟周期数。 测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。 存储程序计算机:冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。 向上(下)兼容:按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。 向后(前)兼容:按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分:100分,时间:100分钟) 姓名:周元华 专业:计算机科学与技术 学号: 18260070164016 学习中心:上海弘成 一、填空题(每空1分,共14分) 1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相连方式。 2.虚拟存储器的三种管理方式是段式管理,页式管理和 段页式管理。 3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为读与写(RAM)、写与读(WAR)和写与写(WAW)三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容 二、名词解释(每题2分,共16分) 计算机体系结构: 计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩,如存储部分就包括寄存器、内存、硬盘等。 兼容机: 兼容机,就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说,就是非厂家原装,而改由个体装配而成的机器,其中的元件可以是同一厂家出品,但更多的是整合各家之长的 计算机。 写直达法: 写直达法一般指全写法。全写法(write-through):又称写直达法、写穿法,透写法,Cache使 用方式之一。 高速缓冲存储器: 高速缓冲存储器(Cache)其原始意义是指存取速度比一般随机存取记忆体(RAM)来得快 的一种RAM,一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM 技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成, 容量比较小但速度比主存高得多,接近于CPU的速度。在计算机存储系统的层次结构中,是介 于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速 缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 高速缓冲存储器最重要的技术指标是它的命中率。 延迟转移技术: 在转移指令之后插入一条或几条有效的指令。当程序执行时,要等这些插入的指令执行完成 之后,才执行转移指令,因此,转移指令好像被延迟执行了,这种技术称为延迟转移技术。 线性流水线: 线性流水线就是由一整套工艺串联而成的生产线。 流水线又称为装配线,一种工业上的生产方式,指每一个生产单位只专注处理某一个片段的工 作,以提高工作效率及产量;按照流水线的输送方式大体可以分为:皮带流水装配线、板链线、 倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。 输送线的传输方式有同步传输的/(强制式),也可以是非同步传输/(柔性式),根据配置的 选择,可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。 流水线的吞吐率: 流水线的吞吐率是单位时间内流水线处理的任务数。 并行性: 并行性是指计算机系统具有可以同时进行运算或操作的特性,在同一时间完成两种或两种以 上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发 性指两个或两个以上事件在同一时间间隔发生。 三、简答题(每题5分,共30分) 1.如有一个经解释实现的计算机,可以按功能划分成4级。每一 级为了执行一条指令需要下一级的N条指令解释。若执行第一 级的一条指令需K(ns)时间,那么执行第2、3、4级的一条指 令各需要用多少时间(ns)? 答:第1级:1条1级指令 K ns 第2级:1条2级指令N条1级指令 1*N*K ns = NK ns 第3级:1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级:1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律,系统加速比由哪两个因素决定? 答:系统加速比依赖于两个因素: (1)可改进比例:可改进部分在原系统计算时间中所占的比例 (2)部件加速比:可改进部分改进以后的性能提高 3.简述组相联映象规则。 答:(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量 是缓存容量的整数倍,将主存空间按缓冲区的大小分成区,主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么?为了保持Cache 的一致性,在单计算机系统中一般采取哪些措施? 答:不一致的原因:(1)由于CPU写Cache,没有立即写主存 (2)由于I/O处理机或I/O设备写主存 采取措施: (1)全写法,亦称写直达法(WT法-Write through) 方法:在对Cache进行写操作的同时,也对主存该内容进行写入 (2)写回法(WB法-Write back) 方法:在CPU执行写操作时,只写入Cache,不写入主存。 5.按照同一时间内各段之间的连接方式来分,流水线可分为哪两 类? 答:(1)静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。 (2)动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的?将计算机分 成哪几类? 答:Flynn分类法,根据计算机中指令和数据的并行状况把计算机分成: (1)单指令流单数据流(SISD.; (2)单指令流多数据流(SIMD.; (3)多指令流单数据流(MISD.; (4)多指令流多数据流(MIMD.。 四、问答与计算题(第1题10分,第2、3题每题15分共40分) 1.一个有快表和慢表的页式虚拟存储器,最多有64个用户,每 个用户最多要用1024个页面,每页4K字节,主存容量8M字节。 (1)写出多用户虚地址的格式,并标出各字段的长度。 (2)写出主存地址的格式,并标出各字段的长度。

计算机体系结构参考1

第一题选择题 1.SIMD是指(B) A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2.下列那种存储设备不需要编址?D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3.按照计算机系统层次结构,算术运算、逻辑运算和移位等指令应属于(A)级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4.早期的计算机系统只有定点数据表示,因此硬件结构可以很简单。但是这样的系统有明显的缺点,下面哪一个不是它的缺点:B A.数据表示范围小 B.单个需要的计算时钟周期多 C.编程困难 D.存储单元的利用率很低 7.下面哪个页面替换算法实际上是不能够实现的?D A)随机页面替换算法 B)先进先出替换算法 C)最久没有使用算法 D)最优替换算法

9.指令优化编码方法,就编码的效率来讲,那种方法最好?C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10.在早期冯·诺依曼计算机特征中,机器以(C)为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A.先进先出顺序访问 B.按地址访问 C.无地址访问 D.按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每—段分别只有—个部件可供使用,并且执行时间分别为Δt、2Δt和3Δt,连续执行n条指令所需要花费的最短时间约为( C )。 (假设“取指令”、“分析”和“执行”可重叠,并假设n足够大) A.6 nΔt B.2 nΔt C.3 nΔt D.nΔt 6、下列计算机不属于RISC计算机的是(C )。 A.SUN:Ultra SPARC

相关主题
文本预览
相关文档 最新文档