- 对于一个 4-way 的超标量处理器来说,在重排序缓存(ROB)中每周期可以退休的指令个数应该是不小于四条的;
- 如图给出的ROB,在那些最旧的指令中,有三条指令都已经变为了complete状态,那么在一个周期内就可以将这三条指令都退休。
- 要实现如图所示的功能,需要对ROB中最旧的指令开始(由headpointer指定)连续的四个complete信号进行判断,如果某个complete信号为0,那么它后面的所有指令都不允许在本周期退休;
- 对于一个 4-way 的超标量处理器来说,ROB 最少需要支持四个读端口,但是这远远不是ROB真正需要的端口个数,流水线的其他阶段还对ROB有着端口的需求,它和处理器所采用的架构有关系
- 如果处理器采用ROB进行寄存器重命名的方式,那么此时对ROB的端口需求是最多的,这些端口包括如下几个。
- 在流水线的寄存器重命名阶段,需要从ROB中读取四条指令的源操作数,因此需要ROB支持八个读端口(假设每条指令有两个源寄存器);
- 在流水线的分发(Dispatch)阶段,需要向ROB中写入四条指令,因此需要ROB支持四个写端口;
- 在流水线的写回(Write Back)阶段,需要向ROB中写入最少四条指令的结果,之所以使用“最少”这个词,是因为很多处理器的issue width 是要大于machine width的,处理器会放置更多的FU来提高运算的并行度,
- 这种多端口的 FIFO在面积和延迟方面很难进行优化,这也是采用 ROB 进行寄存器重命名的架构所面临的最大问题之一:ROB会成为整个处理器中最繁忙的部件,这需要在电路设计层面上对ROB进行仔细的设计和优化,增大了设计的复杂度。