指令集并行动态分支预测与推断执行

时间:2026-01-18

指令集并行动态分支预测与推断执行

指令集并行——动态分支预测与推断执行

实验目的:

1) 了解动态分支预测的基本技术 2) 了解推断执行的基本过程 3) 比较各种分支预测技术的性能

实验环境:

linux平台下SimpleScalar仿真器,详见SimpleScalar使用说明

实验原理:SimpleScalar分支预测的实现方法。

流程:先进行分支方向探测,即是否采取分支(当然跳转指令和调用返回指令不用作这一步),接着是生成分支地址,对于调返指令,直接在RAS上作相关操作,普通分支指令则要利用BTB来进行地址探测,命中则生成地址。然后对两步综合,地址命中且分支预测为采取,返回分支目标地址;地址不命中且分支预测为采取,返回1;只要分支预测为不采取,就返回0。重点分析针对条件分支指令的方向探测方法,主要有6种,三种静态:taken,not tanken,perfect;三种动态:bimod,2-level,comb。静态的方法顾名思义,只是perfect这种,按它的原薏是不预测,直接把真正采取的下一条指令填入npc,而且它确实不需要调用pred-lookup函数,但据有人说,这种方法有时性能不如bimod,另外在sim-pred中好象也没加入这种方法,只是在sim-outorder中有实现。对于三种动态方法,分别说明如下:bimod是最普通的,即采用一个2bit宽的分支方向预测表,按分支地址查找,2bit分支预测器的判断和更新与课本上的一致。这种方式只有一个参数,就是分支预测表的长度。2-level要复杂一些,它采用两级表格式,第一级是分支历史表,存放各组分支历史寄存器的值,第二级是全局/局部分支模式表,(全局或局部应是由表长相对于分支历史寄存器的长决定),它存放各分支历史模式的2bit预测器。在判断时用当前分支指令对应的历史寄存器值去索引二级表得到相应预测器值。更新时,把当前分支的方向左移入历史寄存器,并对使用过的2bit预测器作更新。它有四个参数,前三个是一级表长度,二级表长度,历史寄存器宽度,最后一个是异或标志。如果为1,则将历史寄存器的值与当前分支指令地址异或,用其结果再去索引二级模式表。而comb方式则组合了以上两种方法,它再加入了一个meta表,这个表类似bimod的预测表,只是它预测的是采取bimod还是2-level,也采用2-bit预测器,被采取的预测方法被定为第一方向,未被采取的定为第二方向。更新时,如果第一方向与第二方向不同则更新meta表,否则只更新两种方法各自的表即可。它共有三组参数,前两组即bimod和two-level的参数,第三组是关于meta表长度的说明。至于BTB的更新与cache的更新方式相同。

实验步骤:

1) 在Windows环境下运行VMware虚拟机。 2) 在VMware虚拟机上运行Linux的命令行模式。

3) 进入SimpleScalar目录(/home/fwang/tixijiegou/simplesim-3.0/) 。

4) 用sim-pred仿真器运行提供的三个benchmark程序,分别采用五种不同的分支预测方

法,即bimod方式,two-level adaptive方式,always taken方式,always not taken方式,comb方式,并对前两种分别使用下表中两种参数配置:分析仿真器输出的关于分支预

INFOLAB

1 共 3 页

指令集并行动态分支预测与推断执行.doc 将本文的Word文档下载到电脑

精彩图片

热门精选

大家正在看

× 游客快捷下载通道(下载后可以自由复制和排版)

限时特价:4.9 元/份 原价:20元

支付方式:

开通VIP包月会员 特价:19元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219