您当前的位置:首页 > 科技前沿

预取技术分析

时间:2015-10-03  来源:扁平线圈电感厂家  点击:

然而,在GPGPU线程的实际执行中,会对时间上连续的warp进行调度。因而如果简单实现连续warp间的预取会出现预取延迟,造成预取失效。为了克服这种预取延迟的问题,在GPGPU的warp分配过程中,需要对访存连续的warp的执行顺序进行调整[14],拉大访存连续warp的间隔,避免出现正在运行的warp和其帮助预取的warp连续执行的情况,从而使得预取能及时生效。

2.2 利用硬件资源的预取策略

由于GPGPU中预取策略的制定比较单一,因此有部分研究的重点转移到了预取数据的存放问题。在GPGPU中,预取的数据通常存放在共享内存中。当出现内存替换时,可能会使预取数据被替换出去从而导致预取失效。而在GPGPU执行过程中,通常有大量寄存器长时间闲置[15]。为了避免预取数据的替换,可以利用空闲的寄存器来存储预取数据。通过监视寄存器的工作状态来确定哪些寄存器适合用来存放预取数据,从而避免预取数据被替换出去,提升预取效果。

由于GPGPU中丰富的硬件资源,在GPGPU程序运行过程中,不可避免地也会出现硬件流处理器闲置的情况。因此,可以利用这些闲置的流处理器资源来为预取提供支持。ISP(Idle Stream Multiprocessors)预取策略就是基于这种设想提出的[16],通过利用停滞的流处理器来为正在工作的warp预取数据,从而提高程序的执行效率。

3 预取技术分析和展望

通用处理器与图形处理器由于其硬件特性以及其上运行的程序特性决定了两者预取技术的相关研究侧重点不同:CPU由于其上运行的程序种类多、程序逻辑复杂,简单的预取策略并不能同时满足所有的程序需求。因此相关研究更多的侧重于设计合理的预取策略,提升预取策略的覆盖面。为了充分发挥GPGPU性能,通常其上运行的程序已经具有良好的空间局部性,这也就决定了其预取策略主要围绕的是空间局部性制定的,主要关注的是如何高效地实现这一机制。

表1是对CPU及GPGPU平台制定预取策略的依据和具体实现方式的总结。

zs2-b1.gif

虽然针对CPU预取的相关研究已经取得了很好的效果,但仍然面临着许多挑战。由于运行程序的多样性,大量应用的访存行为不一致,单一的预取策略并不能同时很好地满足各种应用的需求。较为复杂的策略虽然能保证精度,但会引入较高的额外开销。而简单的预取策略在访问不规律下精度过低,导致效率不足。因此,需要研究自适应的预取策略,根据当前运行的程序状态,动态选择合适的预取策略,从而进一步提高程序性能。

由于GPGPU应用的访存行为较为单一,现阶段的主要研究内容是如何更高效地实现预取,实现算法也比较简单。然而,GPGPU的强大性能使得许多原本不熟悉GPGPU特点的编程人员加入了平台应用的开发过程中,从而可能会出现不友好的访存行为,使得直接利用简单预取策略并不能取得理想的效果。同时,GPGPU上对预取的硬件支持也不够充分。因此,在未来的研究中,需要规范访存行为,利用CPU资源来协同修正GPGPU应用的访存行为,从而使其更规律,预取更高效。同时在GPGPU体系结构设计过程中,提供更多的预取硬件支持,提高预取效率。

4 结语

随着计算硬件的迅速发展,处理器处理速度与内存访问速度的差异越来越大,内存访问延迟成为限制处理器性能的主要问题。预取技术作为降低两者速度差异的重要手段之大电流功率电感制造商一已得到广泛的应用。随着硬件设计的并行化,多核乃至众核硬件逐渐成为硬件平台的主流。如何为并行硬件设计高效预取技术,目前还处于刚刚起步阶段,也无法满足并行环境提高访存效率的需空心线圈电感要。随着技术的不断进步,相信未来针对并行硬件的预取技术将会逐步得到完善。

参考文献

[1] SMITH A.Sequential program prefetching in memory hierarchies[J].IEEE Transactions on Computers,1978,11(12):7-12.

[2] ISHII Y,INABA M,HIRAKI K.Access map pattern matching for high performance data cache prefetch[J].Journal of Instruction-Level Parallelism,2011,13:1-24.

[3] SAIR S,SHERWOOD T,CALDER B.A decoupled predictor-directed stream prefetching architecture[J].IEEE Transactions on Computers,2003,52(3):260-276.

[4] HUR I,LIN C.Memory prefetching using adaptive stream detection[C].In Proceedings of the 39th International Symposium on Microarchitecture,2006:397-408.

大电流电感

IR2117问题请教关于ir2117看了很多帖子,似懂非懂,有些地方没有搞明白,特来请教。先附上原理图。图中输出为交流220V整流后的310V直流电压。1)xkw1cn版主说有2种充电方式,我没有领会,猜想一种是从

关于开关电源EMI整改问题 各位大师,


小弟最近正在做一个项目,是一个60W的开关电源,有两路输出42V和24V,分别是1A;在EMI测试时,传导骚扰测试没有问题,但辐射干扰超出了范围,超出频段在50MHz-100MHz之间,最

Keil Monitor-51仿真板的制作与使用 MCS -51单片机在我国应用最为广泛、经久不衰。以往单片机应用程序主要用汇编语言编写。由于汇编语言程序的可读性和可移植性都较差,采用汇编语言编写单片机应用程序不

注塑加工厂


上一篇ESD保护策略解析

下一篇误解vs现实:基于云管理的无线局域网


  
  温馨提示
网站首页 | 产品展示 | 科技前沿 | 行业资讯
本公司专业研发、设计、生产、销售贴片电感、插件电感、功率电感、大电流电感、扁平线圈电感、一体成型电感。
专业电感生产制造商,品质优异、交期快。
在线客服
热线电话