您当前的位置:首页 > 科技前沿

预取技术分析

时间:2015-10-03  来源:扁平线圈电感厂家  点击:

然而,由于相关性流的长度可能达到上百个,为了利用时间局部性,可能需要非常大的额外存储空间来存储相关流。因此,如何对存储空间进行优化是基于时间局部性预取策略需要解决的重要问题。由于现有高速缓存中命中率(hit rate)远远高于缺失率(miss rate),因此一种有效优化策略是通过记录缓存缺失的地址来代替记录整个访存行为降低所需的存储空间[8]。除了利用地址相关性,还可以利用地址变化相关性(delta correlation)来优化存储空间。即通过记录两次访存之间的地址偏移量来训练预取策略。虽然这种策略会明显减少所需存储空间,但对于无规律的访问,也会导致覆盖率和精度的降低。很多情况下反复出现的指令流是由诸如循环迭代之类反复出现的代码块产生的[9]。通过获取整个循环结构的工作集可以在保证精度的情况下精简预取所需的额外开销。通过对执行频度高的循环进行注释,预取器可以追踪和预测整个迭代循环的工作集,从而在保证精度的情况下降低预取所需的存储开销。

为了进一步减少片上硬件开销,也可以将预测信息存储在片外[10],片上只存储对片外存储信息哈希建立的索引,以减少查询及访问延迟并利用“概率更新”机制来减少片外信息的更新频率,从而可以降低较长的流造成的存储开销。

1.3 帮助线程

近年来,由于能耗墙和存储墙问题的突出,多核处理器已逐渐代替单核处理器成为主流硬件平台。其丰富的并行资源为提高应用性能提供了广阔的前景。并行资源的丰富也为进一步提升预取效率提供了空间。

基于多核的预取策略优化主要是基于额外硬件资源生成帮助线程来提高预取效率。其核心思想是基于主线程的执行流生成精简版本作为预取帮助线程[11]。主线程与预取帮助线程同时执行,由于预取线程执行的程序片段为主线程的精简版本,通常执行速度会快于主线程。因此可以将其执行读取数据的结果通过共享缓存反馈给主线程从而达到为主线程预取数据,加速主线程执行速度的效果。

另一种帮助线程预取的策略是通过核间线程迁移基础上的帮助线程预取策略[12]。之前的帮助线程主要是通过共享的缓存来为主线程的预取提供帮助,而由于共享缓存的速度较慢,无法达到较好的性能。为了进一步提高帮助线程的效果,可以通过核间线程迁移的方式利用高速的私有缓存实现高效的预取。在这种策略下,帮助线程仍然为主线程执行片段的精简版本。每个核运行一个线程,同时运行的线程包括一个主线程和数个帮助线程。当运行完一段指令后,对主线程进行迁移,即原本运行主线程的核开始运行帮助线程,而之前运行帮助线程的核由于已经完成了预取,主线程将迁移到这个核上,从而利用存储在该核私有缓存中的预取信息而不是共享缓存,提高了效率。

2 面向图形处理器(GPGPU)的预取技术

图形处理器由于其强大的计算能力和对通用计算支持的逐步加强,目前越来越多地应用于通用计算领域。因此如何提高其片上存储部件的效率对其执行性能将产生至关重要的影响。与通用处理器(CPU)不同,由于GPGPU上各个硬件核心运行的线程访存模式较为接近,面向GPGPU的预取策略主要集中在利用空间局部性。除了预取策略的制定外,还有部分研究是围绕充分发掘GPGPU硬件资源来为预取提供额外支持而展开的,本节将分别对这两部分进行介绍。

2.1 GPGPU的预取策略制定

GPGPU由于其高并行度的优势,越来越多的被应用到通用计算领域。与通用处理器类似,GPGPU虽然拥有更为丰富的计算资源,但其性能也受到了内存延迟的限制,而预取技术正是有效隐藏内存延迟的手段之一。

虽然GPGPU相关应用都具有良好的空间局部性,但由于其自身硬件特点,为了取得性能提升并不能直接套用已有针对CPU的预取技术。高度并行化是GPGPU应用与传统的应用的显著差别之一。正是由于这个特点,GPGPU上每个线程的执行时间通常较短,这也意味着线程中如果存在循环体的话,循环次数也非常少。这种情况下针对线程自身并没有多少机会通过预取来提高性能。因而面向GPGPU的预取主要是进行线程间的预取[13],即当前执行的线程组(warp)为下一时刻将要执行的线程组中的线程进行预取,减少了之后执行线程的访存延迟。在GPGPU上执行的多个warp组间通常具有较好的访存规律性,若3个或3个以上warp中对应线程的访存偏移量一致,则认为偏移量可以应用至整体线程组。对于这种情况,可以针对每个warp维护一个访存偏移表,从而为预取提供依据。

大电流电感

IR2117问题请教关于ir2117看了很多帖子,似懂非懂,有些地方没有搞明白,特来请教。先附上原理图。图中输出为交流220V整流后的310V直流电压。1)xkw1cn版主说有2种充电方式,我没有领会,猜想一种是从

关于开关电源EMI整改问题 各位大师,


小弟最近正在做一个项目,是一个60W的开关电源,有两路输出42V和24V,分别是1A;在EMI测试时,传导骚扰测试没有问题,但辐射干扰超出了范围,超出频段在50MHz-100MHz之间,最

Keil Monitor-51仿真板的制作与使用 MCS -51单片机在我国应用最为广泛、经久不衰。以往单片机应用程序主要用汇编语言编写。由于汇编语言程序的可读性和可移植性都较差,采用汇编语言编写单片机应用程序不

注塑加工厂


上一篇ESD保护策略解析

下一篇误解vs现实:基于云管理的无线局域网


  
  温馨提示
网站首页 | 产品展示 | 科技前沿 | 行业资讯
本公司专业研发、设计、生产、销售贴片电感、插件电感、功率电感、大电流电感、扁平线圈电感、一体成型电感。
专业电感生产制造商,品质优异、交期快。
在线客服
热线电话