战胜DIMM近存核算体系的通讯瓶颈清华软件界说芯片团队提出DIMM间播送技能

发布时间:2022-06-25 07:48:36 来源:ub8登录1.0 作者:ub8登录1.0 ub8登录1.0

  该陈述针对DIMM(双列直插式存储模块)近存核算架构的通讯瓶颈问题,提出了根据DIMM间播送技能的通讯优化办法。该办法充分运用了内存总线播送的可扩展性以及播送机制的广泛适用性,为DIMM近存核算的通讯优化供给了强有力的新东西。

  陈述人孙伟艺是论文榜首作者(如图1所示),现在正在清华大学集成电路学院攻读博士学位。论文通讯作者是刘雷波教授,首要合作者还有李兆石、尹首一等。△ 图1 孙伟艺同学陈述论文的首要作业

  当时,跟着数据密集型运用的广泛布置,传统主存体系已难以应对日益增长的容量和带宽需求。为应对这一应战,诸多近存核算架构被相继提出,其间根据DIMM的近存核算架构是公认最具潜力的架构之一(如图2所示)。

  该架构把核算逻辑集成到DIMM的缓存芯片上,经过让内存通道内多个DIMM并行访存和核算,完成较高的总访存带宽,然后以较低的规划与出产价值取得较高的功能提高潜力。但是,DIMM近存核算体系的功能提高依赖于DIMM数量的添加,但现有DIMM间根据内存总线的点对点通讯机制却或许严峻约束体系功能相关于DIMM数量的可扩展性。

  详细来说,当一个内存通道内DIMM数量添加时,每个DIMM分配到的均匀点对点通讯带宽敏捷减小,关于许多重要的数据密集型运用,各个DIMM和CPU之间的通讯主导了程序的运转时刻,极大约束了体系的全体功能。△ 图2 根据DIMM的近存核算架构

  从硬件视点来看,总线体系在物理层面上天然支撑播送,且主存总线的有用播送带宽跟着DIMM数量的添加而天然扩展。而从软件视点来看,很多数据密集型运用都能以“播送主导”的方法完成。

  根据上述主意,团队规划了ABC-DIMM体系,经过在主存中完成并运用“DIMM间播送”来消除DIMM近存核算架构中的通讯瓶颈。该体系由三部分构成。

  首要,团队规划了辅导程序员以播送主导方法完成各类运用的“播送-核算”编程结构,然后让软件可以充分运用“DIMM间播送”来优化通讯。如图3(a)所示,它经过切割输出来区分使命,而使命间的通讯则由输入数据的播送所主导。

  其次,团队供给了“内存通道内”和“内存通道间”的完好“DIMM间播送”机制,如图3(b)(c)所示。运用这些机制,“播送-核算”结构在多内存通道下的通讯可以得到高效的完成,如图3(d)所示。

  最终,团队为“DIMM间播送”机制供给了全栈式的硬件和API规划。为使体系完成尽或许地简略和低价,团队将规划开支和规模成功控制在了DIMM缓存芯片以及CPU的内存控制器之内。详细而言,经过在缓存芯片中参加指令翻译模块,“DIMM间播送”可以在不更改DRAM芯片的前提下以新DDR指令的方式融入主存体系中。此外,经过对内存控制器的有限修正以及相应的API规划,“DIMM间播送”可以在不更改ISA的前提下被软件有用运用。

  模仿评价显现,ABC-DIMM的均匀功能别离达到了两个干流基线余年,魏少军、刘雷波教授团队在软件界说芯片范畴取得了多项重要技能打破,关键技能在多项国家严重工程中得到批量运用,曾获国家技能创造二等奖、教育部技能创造一等奖、电子学会技能创造一等奖、我国创造专利金奖、世界互联网大会15项世界互联网抢先科技效果等。△ 图3(a)“播送-核算”编程结构(b)内存通道内的播送机制

  (c)内存通道间的播送机制(d)多内存通道下“播送-核算”结构通讯部分的多核完成

  ISCA(International Symposium on Computer Architecture,世界核算机体系结构大会)是提出或发现核算机体系结构新思想、新办法和新效果的重要世界会议,被誉为核算机体系结构范畴最威望的会议之一,与MICRO、HPCA 并称为体系结构三大顶会。超标量架构、多级缓存、同步多线程和缓存一致性等都在ISCA上初次被提出。自1973年以来,ISCA已成功举行48届。

  原标题:《战胜DIMM近存核算体系的通讯瓶颈,清华软件界说芯片团队提出DIMM间播送技能 ISCA 2021》

上一篇:通化市应急办理局应急指挥无线通信网建设项目公开招标公告 下一篇:嘉环科技建立新公司经营范围含5G通讯技术服务