E级超算

百亿亿次超级计算机。

概述:

  百亿亿次超级计算机。按照由美国倡导的国际公认标准,E级超算的功耗应低于20MW。按照这一功耗目标要求,未来的E级超级计算机的能效比要达到50 GFlops/W。

面临的挑战:

  ● 挑战一:访存墙问题

  访存墙问题仍然是提升计算速度的第一大难题,处理器的处理速度和访问速度之间的不匹配,处理器单个引脚的信号传输速度和引脚受限。多核处理器的出现只是提高了计算速度,不但没有缓解访问问题,反而使其变得更加严重。

  ● 挑战二:通信墙问题

  随着超级计算的规模不断增加,互联网络对计算性能的影响越来越大,E级计算对互联网络提出了更高的要求,互联网络已成为制约超级计算机发展的核心因素之一。

  ● 挑战三:可靠性问题

  可靠性:当系统性能由P级向E级扩展时,保存全局检查点的时候可能达到甚至超过系统的MTBF!

  ● 挑战四:能耗墙问题

  能耗墙:ITRS估计高性能CPU的功耗将达到120~200W。世界排名第一Blue Gence的能耗达到7.8MW,如此发展下去E级系统功耗将达3.5GW,超过三峡水电站2008年平均供电能力的三分之一。

  ● 挑战五:并行计算的可扩展性

  上述四堵墙,严重制约并行计算的可扩展性,并行计算机课扩展性度量模型指导着计算机的发展。解决计算机的并行可扩展性的难点在于要素的量纲不统一,事件离散,应用千变万化,系统、技术的千差万别。

  要素的量纲不统一,归约到时间量纲,通过“容错开销”的度量,将可靠性问题的描述统一至时间量纲,进而将可靠性引入加速比公式,对可靠性墙进行量化研究。现有容错方法都会引起可靠性墙,必须研究故障影响系统的规律,探索新的方法。

  通用处理器+专用处理器是异构体系结构的一种解决方案。给予流处理的异构并行体系结构,大规模科学工程应用的可流化理论,大规模科学工程应用的高效流化方法。在可流化路理论和高效流化方法的基础上提出了CPU和流处理器相结合的异构融合并行体系结构。

应用:

  具有重大计算的需求,如全球气候变化模拟、天体物理大数据的处理、模拟宇宙的演化、新型材料验证及无库存核武器仿真等。