高密度主机托管和企业数据中心的冷却系统考虑因素

当前,在计算机技术领域的最新进展以及高性能CPU和GPU的日益普及使得企业用户们能够在计算机分析方面达到新的高
摘要

当前,在计算机技术领域的最新进展以及高性能CPU和GPU的日益普及使得企业用户们能够在计算机分析方面达到新的高度,包括使用大数据分析、人工智能、高频交易、石油和天然气研究以及网络规模化商业模式。对于这些技术普及采用的快速增长已经超过了大多数主机托管和企业基础设施大规模冷却这些高度密集的服务器机架的能力。

虽然许多基础设施均承诺能够以每平方英尺一瓦特为基础,以便能够为高于标准服务器机架密度的计算机系统提供冷却的能力,但是许多基础设施(如果不是全部的话)均无法大规模地实现对于如此高密度的新的计算机系统的有效管理。故而主机托管和企业数据中心必须考虑这些新的计算机如何在数据中心环境中进行交互,了解可用于冷却这些密集服务器的各种解决方案,并构建可支持当前和未来使用的最新计算机机架的基础架构。

随着当前的IT企业组织对于高密度计算机使用的不断增加,运行这些先进系统的要求也在相应提升。推动更高效的数据中心是与数据中心建筑物的电源使用效率(PUE)密切相关的主题,而后者的定义计算公式为:(数据中心总设备能耗)/(IT设备的能耗)。对于高性能计算(HPC)集群和高密度计算机架而言,其每台机架的功率密度高达100 kW,有时甚至更高,每台机架的平均密度估计为35 kW。

故而当前的建筑物业主、主机托管设施、企业数据中心、Web规模化企业、政府机构、大学和国家级的研究实验室都在积极努力的升级其冷却基础设施,以便不仅能够为这些新的计算机系统所产生的热量提供冷却散热,并且与此同时还要尽可能的减少或消除它们对建筑的能源消耗量或PUE的影响。

当前在石油和天然气勘探研究、金融交易机构、网络营销等行业中对于“大数据分析”技术的快速采用进一步突显了对数据中心高效冷却的需求。这是因为世界上大多数的计算机服务器机房和数据中心都没有配备或准备好处理当前和下一代服务器计算机所产生的大量热负荷。如果我们假设由高密度计算机所消耗的功率都100%的转换为热能的话,那么也就很容易理解“为什么当下的企业数据中心必须要以有效且高效的方式去除这些热量”这一议题会成为业界广泛关注的焦点了。

研究高密度计算机系统的冷却解决方案

1、浸没式冷却方案

新的超高性能计算机芯片能够让HPC系统的设计人员们开发出每台机架可达100 kW的特殊集群,并且几乎可以超越目前所有可用的服务器冷却方法。浸没式冷却系统提供填充有特殊设计的非导电介电液体的槽,允许整个服务器浸没在液体中,而不会跨计算机电路产生电导的风险。这些高效系统可以消除高密度计算机系统产生的热量高达100%。一旦这些热量被转移到介电流体中,然后就可以通过热交换器,泵和闭环冷却系统很容易地移除了。

通常,传统的企业数据中心为了能够顺利部署采用新的浸没式冷却系统,都需要进行翻新。包括CRAC、高架地板和垂直服务器机架等传统的冷却设备都将被浸没式的液体槽和更新的闭环温水冷却系统所取代。这些液体槽水平安置在地板上,为IT人员提供了一大新的优势,但却是以占据了每平方英尺高成本的数据中心占地面积空间为代价的。服务器由其所有者或第三方通过移除可能受到电介质流体负面影响的组件被修改——例如硬盘驱动器和原始设备制造商(OEM)可能无法保证的其他组件。考虑到对于相关基础设施所实施的这些巨大改变将极大地限制企业未来的OEM服务器选项,并且仅限于具有专用浸入式冷却技术的服务器机房使用,故而企业数据中心应该专门考虑未来的服务器更新选项。

虽然浸入式冷却为世界上最极端的HPC系统提供了极高的效率,但这种HPC系统的普遍稀缺性及其所需的对于基础设施升级和维护方面的挑战是目前市场广泛对其普及接受的一大难题。

4

图一:浸没式冷却

2、直接到冷却芯片,片上冷却方案

最近,直接冷却到芯片或片上冷却技术在HPC行业取得了重大进展。小型散热器被直接连接到计算机的CPU和GPU,从而创建了高效的紧密耦合服务器散热。来自服务器的高达70%的散热将由直接到芯片的散热器收集,并通过小型的毛细管系统传输到冷却液分配单元(CDU)。然后,CDU将热量传递到单独的闭环冷却系统,以排出来自计算机房的热量。其热平衡使得30%或更多的热量被拒绝进入到现有的服务器房间冷却基础设施。

本站推荐
热门文章
标签