AIを動かす高性能サーバーの冷却技術、国内での実用化へ前進!

AI

AI時代の電力消費を抑える!水冷GPUサーバーの効率運用に成功

AI(人工知能)やHPC(高性能計算)が私たちの生活やビジネスにますます深く関わるようになり、これを支える高性能なコンピューター「GPUサーバー」の需要が急増しています。特に、たくさんの計算を素早くこなすGPUサーバーは、熱をたくさん出すため、効率的に冷やす技術がとても重要になります。

日本ではまだ「空冷式」という空気で冷やすタイプのデータセンターが主流ですが、海外では水を使って効率よく冷やす「水冷式」のGPUサーバーが増えています。この状況を受け、NTTPCコミュニケーションズ株式会社、株式会社ゲットワークス、株式会社フィックスターズの3社は、水冷GPUサーバーを国内で効率的に運用するための新しい実験(PoC:概念実証)に取り組みました。

持ち運びできるデータセンターで高い電力効率を達成

今回の実験では、持ち運び可能な「コンテナ型データセンター」の中に水冷GPUサーバーを設置し、データセンター全体、GPUサーバー、そしてソフトウェアの連携を細かく調整しました。その結果、データセンターの電力のムダを測る指標である「pPUE(ピーピーユーイー)」で、1.114という非常に優れた数値を記録しました。この数値は、大規模なデータセンターでも達成が難しいとされる範囲で、水冷GPUサーバーが商用利用でどれだけ役立つかをはっきりと示しています。

GPU平均温度推移 (水冷vs空冷)

実験では、水冷GPUサーバーが空冷GPUサーバーに比べて、GPUの平均温度を約15度も低く保てることを確認しました。これにより、GPUが安定して最高の性能を発揮できるようになります。

さらに、サーバーの負荷や温度をリアルタイムで監視し、冷却システムを最適にコントロールするシステムも構築。この統合的な管理によって、運用効率を最大限に高めることができました。

統合モニタリングシステムによる検証結果の画面

このPoCの詳しいレポートは、以下のリンクからご覧いただけます。

各社が協力して実現

今回の成功は、3社の専門知識と技術が結集した結果です。

  • NTTPCコミュニケーションズ株式会社:大規模なGPUクラスターを運用してきた経験から、ハードウェア技術の面で検証を主導しました。

  • 株式会社ゲットワークス:コンテナ型データセンターの提供と、最適なサーバー稼働環境の構築を担当しました。

  • 株式会社フィックスターズ:水冷GPUサーバーと冷却設備を提供し、コンテナ内の環境やハードウェア、ソフトウェアをまとめて管理するモニタリングツールを開発しました。

これからの展望

高性能なAIを動かすGPUサーバーの需要は、これからもどんどん増えていくでしょう。これに伴い、水冷GPUサーバーの必要性も高まると考えられます。

今回の成功を足がかりに、3社は引き続き協力し、日本国内でコンテナ型データセンターを使った水冷GPUサーバーがさらに広く利用されるよう、取り組んでいくとのことです。AI技術の進化を支えるインフラの発展に期待が寄せられます。

タイトルとURLをコピーしました