GMOインターネットが提供する、生成AIの開発に役立つ「GMO GPUクラウド」に、新しい機能が加わりました。この新機能は、AIの計算にとても大切なコンピューターの「頭脳」であるGPUサーバーの動きを分かりやすく見せてくれる「モニタリングダッシュボード」です。この機能を使うことで、AI開発者はGPUサーバーをより効率的に使えるようになります。

モニタリングダッシュボード機能の詳細
AIを開発する際には、たくさんの計算をGPUサーバーに実行させます。この計算の指示を「ジョブ」と呼びます。これまでのAI開発では、たくさんのジョブが同時に動いたり、順番を待ったりする中で、それぞれのジョブが今どうなっているのか、GPUサーバーがどれくらい忙しいのかを把握するのが大変でした。
こうした課題を解決するため、今回追加されたのが「モニタリングダッシュボード」機能です。これは、「Grafana(グラファナ)」という、データをグラフなどで分かりやすく見せるためのツールを活用しています。このダッシュボードを使うと、GPUサーバーの動きや、ジョブがどのように実行されているか(Slurmというジョブ管理システムで管理されています)を、一目で確認できるようになります。

ダッシュボードで確認できること
このダッシュボードでは、例えば次のような情報が一画面上で分かります。
-
パーティション(GPUサーバーの区切り)における実行中のジョブ数
-
パーティションにおける待機中のジョブ数
-
ユーザー別の実行中のジョブ数
-
ユーザー別の待機中のジョブ数
これらの情報を確認することで、
- ジョブの実行時間の調整: ジョブが集中している時間帯が分かれば、別の時間にずらすことで、よりスムーズに計算を進められるでしょう。
- GPUの利用効率の最適化: 一定時間内におけるGPUがどれくらい使われているか(利用率)を見ることで、AIの計算方法(パラメーター)を調整し、リソース効率を最適化できます。
この新しいモニタリングダッシュボードは、「GMO GPUクラウド」の「専用プラン」を使っている方なら、追加料金なしで利用できます(共用プランでは利用できません)。

「GMO GPUクラウド」とは
「GMO GPUクラウド」は、生成AIの開発に特化した高性能なクラウドサービスです。特に「NVIDIA H200GPU」という最新のGPUを搭載し、高速なネットワーク「NVIDIA Spectrum-X」と高速ストレージを組み合わせることで、複数のGPUサーバーを連携させる「マルチノード構成」において、国内の商用クラウドサービスの中でもトップクラスの速さを実現しています。
2024年11月に発表された世界スーパーコンピュータランキング「TOP500」では、世界で37位、日本国内では6位にランクインし、商用クラウドとしては国内最速の性能を持つとされています。この高い性能と安定性により、大規模なAIモデル(例えば、ChatGPTのような大規模言語モデル)の学習や、画像・音声など複数の情報を扱うAI(マルチモーダルAI)の開発に最適な環境を提供します。
さらに、2025年内には、NVIDIAの次世代GPUである「NVIDIA Blackwell Ultra GPU」を搭載した「NVIDIA HGX B300」の提供も予定されており、さらなる性能向上が期待されます。
GMOインターネットは、本サービスを通じて、生成AI分野に取り組む企業や研究機関に対し、最適化されたインフラ基盤と、利用者のワークロードに応じた柔軟でカスタマイズ可能な計算環境を提供し、開発期間の短縮とコスト低減に貢献、国内AI産業の発展を促進しています。
「GMO GPUクラウド」についてもっと詳しく知りたい方は、公式サイトをご覧ください。
GMO GPUクラウド公式サイト
今後の展開
GMOインターネットは、「GMO GPUクラウド」を中心に、AI開発のためのITインフラ戦略を進めることで、急速に進化するAI・ロボティクス分野の技術革新に貢献していくとしています。今後も最新のAI計算基盤を提供し、利用者のニーズに応じた柔軟なクラウド環境を整えることで、日本におけるAIの発展に欠かせないクラウドサービスとして、日本発のAIイノベーション創出に貢献していくでしょう。

