GMOインターネット、生成AI開発を効率化する「GMO GPUクラウド」にモニタリング機能を追加

AIツール・サービス紹介

GMOインターネットが提供する、生成AIの開発に役立つ「GMO GPUクラウド」に、新しい機能が加わりました。この新機能は、AIの計算にとても大切なコンピューターの「頭脳」であるGPUサーバーの動きを分かりやすく見せてくれる「モニタリングダッシュボード」です。この機能を使うことで、AI開発者はGPUサーバーをより効率的に使えるようになります。

GMO GPUクラウドのモニタリングダッシュボード機能

モニタリングダッシュボード機能の詳細

AIを開発する際には、たくさんの計算をGPUサーバーに実行させます。この計算の指示を「ジョブ」と呼びます。これまでのAI開発では、たくさんのジョブが同時に動いたり、順番を待ったりする中で、それぞれのジョブが今どうなっているのか、GPUサーバーがどれくらい忙しいのかを把握するのが大変でした。

こうした課題を解決するため、今回追加されたのが「モニタリングダッシュボード」機能です。これは、「Grafana(グラファナ)」という、データをグラフなどで分かりやすく見せるためのツールを活用しています。このダッシュボードを使うと、GPUサーバーの動きや、ジョブがどのように実行されているか(Slurmというジョブ管理システムで管理されています)を、一目で確認できるようになります。

モニタリングダッシュボードの提供背景を示す画像

ダッシュボードで確認できること

このダッシュボードでは、例えば次のような情報が一画面上で分かります。

    • パーティション(GPUサーバーの区切り)における実行中のジョブ数

    • パーティションにおける待機中のジョブ数

    • ユーザー別の実行中のジョブ数

    • ユーザー別の待機中のジョブ数

これらの情報を確認することで、

  • ジョブの実行時間の調整: ジョブが集中している時間帯が分かれば、別の時間にずらすことで、よりスムーズに計算を進められるでしょう。
  • GPUの利用効率の最適化: 一定時間内におけるGPUがどれくらい使われているか(利用率)を見ることで、AIの計算方法(パラメーター)を調整し、リソース効率を最適化できます。

この新しいモニタリングダッシュボードは、「GMO GPUクラウド」の「専用プラン」を使っている方なら、追加料金なしで利用できます(共用プランでは利用できません)。

ダッシュボードのイメージ画像

「GMO GPUクラウド」とは

「GMO GPUクラウド」は、生成AIの開発に特化した高性能なクラウドサービスです。特に「NVIDIA H200GPU」という最新のGPUを搭載し、高速なネットワーク「NVIDIA Spectrum-X」と高速ストレージを組み合わせることで、複数のGPUサーバーを連携させる「マルチノード構成」において、国内の商用クラウドサービスの中でもトップクラスの速さを実現しています。

2024年11月に発表された世界スーパーコンピュータランキング「TOP500」では、世界で37位、日本国内では6位にランクインし、商用クラウドとしては国内最速の性能を持つとされています。この高い性能と安定性により、大規模なAIモデル(例えば、ChatGPTのような大規模言語モデル)の学習や、画像・音声など複数の情報を扱うAI(マルチモーダルAI)の開発に最適な環境を提供します。

さらに、2025年内には、NVIDIAの次世代GPUである「NVIDIA Blackwell Ultra GPU」を搭載した「NVIDIA HGX B300」の提供も予定されており、さらなる性能向上が期待されます。

GMOインターネットは、本サービスを通じて、生成AI分野に取り組む企業や研究機関に対し、最適化されたインフラ基盤と、利用者のワークロードに応じた柔軟でカスタマイズ可能な計算環境を提供し、開発期間の短縮とコスト低減に貢献、国内AI産業の発展を促進しています。

「GMO GPUクラウド」についてもっと詳しく知りたい方は、公式サイトをご覧ください。
GMO GPUクラウド公式サイト

今後の展開

GMOインターネットは、「GMO GPUクラウド」を中心に、AI開発のためのITインフラ戦略を進めることで、急速に進化するAI・ロボティクス分野の技術革新に貢献していくとしています。今後も最新のAI計算基盤を提供し、利用者のニーズに応じた柔軟なクラウド環境を整えることで、日本におけるAIの発展に欠かせないクラウドサービスとして、日本発のAIイノベーション創出に貢献していくでしょう。

関連情報

タイトルとURLをコピーしました