FuriosaAI、AIの効率と持続可能性を追求するRNGD NPUをNeurIPS 2025で発表

AI

NeurIPS 2025:AI技術の最先端と「持続可能なAI」

2025年12月2日から7日にかけて、米国カリフォルニア州サンディエゴで、AI分野で最も権威ある学術イベントの一つであるNeurIPS(Neural Information Processing Systems Conference)2025が開催されました。この会議は、Google Scholarのコンピュータサイエンス・AI分野で、著名な科学誌と同等の影響力を持つと評価されています。

今年のNeurIPSでは、段階的に思考する推論能力、クラウド接続なしで動くオンデバイスAI、そしてAIの安全性や倫理に関する議論が主なキーワードとなりました。

特に注目されたのは、「持続可能なAI」というテーマです。AIモデルの構築における環境への影響や、電力消費の効率化に関する議論が活発に行われ、AI半導体の効率向上がその中心的な課題として位置づけられました。

FuriosaAIが披露した次世代AI半導体「RNGD」

AI半導体技術企業のFuriosaAIは、このNeurIPS 2025に「シルバー・パビリオン」として参加し、最高研究責任者(CRO)のカン・ジフン氏が「シリコンからモデルまでのAI効率最適化」と題した発表を行いました。

FuriosaAIのJeehoon Kang氏によるプレゼンテーションスライド

カンCROは、データセンターが処理できるデータ量が電力消費と深く関係していることに触れ、「同じ電力消費でより多くの処理を行うことが、業界全体の課題である」と強調しました。

GPUと専用半導体の課題

現在、AIの計算には主にGPU(画像処理装置)や、Google TPUのような特定の用途に特化した専用半導体(シストリックアレイ方式)が使われています。

  • GPU:データの流れが柔軟で、さまざまな処理に対応できる強みがあります。しかし、AIモデルの学習には有利なものの、推論(学習したAIを使う作業)においては、費用に対して効率が低い場合があります。

  • シストリックアレイ方式:特定の計算(例えば行列の掛け算)に特化しており、個々の計算効率は高いです。しかし、データの流れが固定されているため、用途が限定されるという特徴があります。

RNGDの革新的なアプローチ:TCP(テンソル縮約プロセッサ)

FuriosaAIの「RNGD」は、GPUとシストリックアレイの中間に位置するバランスの取れた技術として、「TCP(テンソル縮約プロセッサ)」を採用しています。カンCROによると、TCPはSRAM(高速なメモリ)を複数の部分に分け、データが柔軟にやり取りされる仕組みです。

SRAM、Systolic Array、TCPのデータ処理フローを示す概念図

シストリックアレイが一方通行のデータフローであるのに対し、RNGDはデータの流れの方向を自由に設定できます。これにより、従来のシストリックアレイが固定サイズの計算しかできなかったのに対し、RNGDはどんなサイズの行列計算でも効率的に処理し、ハードウェアの資源を最大限に活用できるのです。

カンCROは、RNGDのデータフローが処理効率だけでなく、ソフトウェア管理の面でも優れていると説明しました。PyTorchのような高水準のプログラミング言語での演算を直接アーキテクチャに反映でき、FuriosaAIは大規模言語モデル(LLM)サービスを含む独自のソフトウェアスタックを提供しています。

Furiosa SW Stackのソフトウェアアーキテクチャ図

電力効率と量産計画

FuriosaAIは、来年1月から2万枚規模のRNGDチップを量産する計画を明らかにしました。電力効率についても具体的な数値が示され、RNGDは一般的な15kWラックにおいて、NVIDIA H100システムよりも3.5倍多くのトークン(AIが生成するテキストの単位)を生成できるとされています。

LLama 3.1 8B FP8モデル使用時のRNGDとGPUのラックレベルトークン生成性能比較グラフ

これは、AIデータセンターの電力密度を大きく向上させる可能性を示しています。さらに、次世代製品では消費電力(TDP)が現在の180Wを超える400W級になる見込みです。

RNGDは、クラウド環境での効率的な管理と導入を想定し、Kubernetes(コンテナ化されたアプリケーションの管理ツール)をサポートしています。また、専門の開発者が独自の最適なコンパイラやシステムを構築できるよう、低レベルのアクセスAPIも提供されています。

「持続可能なAI」への貢献

NeurIPSで主要テーマとして浮上した「持続可能なAI演算」は、AI技術の発展と環境負荷のバランスをどう取るかという重要な問いかけです。AIモデルを構築する際の電力消費をいかに効率化するかが課題となっており、その解決策の中心にAI半導体の効率向上が位置づけられています。

FuriosaAIのようなNPU(Neural Processing Unit)企業がNeurIPSに参加する理由は、まさにこの解決策を提示するためです。RNGDの本格量産が始まれば、韓国だけでなく世界中のAIデータセンターに導入され、AIの推論効率向上と炭素排出量削減の両立に貢献することが期待されます。今後、「持続可能なAI演算」への関心が高まるにつれて、RNGDのような高効率AI半導体への注目もさらに高まるでしょう。

タイトルとURLをコピーしました