NeurIPS 2025で注目された「持続可能なAI」
2025年12月2日から7日にかけて、米国カリフォルニア州サンディエゴで、神経ネットワークと人工知能の分野で最も権威ある学術イベントの一つであるNeurIPS(Neural Information Processing Systems Conference)2025が開催されました。NeurIPSは、Google Scholarのコンピュータサイエンス/AI分野で、NatureやScienceといった最高峰の科学誌と同等の影響力を持つと評価される、世界最大規模の人工知能学術会議です。
今年のNeurIPSでは、OpenAIのo1モデルに代表されるような段階的思考を行う推論能力、クラウド接続なしでスマートフォンやノートPCで動くオンデバイスAI、そしてAI倫理に関わる安全性やアライメントが主要なキーワードとなりました。
AI効率化の課題とFuriosaAIの挑戦
AI半導体技術企業のFuriosaAIは、このNeurIPSに「シルバー・パビリオン」として参加し、最高研究責任者(CRO)のカン・ジフン氏が「シリコンからモデルまでのAI効率最適化(Optimizing AI Efficiency from Silicon to Model)」をテーマに発表を行いました。

カンCROは、データセンターが扱えるデータ量は電力消費量と深く関係していると指摘し、「同じ電力消費でより多くの処理を行えるようにすることが、AI業界全体の大きな課題である」と説明しました。
GPUと専用半導体の特徴
AIの計算には主にGPU(Graphics Processing Unit)と、Google TPUやAWS Trainiumのような特定用途向けの専用半導体(シストリックアレイ方式)が使われます。
-
GPU:複数のメモリを使い分け、柔軟にデータをやり取りできるのが強みです。このため、AIモデルの学習には向いていますが、すでにあるモデルを使って推論を行う場合には、消費電力やコストに対する効率が低い傾向にあります。
-
シストリックアレイ方式の専用半導体:データが流れる方向が固定されており、行列の計算など特定の処理に特化しています。個々の計算効率は高いものの、用途が限られるという特徴があります。
FuriosaAIのRNGD NPU:柔軟性と効率性の両立
FuriosaAIのNPU(Neural Processing Unit)「RNGD」は、GPUとシストリックアレイの中間に位置するバランスの取れた性能を提供します。その中心にあるのが「テンソル縮約プロセッサ(TCP)」という技術です。

RNGDのTCPは、SRAMという高速なメモリを複数の「スライス」に分け、データの流れ(データフロー)を自由に設定できるのが特徴です。従来のシストリックアレイが固定サイズの行列しか扱えなかったのに対し、RNGDはどんなサイズの行列計算でも分割して処理できるため、ハードウェアの資源を最大限に活用できます。
カンCROは、「RNGDのデータフローは、処理効率だけでなく、ソフトウェアでの管理もしやすい」と述べました。PyTorchなどの高水準な演算を直接ハードウェアにマッピングできるため、開発者は結果を確認しやすく、FuriosaAIはLLM(大規模言語モデル)サービスを含む独自のソフトウェアスタックを提供しています。

電力効率と今後の展望
FuriosaAIは、来年1月からRNGDチップを2万枚規模で量産する計画を明らかにしました。電力効率についても具体的な数値が示され、RNGDは15kWのラックを基準とした場合、NVIDIA H100システムよりも3.5倍多くのトークン(AIの処理単位)を生成できると説明されています。これにより、データセンターの電力密度をさらに高めることが期待されます。

さらに、RNGDはクラウド環境での効率的な管理と導入を想定し、Kubernetes(コンテナ管理ツール)をサポートしているほか、専門の開発者が独自のコンパイラやシステムを構築できるようなAPIも提供しています。
「持続可能なAI演算」への貢献
NeurIPSでは、AI倫理に関する議論が活発に行われており、「機械学習による気候変動への対応」をテーマとしたワークショップでは、AIモデルを構築する際の気候への影響やコスト、そしてより効果的なAIアプローチについて議論されました。AIの構築に必要な電力消費をいかに効率化するかが焦点となり、その中心にAI半導体の効率向上が位置づけられています。
FuriosaAIのRNGDは、来年1月からの量産開始により、韓国だけでなく世界中のAIデータセンターに導入されることで、炭素排出量の削減とAI推論効率の向上の両立に貢献すると期待されます。「持続可能なAI演算」への関心が高まるにつれて、RNGDのような高効率AI半導体への注目もさらに高まるでしょう。

