NVIDIAは、現実世界で動き、判断するAI、つまり「フィジカルAI」の開発を加速させるための画期的な仕組み「NVIDIA Physical AI Data Factory Blueprint」を発表しました。

フィジカルAIとは?
フィジカルAIとは、ロボットや自動運転車のように、私たちの周りの物理的な世界で実際に動いたり、ものを見たりして判断するAIのことです。これらのAIを賢く育てるためには、たくさんのデータから学ぶ必要があります。
「データの工場設計図」で開発を効率化
しかし、フィジカルAIに必要なデータ(たとえば、珍しい状況での車の運転データや、複雑な作業をするロボットの動きのデータなど)を集めるのは、とても時間やお金がかかり、難しいのが現状でした。
NVIDIAが発表した「Physical AI Data Factory Blueprint」は、この課題を解決するための「データの工場設計図」のようなものです。この設計図を使うことで、限られたデータから、AIが学ぶための大規模で多様なデータを効率的に作り出し、管理できるようになります。
このブループリントは、以下のようなステップでAI開発をサポートします。
-
データの整理と探し出し: 大量の実世界データやシミュレーションで作られたデータを処理し、AIが使いやすいように整えます。「NVIDIA Cosmos Curator」がこの役割を担います。
-
データの拡大と多様化: 整理されたデータを何倍にも増やし、さまざまな環境や条件でのデータを生成します。これにより、めったに起こらないような珍しい状況(エッジケース)にも対応できるAIを育てられます。
-
データの評価と確認: 生成されたデータがAIの学習に適しているか、物理的に正確かなどを自動でチェックします。「NVIDIA Cosmos Evaluator」がこの役割を果たします。
開発をもっとスムーズに!オーケストレーションの力
フィジカルAIの開発では、たくさんの複雑なAIシステムを動かす必要があります。これを手作業で行うのは大変ですが、オープンソースのオーケストレーションフレームワーク「NVIDIA OSMO」は、これらの作業を自動で管理し、開発者がAIモデルの作成に集中できるようにサポートします。
クラウドサービスや様々な企業との連携
このブループリントは、Microsoft AzureやNebiusといった大手クラウドサービスプロバイダーのインフラと統合されます。これにより、開発者は強力なコンピューティング能力を使って、大量のトレーニングデータを効率的に処理できるようになります。
すでに、FieldAI、Hexagon Robotics、Linker Vision、Milestone Systems、Robo Force、Skild AI、Teradyne Robotics、Uberといった様々な分野の主要企業が、このブループリントを活用して、ロボティクスや自動運転車の開発を加速させています。
たとえば、Uberは自動運転車の開発に、Skild AIは汎用ロボットの基盤モデル開発にこの技術を使っています。NVIDIA自身も、自動運転向けの視覚言語行動モデル「NVIDIA Alpamayo」のトレーニングと評価にこのブループリントを活用しています。
今後の展開
この「NVIDIA Physical AI Data Factory Blueprint」は、2026年4月にGitHubで一般公開される予定です。これにより、より多くの開発者がフィジカルAIの最前線に立つことができるようになるでしょう。
NVIDIA創業者/CEOのジェンスン・フアン氏によるGTC基調講演のリプレイや、関連するセッションも視聴できます。
NVIDIAに関する詳しい情報は、NVIDIA公式サイトをご覧ください。

