AIが現実世界を理解する新しい基盤「世界基盤モデル」とは
自動車技術で世界をリードするヴァレオと、カメラを使った分散型ネットワークを提供するNATIX Networkが、これからのAI開発を大きく進めるための提携を発表しました。両社は協力して、AIが現実世界をまるで人間のように理解し、予測できる「世界基盤モデル(WFM)」をオープンソースで構築します。
近年、自動運転車やロボットの技術は目覚ましい進歩を遂げていますが、これには高品質な現実世界のデータが不可欠です。ヴァレオのAIに関する深い知識と、NATIXが持つ360°の広範囲な現実世界データネットワークが組み合わされることで、物理的な世界での動きや、もの同士の関わり合いをAIが学習し、将来を予測できるようになります。これは「フィジカルAI」と呼ばれる、物理世界で機能するAIの発展を加速させるものです。

「次に何が起きるか」を予測するAI
私たちが普段使っているAIの多くは、「今何が起きているか」を認識することに特化しています。しかし、この新しいマルチカメラ世界基盤モデルは、さらに一歩進んで「次に何が起きるか」を予測する能力を持ちます。
これは、AIが物理的な環境で物事を考え、将来の状態を予測し、適切な行動をとることを可能にする技術です。まるで大規模言語モデル(LLM)がテキストを理解し、次の言葉を予測するように、世界基盤モデルは物理的な世界を理解し、未来の出来事を予測します。これにより、自動運転車などが予期せぬ状況にもより安全に対応できるようになると期待されています。
オープンソースでAI開発を加速
ヴァレオとNATIXは、この世界基盤モデルをオープンソース(誰もが自由に利用・改良できる公開されたプログラム)として開発します。モデルだけでなく、学習に使うデータやトレーニングツールも公開することで、世界中の開発者や研究者がこの技術をさらに発展させ、地域や走行条件に合わせたフィジカルAIの検証を行えるようにします。
この取り組みは、ヴァレオが開発した、主に前方カメラの映像から学習する2つのオープンソースフレームワーク「VaViM(Video Autoregressive Model)」と「VaVAM(Video-Action Model)」を基盤としています。これに、NATIXが過去7ヶ月間で収集した10万時間以上のマルチカメラ走行データ(合計60万時間以上のビデオデータ)が加わります。NATIXは、米国、欧州、アジアの実際の車両から継続的にデータを集めるマルチカメラネットワークを構築しており、テスラ車のカメラを利用した「VX360」や、スマートフォンアプリ「Drive&」を通じて、この膨大なデータを収集しています。
世界基盤モデルが前方視界だけでなく、複数のカメラからの情報を取り入れることで、AIは自動運転車やロボットが実際に活動する上で必要な、より完全な空間認識能力を獲得することになります。
ヴァレオとNATIXについて
ヴァレオ
ヴァレオは、モビリティをより安全に、よりスマートに、そしてより持続可能にするためのイノベーションを追求するテクノロジー企業です。電動化の加速、先進運転支援システム(ADAS)の進化、車内体験の革新、そしてあらゆる場所でのライティング技術において、技術的・産業的なリーダーシップを発揮しています。
より詳しい情報は、ヴァレオのウェブサイトをご覧ください。
NATIX
2020年に設立されたNATIX Networkは、カメラを活用した分散型物理インフラネットワーク(DePIN)のグローバル企業です。同社の「VX360」は、テスラ車のカメラを使って360°のマルチカメラ映像を収集し、ロボットや自動運転といったフィジカルAIアプリケーションに革新的なソリューションを提供しています。また、スマートフォンアプリ「Drive&」を通じて、リアルタイムの地理空間データを収集し、スマートな地図作成やスマートシティソリューションを支援しています。
NATIXは、Messari社のレポート「State of DePIN 2024」において、世界最大の分散型マルチカメラ・データネットワークを運営していると評価されており、265,000人以上のドライバーが参加し、総走行距離は2億2,000万キロメートルを超えています。
より詳しい情報は、NATIX Networkのウェブサイトをご覧ください。

