FastLabel株式会社は、NVIDIAが主催する世界最大級のAIカンファレンス「GTC 2026」において、同社が開発した次世代AIデータキュレーション技術を発表しました。

AIを賢くするためのデータ選別技術
AI(人工知能)を開発する上で、AIに学習させるデータの質はとても重要です。しかし、たくさんの画像データの中から、AIにとって本当に役立つデータだけを選び出すのは大変な作業でした。特に、似たような画像がたくさんあると、AIが「これはもう知っている」と判断してしまい、実は大切な違い(例えば、歩行者がいるかいないかなど)を見逃してしまうことが課題でした。
FastLabelの新しい技術は、VLM(Vision-Language Model、画像と言葉を同時に理解するAI)という高度なAIと、NVIDIA NeMo Curatorというデータ整理ツールを組み合わせることで、この課題を解決します。この技術を使うと、画像の内容を「意味」で判断し、AIがまだ知らない、あるいは特に重要ないくつかのシーンをきちんと選び出すことができるようになります。
新技術がもたらす3つの大きなメリット
このデータ選別技術には、主に3つの大きなメリットがあります。
1. 高品質なデータ選別
従来の技術では、見た目が似ているかどうかでデータを判断していましたが、FastLabelの技術は、AIが学習する上で「意味のある違い」を識別します。これにより、AIがより幅広い状況に対応できるようになり、特に自動運転のような、少しのミスも許されない分野での安全性が大きく向上します。
2. コストと時間の最適化
大量の画像データを処理するには、通常、膨大な時間と費用がかかります。しかし、この技術を使えば、10,000枚の画像をわずか4分で処理できるほどの速さで、不要な重複データを効率的に減らすことができます。これにより、AIの学習にかかるコストや時間を大幅に削減することが可能です。
3. モデル性能の最大化
AIは、たくさんの「ありふれたシーン」を学習するよりも、「珍しいけれど重要なシーン」を重点的に学習することで、より賢く、実世界で役立つ性能を発揮します。この技術は、そのような「クリティカルなシーン」を高密度に集めることで、AIの学習効率を高め、実際の環境での応用力を向上させます。
この技術に関する詳細はこちらで確認できます。
ロボット開発への応用
FastLabelは、この技術をさらに進化させ、ロボット開発の分野にも応用していく計画です。例えば、ロボットが作業する動画データから、タスクの始まりや終わり、あるいは普段とは違う動き(異常値)を自動で見つけ出し、質の高い学習データとして活用します。また、ロボットのアームの動きなど、画像だけでは捉えにくい情報もデータとして扱い、ロボットの「異常な姿勢」や「見たことのない動き」を特定することにも役立てていきます。
この取り組みは、AIが「データが命」という考え方(Data-centric AI)に基づき、自動運転から、実際に動くロボットまで、さまざまな最先端のAI技術の発展を加速させることを目指しています。
FastLabel株式会社について
FastLabel株式会社は、AI開発を支えるデータ基盤の構築を専門とする企業です。データの収集、作成、アノテーション(データに意味付けをする作業)、AIモデルの開発、そしてデータの運用まで、AI開発に必要な一連のプロセスを包括的にサポートしています。近年では、ロボット基盤モデルやVLA(Vision-Language-Action)モデルの開発を支えるデータパイプラインの構築に力を入れています。
FastLabelのロボティクス関連サービスについてはこちらをご覧ください。

