AIが「見て」「話す」!現場の課題を解決するVLMの実証実験がスタート
近年、AI技術の進化は目覚ましく、私たちの生活や仕事に大きな変化をもたらしています。その中でも特に注目されているのが、「VLM(Vision Language Model)」という新しいAIです。VLMとは、画像や映像などの「見る情報」と、文章などの「言葉の情報」をまとめて理解できるAIのこと。まるで、AIが私たちの目の代わりになり、見たものを言葉で説明してくれるようなイメージです。
株式会社日立ソリューションズ・テクノロジーは、このVLM技術を使って、現場で働く人々(フロントラインワーカー)の安全管理や業務効率化を助ける実証実験を始めました。

図 VLMを活用した生成AIソリューション
現場が抱える「困った」をAIが解決
工場や建設現場、設備管理の現場などでは、作業の安全確認や手順の記録を効率的に行う仕組みが不足していることが多く、報告書の作成といった事務作業が大きな負担となっています。また、これまでのAIでは、天候や環境によって人や物を間違って認識したり、予期せぬ状況に対応できなかったりする課題がありました。これらが、AIを導入する際の運用コストや手間を増やしてしまう原因になっていたのです。
VLMは、映像の内容を文脈に合わせて深く理解し、その状況を自然な言葉で説明できます。これにより、従来のAIが苦手としていた誤認識や予期せぬ状況の検出精度を高め、安全な行動の確認を簡単に行えるようにしたり、報告書の作成を自動化したりすることが可能になります。
日立ソリューションズ・テクノロジーは、カメラ映像から異常や特定の出来事だけを正確に見つけ出す「画像認識エッジAI技術」を組み込んだ独自の“アダプタ”を開発しています。このアダプタとVLMを組み合わせることで、より高度なソリューションの実証実験を進めています。
新しいソリューションの仕組みと価値
このソリューションは、現場に設置された端末(エッジ端末)でリアルタイムに映像を分析し、その結果をサーバー側のAIが理解・分析します。これにより、現場での素早い状況把握と高い精度での分析を両立し、安全管理の向上と業務の効率化を支援します。
提供される価値
-
複雑な状況をAIが理解し、言葉で説明
独自のアダプタ技術で物体や動きを正確に検出し、VLMがそれらを組み合わせて状況全体を総合的に理解します。これにより、これまでのAIでは難しかった複雑なシーンも、言葉で分かりやすく説明できるようになります。 -
開発・導入、通信コストを削減
VLMを小型化することで、さまざまなオープンソースのAI環境や安価なコンピューターチップにも簡単に導入できます。既存の設備を活かして開発や導入にかかる費用を抑え、異常やイベントが発生した時だけ映像データを送ることで、通信費用も減らすことができます。 -
多様な環境に柔軟に対応
データを外部に出さずに、現場の設備だけで安全かつリアルタイムにAIを運用できるシステム(オンプレミス構成)を実現します。これにより、さまざまな現場の環境や要望に合わせて、最適な運用が可能になります。
実際の現場での活用例
1. 設備監視の自動化(株式会社日立パワーソリューションズ様との実証実験)
設備管理の現場では、人手不足や働き方改革が進む中で、設備の故障や異常を示す表示灯を人が目視で確認し、対応を判断するのが一般的でした。しかし、広い施設での巡回や夜間の監視には多くの人手と時間がかかり、見落としや対応の遅れが課題でした。
この実証では、電力や産業分野の設備保守を行う日立パワーソリューションズで、表示灯の変化をカメラ映像からAIが検知し、VLMがその内容を特定し言葉で伝える仕組みを構築しています。検知結果は自動で報告書になり、管理者へ通知・共有されることで、巡回作業の手間を省き、異常発生時の対応を素早く行うことを目指しています。
2. 駐車場監視・管理業務の効率化(パラカ株式会社様との実証実験)
駐車場の運営では、利用状況や設備の状態を定期的に確認する巡回や報告業務が大きな負担となっています。さらに、設備の不具合や故障がサービス品質の低下や稼働率の低下、修繕コストの増加につながるという経営課題もあります。
この実証では、VLMの特徴を活かし、カメラ映像から「ごみの散乱」「枠外駐車」「フェンスやゲートバーなどの設備破損」「駐車フラップなどの機器不具合」といった異常を自動で検出し、説明できるかを検証しています。これにより、現地での確認や報告業務の手間を省き、異常を早期に把握したり、蓄積されたデータを使って設備維持管理を効率化したりする効果を確認しています。今後は、この成果をもとに、駐車場管理支援システムとしての導入が検討されています。
3. 太陽光発電所における監視業務の高度化・誤検知の低減(アムニモ株式会社様との共同実証実験)
太陽光発電所では、銅線の盗難被害などを防ぐため監視業務が重要ですが、これまでのAI監視システムでは、動物を人と間違えたり、草木の揺れや天候の変化で誤って検知したりすることが多く、現場での運用負担や対応コストの増加が課題でした。
この実証では、熱を感知するサーマルカメラで侵入者を検知し、現場の端末に搭載されたAIが高い精度で物体を見つけ出します。そして、サーバー側のVLMがその状況を分析し説明するハイブリッドな構成を採用しています。日立ソリューションズ・テクノロジーの画像認識エッジAI技術により、現場で素早く映像を分析し、VLMがその結果を文脈的に理解・説明することで、誤検知を減らし、判断の理由を明確にすることを目指しています。
現在、この技術の精度評価や誤検知を減らす効果の検証が進められており、2026年度の実用化に向けて技術の確立を目指しています。
今後の展望
今回の実証実験を通じて得られた成果を活かし、日立ソリューションズ・テクノロジーは、現場で働く人々のデジタル変革(DX)を推進する本格的なソリューション展開を目指しています。また、生成AI技術を活用した新しいソリューションの開発・展開も順次進めていく予定です。
この取り組みを含む最新の生成AI活用事例は、2025年11月19日から21日までパシフィコ横浜で開催される「EdgeTech+ 2025」で紹介される予定です。

