生成AIが工事現場の監視を変える「VLモニター」
東洋建設株式会社は、工事現場の監視業務を大きく効率化する新しいシステム「生成AI映像分析システム(VLモニター)」を開発しました。このシステムは、最新の生成AI技術を使って、現場のカメラ映像から状況をリアルタイムで分析し、安全管理をサポートします。
生成AIと「Vision-Language Model(VLM)」とは?
「生成AI」とは、まるで人間のように文章や画像を新しく作り出すことができるAIのことです。最近話題のChatGPTもその一つですね。
この「VLモニター」には、「Vision-Language Model(VLM/視覚言語モデル)」という、画像と文章の両方を同時に理解して処理できる生成AI技術が使われています。これにより、AIがカメラの映像を見て、そこに何が映っているかを言葉で説明したり、危険な状況を判断したりすることが可能になります。
「VLモニター」の仕組み
「VLモニター」は、現場に置かれたパソコンと、インターネット上にあるAIサービス(クラウド型AIサービス)を連携させて動きます。この連携には「API(Application Programming Interface)」という、異なるソフトウェア同士が情報をやり取りするための仕組みが使われています。
具体的には、以下の手順で監視が行われます。
- 映像の切り出し: 工事現場のカメラ映像から、決められた間隔で画像を自動的に切り出します。
- AIへの指示: 切り出した画像と一緒に、現場職員があらかじめ登録した指示文(「プロンプト」と呼びます。AIへの質問や命令のことです)をAIに送ります。
- 状況分析と通知: 生成AIは、画像とプロンプトをもとに現場の状況を分析し、その結果を文章で説明したり、音声で知らせたりします。
さらに、パソコン画面の映像上で「警戒エリア」を設定することもできます。もし、プロンプトで指定した人物や物体がこの警戒エリアに入った場合、システムが警告文で危険を通知します。

これまでのAI監視との違い
これまでの画像認識AI技術では、作業員や船舶といった監視したい対象物を、あらかじめAIに学習させる必要がありました。そのため、学習させていない対象は認識できませんでした。
しかし、「VLモニター」に使われている生成AIは、監視対象だけでなく、作業の状況や現場の変化なども柔軟に分析できます。これにより、現場職員は工事内容に合わせてプロンプトを調整するだけで、効率的な監視が行えるようになります。

今後の展望
生成AIは、プログラミングコードを作ることも可能です。この「VLモニター」による映像分析結果を、作業機械や計測機器と連携させることで、既存の技術をさらに高度にしたり、新しい技術開発を進めたりすることが期待されます。
東洋建設は、この技術を活用し、国土交通省が進める建設現場の自動化や省人化を目指す「i-Construction2.0」の実現に取り組んでいくとのことです。
この技術に関する詳細は、東洋建設株式会社のウェブサイトで確認できます。

