ZREK、製造現場向けに「意味」を理解する視覚言語モデル(VLM)の開発を開始
フィジカルAIを製造業に特化して開発する株式会社Zrek(ゼレック)は、製造業および物流分野の課題解決を目指し、独自のVision-Language Model(VLM:視覚言語モデル)の開発を開始しました。

VLM(視覚言語モデル)とは?
VLMとは、画像や動画の内容と、それを説明する自然な言葉を同時に理解できるAIモデルのことです。
従来の画像認識AIは、物の「位置」や「寸法」、「数値」に基づいて何かを判断するのが得意でした。しかしVLMは、
-
「部品がずれている」
-
「正しく取り付けられていない」
-
「今はこの作業工程が行われている」
といった、人が普段言葉で表現するような「状態」や「意味」を、画像や動画から直接理解できるのが大きな特徴です。これにより、より人間らしい感覚で現場の状況を把握できるようになります。
現場での活用事例
製造業における目視検査
少量多品種生産のように、人の目で確認することが避けられない工程において、VLMは「どこがおかしいのか」「どのような状態がNGなのか」といった判断をAIが理解し、作業者をサポートします。
作業動画の理解・検索・ラベル付け
製造現場や物流現場では、多くの作業動画が記録されています。しかし、「見たいシーンを探すのが大変」「せっかく撮った動画を十分に活用できていない」という声も聞かれます。VLMを活用することで、作業内容や状態を言葉で検索し、必要な情報を素早く確認できる環境が実現すると期待されています。
物流現場での作業確認・トレーサビリティ
荷物の投入、仕分け、積み込みといった物流の各工程を動画で把握し、「いつ、どのタイミングで、何が行われたか」を瞬時に確認できる仕組みに応用することも可能です。
実証パートナーを募集
ZREKでは現在、VLMの技術を実際の現場で試すための実証検証(PoC)に協力してくれる企業を募集しています。
特に、以下のような課題を持つ製造業や物流業の企業が対象です。
-
人手による判断が多く、特定の担当者に業務が集中している工程
-
動画は撮影しているものの、そのデータを十分に活用できていない業務
実際の現場データを使った検証を通じて、ZREKは企業とともに解決策を見つけたいと考えています。関心のある企業は、気軽に問い合わせが可能です。
株式会社Zrek 会社概要

| 項目 | 内容 |
|---|---|
| 社名 | 株式会社Zrek(ゼレック) |
| 代表者 | 代表取締役CEO 今村優希 |
| 所在地 | 〈東京本社〉東京都渋谷区神南1-6-12 B1F |
| 事業内容 | ソフトウェアおよびハードウェアの開発 |
| 設立 | 2021年4月 |
| 従業員数 | 12名(業務委託含む) |
| 公式HP | https://www.zrek.org |
ZREKの求人情報
ZREKでは、デザイナーやエンジニアをはじめとする専門人材を、正社員、副業、長期インターンシップ、業務委託など多様な形で募集しています。シニア層やエキスパート層の参加も歓迎しており、技術リードやアドバイザリーなど、柔軟な働き方が可能です。
募集職種や歓迎される経験は以下の通りです。
-
ハードウェアのプロダクトデザイナー
-
AI/ロボティクスエンジニア(強化学習/模倣学習/ROS 2)
-
協働ロボットのシステムインテグレーション経験者
-
LLM/VLM/VLA を用いた開発経験者
-
NVIDIA Isaac Sim/Lab/Omniverse/GR00T などの実装・運用経験者
-
ヒューマノイドロボットや LeRobot に関する開発経験者
-
FA 機器・ロボットの設計・製造・販売に携わった経験者
技術開発と社会実装の両方に興味を持ち、ZREKのビジョンに共感できる方は、公式HPまたは以下の連絡先より問い合わせができます。
-
E-mail:jobs@zrek.org
-
お問い合わせフォーム:https://www.zrek.org/contact
本件に関するお問い合わせ
株式会社Zrek 広報部
E-mail:contact@zrek.org

