製造・物流現場の課題解決へ!ZREKが独自のVLM開発を開始
フィジカルAIのスタートアップである株式会社Zrek(ゼレック)は、製造業や物流分野における目視検査や作業内容の理解をさらに進化させるため、独自の視覚言語モデル(Vision-Language Model、VLM)の開発に着手しました。

VLMとは?画像や動画から「意味」を理解するAI
VLM(視覚言語モデル)とは、画像や動画といった視覚情報と、人が使う自然な言葉(自然言語)を同時に理解できるAIのことです。
これまでの画像認識AIは、物の「位置」や「寸法」、「数値」に基づいた判断が得意でした。しかしVLMは、そうした数値的な情報だけでなく、例えば「部品が少しずれている」「正しく取り付けられていない」「今、この作業工程が行われている」といった、人が言葉で表現するような状態や「意味」を画像や動画から直接読み取れるのが大きな特長です。
製造業・物流現場での活用事例
ZREKが開発するVLMは、特に以下のような現場での活躍が期待されています。
製造業における目視検査の高度化
少量多品種生産のように、人の目で確認することが避けられない工程があります。VLMは、そうした現場で「どこがおかしいのか」「どの状態が不良なのか」といった人の判断をAIが理解し、補助する役割を担います。
作業動画の理解、検索、ラベル付け
製造や物流の現場では、多くの作業動画が記録されています。しかし、「見たいシーンをなかなか見つけられない」「せっかく撮った動画を十分に活用できていない」といった課題も存在します。VLMを使えば、作業の内容やその時の状態を言葉で検索し、必要なシーンを素早く確認できるようになるでしょう。
物流現場での作業確認とトレーサビリティ
荷物の投入、仕分け、積み込みといった物流の各工程を動画で記録し、VLMが解析することで、「いつ、どのタイミングで、何が行われたか」をすぐに確認できる仕組みに応用することも可能です。
実証パートナーを募集
ZREKは現在、このVLM技術を実際の現場で検証する企業を募集しています。もし、以下のような課題をお持ちの企業があれば、ぜひZREKに問い合わせてみてください。
-
製造業や物流業で、人の判断に頼る部分が多く、特定のスキルを持つ人に業務が集中している工程がある
-
作業動画を撮影しているものの、まだ十分に活用できていない業務がある
実際の現場データを使った検証を通じて、ZREKは企業と共に解決策を検討したいと考えています。
株式会社Zrekについて
株式会社Zrekは、フィジカルAIを製造業に特化して開発する企業です。
| 項目 | 詳細 |
|---|---|
| 社名 | 株式会社Zrek(ゼレック) |
| 代表者 | 代表取締役CEO 今村優希 |
| 所在地 | 〈東京本社〉東京都渋谷区神南1-6-12 B1F |
| 事業内容 | ソフトウェアおよびハードウェアの開発 |
| 設立 | 2021年4月 |
| 従業員数 | 12名(業務委託含む) |
| 公式HP | https://www.zrek.org |
専門人材を募集
ZREKでは、現在、デザイナーやエンジニアをはじめとする専門人材を多様な雇用形態(正社員、副業、長期インターンシップ、業務委託)で募集しています。シニア層やエキスパート層の参加も歓迎しており、技術リードやアドバイザリーなど、柔軟な働き方に対応しています。
特に以下の職種や経験を持つ方を求めています。
-
ハードウェアのプロダクトデザイナー
-
AI/ロボティクスエンジニア(強化学習/模倣学習/ROS 2)
-
協働ロボットのシステムインテグレーション経験者
-
LLM/VLM/VLAを用いた開発経験者
-
NVIDIA Isaac Sim/Lab/Omniverse/GR00Tなどの実装・運用経験者
-
ヒューマノイドロボットやLeRobotに関する開発経験者
-
FA機器・ロボットの設計・製造・販売に携わった経験者
技術開発と社会実装の両方に興味があり、ZREKのビジョンに共感できる方は、公式HPまたは下記より問い合わせてください。
-
E-mail:jobs@zrek.org
-
お問い合わせフォーム:https://www.zrek.org/contact
本件に関するお問い合わせ先
株式会社Zrek 広報部
E-mail:contact@zrek.org

