500万時間超の長時間映像を収録!Qlean Datasetが「ロングコンテキスト動画データセット」の提供を開始

AIツール・サービス紹介

Qlean Datasetが、500万時間超の長尺映像を収録した「ロングコンテキスト動画データセット」を提供開始

近年、AIの世界では、たくさんの情報(映像、音声、テキストなど)をまとめて理解し、新しいものを作り出す「マルチモーダルAI」という技術が注目されています。特に、長時間の情報から文脈を読み取る「ロングコンテキスト」の重要性が増しています。

このような背景のもと、Visual Bank株式会社は、子会社である株式会社アマナイメージズを通じて、AI学習用データソリューション「Qlean Dataset(キュリンデータセット)」の提供を強化しています。この度、AIが現実世界の連続的な変化を理解し、生成するための基盤として、500万時間以上もの実映像を収録した「ロングコンテキスト動画データセット」の提供を開始しました。

Qlean Datasetが500万時間超のロングコンテキスト動画データセットの提供開始を発表する画像

AI開発を支える「Qlean Dataset」と「AIデータレシピ」

「Qlean Dataset」は、AI開発に必要なデータを、法的なリスクなく利用できる形で提供しています。特に、独自に用意された「AIデータレシピ」は、研究開発から商用利用まで、様々なAI開発現場をサポートするデータラインナップです。

「AIデータレシピ」は、用途や目的に合わせて、すぐに使えるデータ素材を自由に組み合わせられるのが特徴です。株式会社千葉ロッテマリーンズや株式会社東洋経済新報社など、多くのパートナー企業と協力し、特定の業界や最新トレンドに合わせたデータニーズにも対応しています。

これにより、AI開発者がデータ収集や準備にかかる手間を大幅に減らし、安心して開発に集中できる環境を整えています。

Qlean Datasetのウェブサイトで、AI開発向けに多様なオリジナルデータセット「AIデータレシピ」を紹介しています。

Visual Bank inc.の「AIデータレシピ」は、AI研究・商業開発を支援するデータラインナップです。

「ロングコンテキスト動画データセット」の詳しい内容

今回提供が始まった「ロングコンテキスト動画データセット」は、数分から数時間にわたる長い動画をまとめた、非常に大きな映像データの集まりです。映像、音声、字幕が一体になっているため、時間の流れ(文脈)を理解したり、それに基づいて新しい映像を作り出したりするAIの開発にぴったりです。

このデータセットには、登場人物の行動や会話、環境音、照明の変化など、実際の時間経過に沿った様々な変化がそのまま収録されています。

含まれるデータのジャンル

  • テレビ番組・バラエティデータ:ニュース、トーク、料理、ロケ、ゴルフ、麻雀など、様々なジャンルの長時間番組映像が含まれます。生放送やスタジオ収録、屋外ロケーションなど、多様な撮影環境の番組が収録されており、実際の放送現場の様子が反映されています。

  • スポーツ中継データ:野球、サッカー、ゴルフなどの試合映像を、複数のカメラアングルと実況・解説付きで収録しています。競技全体の動きや選手のプレー、観客の反応、音声環境まで含まれており、長時間の試合展開をそのままデータとして利用できます。

  • 海外アニメ・映画・ドラマデータ:海外で制作されたアニメーションや実写作品が多数収録されています。登場人物の動きや表情、カメラワーク、シーンの切り替わり、音声演出など、作品全体のストーリーや映像の特徴が詰まっています。

  • SNS・短尺コンテンツデータ:動画配信プラットフォームやSNSで公開された短い映像が中心です。Vlog(動画ブログ)、レビュー動画、日常の記録など、様々な形式のコンテンツが収録されており、撮影者や環境による表現の違いがそのまま反映されています。

  • 監視カメラ映像データ:ビル、店舗、一般住宅、駐車場など、様々な場所に設置された監視カメラの長時間映像です。人の出入り、通行、明るさの変化、時間帯による行動パターンなど、実際の環境で撮影された定点映像が含まれています。屋内外、昼夜を問わず、様々な視点や機種のカメラ映像が利用できます。

  • 風景・自然撮影データ:都市部、住宅地、公園、海岸、山岳地帯など、国内外の様々な場所を定点または移動しながら撮影した映像です。朝・昼・夜の時間帯や天候の変化、車両や人の動きなど、時間の流れを伴う景観データが豊富に含まれています。

これらの動画データは、生成AI、行動認識、映像解析、要約モデルなど、幅広いAIの研究や製品開発に活用できます。長時間の映像が持つ文脈をそのまま使えるため、動画生成AIのトレーニング、スポーツや人の行動解析、放送映像の自動要約、監視映像の異常検知など、多くの分野でAIの精度を向上させることが期待されています。

「ロングコンテキスト動画データセット」でできること(ユースケースイメージ)

このデータセットは、様々なAI開発に役立ちます。

  • 長時間映像を活用した動画生成・ストーリー生成AIの学習
    数分から数時間におよぶ映像を使って、登場人物の動きや会話、シーンのつながりをAIに学習させることができます。例えば、照明や背景音、カット割りなど、時間とともに変化する要素を含んでいるため、長尺映像を扱う動画生成モデルの研究に役立ちます。

  • スポーツ解析・戦術分析モデルの高度化
    複数の視点から撮影された試合映像を使うと、選手の動き、チームのフォーメーション、観客の反応を連続的に追うことができます。これにより、プレーの分類、選手のポジショニング評価、ハイライトシーンの自動抽出など、スポーツ解析技術をさらに進化させることが可能です。

  • 番組映像をもとにした要約・字幕生成・自動編集の研究
    トーク番組、ニュース、ドキュメンタリー映像などから、誰が話し始めたか、話題が変わったかなどを抽出し、番組の内容を自動で要約するAIの学習に活用できます。実際のテロップ構成や編集リズムが含まれているため、自動字幕生成や番組のメタデータ(内容を示す情報)生成の精度向上が期待されます。

  • 監視・防犯・人流解析の精度向上
    商業施設や住宅、オフィス、駐車場などで撮影された監視カメラの映像をもとに、人や車の動き、滞在時間を解析できます。時間帯や明るさの変化も含まれているため、不審な行動の検知や、人の流れを分析するモデルの評価データとして非常に有効です。

  • オンライン動画理解・推薦モデルの開発
    動画配信プラットフォームで実際に公開された短い動画を利用し、視聴者の行動や映像の構成の特徴を解析できます。トレンドの変化や視聴パターンを踏まえたおすすめ動画の提案や、話題の分析を行うAIの研究に適しています。

  • 競技採点・審判支援システムの開発
    スポーツやパフォーマンスの映像を通じて、選手のフォームや動きを長時間にわたって追跡し、客観的な基準に基づいた判定アルゴリズムの検証に役立てられています。これにより、競技団体やイベント現場での採点支援や、映像判定の自動化への応用が進んでいます。

  • 風景・自然環境データを用いた映像生成・環境変化モデリング
    都市や自然の風景の長時間映像を解析することで、天候や明るさの移り変わりを再現するAIモデルの訓練に利用されています。環境を生成するAIやシミュレーション開発など、時間軸を伴う現象の研究に欠かせないデータです。

Qlean Datasetの強み

「Qlean Dataset」が提供するデータセットには、いくつかの大きな強みがあります。

  • 研究開発、商用利用にしっかり対応
    提供されるデータセットは、すべての被写体からデータ取得とAI開発への利用に関する同意を得ています。そのため、各国のプライバシーポリシーなどにも対応しており、安心して研究や商用利用が可能です。

  • 「データレシピ」でスピーディーかつ効率的にデータを提供
    独自の提供形態である「データレシピ」により、初期費用を抑えながら、必要なデータを素早く手に入れることができます。

  • 「データレシピ」にないデータも個別に対応
    もし「データレシピ」にない、特別なデータが必要な場合でも、「Qlean Dataset」の専門的な能力を活かして、お客様の要望に合わせたデータセットを作成・提供することが可能です。

Qlean Datasetは、AI開発に必要な学習データ素材、アノテーション付きデータ、キャプションデータを「AIデータレシピ」として提供するサービスです。

Qlean Datasetの強みを解説するスライド。

Qlean Datasetは、AI開発の現場でデータの収集や準備にかかる負担を大きく減らし、著作権などの法的リスクがないAI開発環境の実現に貢献していきます。

Qlean Dataset お問い合わせフォーム:
https://qleandataset.visual-bank.co.jp/contact

Qlean Dataset サービスサイトURL:
https://qleandataset.visual-bank.co.jp/

Visual Bank株式会社について

Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を最大限に引き出す新しいデータインフラを構築・提供するスタートアップ企業です。漫画家をサポートするAI補助ツール「THE PEN」のほか、AI学習用データセット開発サービス「Qlean Dataset」を提供する株式会社アマナイメージズを100%子会社としています。

また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択されており、AI技術の社会実装に向けた取り組みを加速させています。

タイトルとURLをコピーしました