PIXTA、ディープフェイク対策に貢献!人物の実写と生成AIを比較できる画像データセットを販売開始

AIツール・サービス紹介

PIXTAがAI開発を支援する新たなデータセットを販売

近年、AI(人工知能)の技術は目覚ましい進歩を遂げており、特に「生成AI」と呼ばれる、まるで人間が作ったかのような画像や動画を作り出すAIが登場しています。しかし、その一方で、本物そっくりの偽画像や偽動画(「ディープフェイク」と呼ばれます)が作られ、社会的な問題となるケースも増えてきました。

このような背景を受け、ピクスタ株式会社は、偽画像や偽映像を見破るAIの開発を支援するため、「人物実写・生成AI比較画像データセット」の販売を開始しました。このデータセットは、AIが本物の画像とAIが作った偽物の画像を区別できるよう、学習させるために使われます。

PIXTA 人物実写・生成AI比較 画像データセット

データセットの概要

今回販売される「人物実写・生成AI比較画像データセット」は、以下の内容で構成されています。

  • データ数: 1,000点

  • 価格: 99,000円(税込)

    • ※アノテーション(画像に目印をつけたり、情報を追加したりする作業)は別途有料で対応可能です。
  • 内容:

    • 実写画像とAI生成画像の両方が含まれます。

    • 1人だけが写っている画像と、複数人が写っている画像の両方があります。

    • 年齢層、性別、背景など、様々なバリエーションの画像が収録されています。

    • 実写画像は日本人を、AI生成画像は日本人の実写風のものが選ばれています。

    • 枚数構成は以下の通りです。

      • 単独人物・実写:300点

      • 単独人物・生成:300点

      • 複数人物・実写:200点

      • 複数人物・生成:200点

    • 行動やポーズ、背景、撮影条件も多様です。

  • 特徴:

    • 商用利用が可能です。

    • 撮影者から機械学習用データとしての利用許諾を得ています。

生成AI画像のサンプル

想定される活用シーン

このデータセットは、人物画像を扱うAIモデルの開発や検証を行う企業・研究機関で幅広く活用されることを想定しています。

特に、以下のような用途で役立つでしょう。

  • 偽画像・偽映像の検知モデルの開発:

    • AIに本物の画像とAIが作った画像を比較して学習させることで、ディープフェイクのような偽のコンテンツを自動で見つけ出すAIを作ることができます。1人だけでなく複数人が写ったシーンも含まれるため、実際の利用に近い条件でAIの性能を試すことが可能です。
  • 本人確認(eKYC)における不正対策:

    • オンラインでの本人確認で、偽の顔画像が使われたり、AIで作られた画像が混じったりするのを防ぐためのAIモデルに利用できます。日本人やアジア人の顔の特徴を持つ画像で学習できるため、日本国内のサービスでAIの精度を高めるのに役立ちます。
  • 人物検出・属性推定モデルの学習:

    • 年齢や性別、人数が異なる画像が含まれているため、AIが画像の中から人物を見つけ出したり、顔を認識したり、表情を推定したりするなど、様々なタスクに対応できるAIを開発できます。混雑した場所や複数人がいるシーンの分析モデルにも活用できるでしょう。
  • 画像認識・分類AIの基礎データとして:

    • 人物画像の特徴をAIに覚えさせたり、画像を種類ごとに分けたり、画像の内容を理解したりするAIの土台として利用できます。実写とAI生成の両方のデータが含まれていることで、より汎用性の高いAIモデルの開発に貢献します。

データセット提供の背景

生成AIの普及により、オンライン上での人物の偽画像や偽動画が増加し、社会的な問題となっています。ある調査では、18歳以上の約37.5%がディープフェイクと思われるコンテンツを見た経験があり、約14.6%が悪用に遭ったと認識していることが報告されています(出典:トレンドマイクロ株式会社「ディープフェイクに関する国内実態調査2024」)。

また、本人確認の際にAI生成コンテンツが使われたり、なりすまし目的の偽映像のリスクも指摘されています。

このような状況の中、偽画像や偽映像を見つけ出す技術や、生成AIコンテンツの特徴を分析する取り組みが重要になっています。しかし、実写と生成AI画像を体系的に比較できるデータ、特に日本人やアジア人の顔の特徴を反映した学習データは不足していました。

そこでPIXTAは、人物の実写画像500点とAI生成画像500点を合わせた、合計1,000点の人物画像データセットを作成しました。1人だけのシーンと複数人のシーンの両方を含めることで、より実際の環境に近い形でAIの判定や検証ができるようになっています。

このデータセットが、偽画像の検知、本人確認の安全性向上、オンラインサービスの信頼性確保など、幅広いAI開発や研究に役立つことを目指しています。

PIXTAの機械学習用画像・動画データ提供サービスについて

PIXTAの「機械学習用画像・動画データ提供サービス」は、国内最大級のストックフォトサイトとしての強みを活かし、1億点以上の商用利用可能な画像・動画・音声データを、AI開発に必要な形に整えて提供するサービスです。

画像解析技術の応用例

オープンデータでは手に入りにくい豊富な日本人画像ライブラリと、機械学習に特化したチームによる高度なアノテーション(AIが学習しやすいようにデータに情報を付与する作業)技術で、AI開発者のデータ収集をサポートしています。画像認識AIや物体検知AIの開発に取り組む大手企業など、多くの企業から支持を得ています。

もし、既存のデータでは要件を満たせない場合でも、PIXTAは新規撮影にも対応しています。20年の撮影経験を活かし、AIの学習に必要なデータを新たに撮影することも可能です。

関連リンク

PIXTAの各種サービス紹介

ピクスタ株式会社は、今後もAI技術の健全な発展と社会の安全に貢献するため、様々なデータ提供サービスを展開していくことでしょう。

タイトルとURLをコピーしました