AI(人工知能)の技術が進化する中で、まるで本物のような偽の画像や動画(ディープフェイク)が作られるようになり、オンライン上で増え続けています。これらは社会的な問題となっており、偽物を見破るためのAI技術の開発が急務となっています。
このような背景を受け、写真・イラスト・動画・音楽素材のマーケットプレイスを運営するPIXTAは、機械学習用データ提供サービスとして「人物実写・生成AI比較画像データセット」の販売を開始しました。このデータセットは、ディープフェイクや偽画像・偽映像の検知AI開発に役立つことが期待されています。

人物実写・生成AI比較画像データセットの概要
このデータセットは、AIが本物の画像とAIが作った画像を区別する能力を学習するために使われます。本物の人物写真500点と、AIが生成した人物画像500点、合計1,000点の画像が含まれています。
-
データ数: 1,000点
-
価格: 99,000円(税込)
- 各種アノテーション(画像の分類や目印付けなど)は有料で対応可能です。
-
内容:
-
実写画像とAI生成画像の両方に、一人だけ写った画像と複数人が写った画像が含まれています。
-
年齢層、性別、背景など、可能な限り多様なバリエーションが揃えられています。
-
実写画像は日本人の人物画像、生成AI画像は日本人の実写風のものが選ばれています。
-
単独人物・実写:300点
-
単独人物・生成:300点
-
複数人物・実写:200点
-
複数人物・生成:200点
-
-
行動、ポーズ、背景、撮影条件も多様です。
-
-
特徴:
-
商用利用が可能です。
-
撮影者から機械学習用データ活用の許諾を得ています。
-

サンプル画像はすべて生成AI画像です
想定される活用例
本データセットは、人物画像を扱うAIモデルの開発や検証を行う企業・研究機関など、幅広い分野で活用できます。特に、以下のような用途が想定されています。
-
偽画像・偽映像の検知モデルの開発:
- 本物の画像とAIが生成した画像を比較して学習することで、偽の画像や不正に合成されたコンテンツを自動で検出するAIモデルの構築に役立ちます。一人写りの画像と複数人写りの画像が含まれるため、実際の利用に近い条件でAIの精度を評価できます。
-
本人確認(eKYC)における不正対策:
- オンラインでの本人確認において、顔のすり替えやAI生成画像の混入を防ぐための識別モデルに利用できます。日本人やアジア人の特徴を含む画像で学習できるため、日本国内のサービスでの精度向上に貢献します。
-
人物検出・属性推定モデルの学習:
- 年齢層、性別、人数構成が異なる画像が含まれているため、人物の検出、顔認識、表情の推定など、様々なタスクに対応できます。混雑したシーンや複数人が写る画像の分析モデルにも利用可能です。
-
画像認識・分類AIの基盤データとして:
- 人物画像の特徴を抽出したり、画像を分類したり、シーンを理解したりするような、多様な画像認識タスクの基礎データとして活用できます。本物の画像とAI生成画像の両方を含むデータは、AIモデルが様々な状況に対応できる能力を高めることにもつながります。
データセット提供の背景
生成AIの普及に伴い、人物の偽画像や偽動画がオンライン上で増え、社会的な問題となっています。国内の調査では、18歳以上の約37.5%がディープフェイクと思われるコンテンツを見た経験があり、約14.6%が何らかの悪用被害に遭ったと認識していることが報告されています(出典:トレンドマイクロ株式会社「ディープフェイクに関する国内実態調査2024」(2024年7月3日)https://www.trendmicro.com/ja_jp/about/press-release/2024/pr-20240703-01.html)。
また、本人確認に使われる顔の映像にAIが生成したコンテンツが紛れ込む可能性や、なりすましを目的とした偽映像のリスクも指摘されています。このような状況から、偽画像・偽映像を検知する技術や、生成AIコンテンツの特徴を分析する取り組みが広がっています。
しかし、本物の画像とAI生成画像を体系的に比較できるデータ、特に日本人やアジア人の顔の特徴を反映した学習データは、これまで十分に揃っていませんでした。そこでPIXTAは、この課題を解決するため、今回のデータセットを作成しました。一人写りの画像と複数人写りの画像の両方を含めることで、より実際の環境に近い条件でAIの判断や検証が行えるように工夫されています。
本データセットは、偽画像の検知、本人確認の安全性向上、オンラインサービスの信頼性確保など、幅広いAI開発や研究に役立つことを目指しています。
PIXTA機械学習用画像・動画データ提供サービスについて
PIXTAの「機械学習用画像・動画データ提供サービス」は、国内最大級のストックフォトサイトとしての強みを活かし、1億点以上の商用利用可能な画像・動画・音声データを、機械学習の用途や目的に合わせて提供しています。

オープンデータでは手に入りにくい豊富な日本人画像ライブラリと、機械学習の専門チームによる高度なアノテーション技術で、AI開発者のデータ収集をサポートしています。画像認識AIや物体検知AIなどの開発に取り組む自動車・製造業界の大手企業をはじめ、様々な企業から高い評価を得ています。
もし既存のデータでは要件を満たせない場合でも、新たに撮影することも可能です。20年間の豊富な撮影経験を活かし、学習に必要なデータに合わせて撮影を行います。
PIXTA機械学習用画像・動画データ提供サービスの詳細はこちらをご覧ください。
-
機械学習用画像・映像データ提供サービス - PIXTA国内最大級の画像素材数を誇るPIXTAの画像・映像データで、機械学習における課題を解決。11,305万点以上の素材から、著作権・肖像権の心配がない日本人モデルの画像・映像データをご提供。 -
note(PIXTA機械学習データサービス): https://note.com/pixta_ml/
また、PIXTAでは撮影サービスも提供しています。
-
全国出張料無料のカメラマン手配「PIXTAオンデマンド」: https://od.pixta.jp/
-
完全オーダーメイドビジュアル制作「PIXTAカスタム」: https://pixta.jp/custom


