近年、AI(人工知能)の進化は目覚ましく、特に「生成AI」と呼ばれる技術は、まるで本物のような画像や動画を簡単に作れるようになりました。しかし、その一方で、悪意のある「偽画像」や「偽動画」(ディープフェイク)がオンライン上で増え、社会的な問題となっています。
こうした状況を受けて、ピクスタ株式会社は、機械学習用の「人物実写・生成AI比較画像データセット」の販売を開始しました。このデータセットは、偽のコンテンツを見破るAIの開発を強力に支援することを目的としています。

データセットの概要
このデータセットには、合計1,000点の人物画像が収録されています。内訳は、本物の人物写真(実写)が500点、AIが生成した人物画像が500点です。どちらのタイプの画像も、一人の人物が写っているものと、複数の人物が写っているものの両方が含まれており、年齢層や性別、背景なども幅広いバリエーションが用意されています。
特に、実写画像は日本人、生成AI画像は日本人の実写風のものが選ばれており、日本国内のサービス開発に役立つよう工夫されています。
-
データ数: 1,000点
-
価格: 99,000円(税込)
-
内容:
-
単独人物・実写: 300点
-
単独人物・生成AI画像: 300点
-
複数人物・実写: 200点
-
複数人物・生成AI画像: 200点
-
-
特徴: 商用利用が可能で、撮影者からの機械学習用データ活用の許諾も取得済みです。
購入は、PIXTAの「機械学習用画像・動画データ提供サービス」のウェブサイトから問い合わせることで可能です。
PIXTA機械学習用画像・動画データ提供サービス
画像サンプル

想定される利用シーン
このデータセットは、人物画像を対象としたAIモデルの開発や検証を行う企業・研究機関など、様々な分野で活用されることが期待されています。
-
偽画像・偽映像の検知モデルの開発: 本物の画像とAI生成画像を比較学習させることで、ディープフェイクなどの不正なコンテンツを自動で見つけるAIモデルの構築に役立ちます。
-
本人確認(eKYC)における不正対策: オンラインでの本人確認において、顔のすり替えや生成画像の混入を防ぐための識別モデルに利用できます。日本人やアジア人の特徴を含む画像で学習できるため、国内向けサービスの精度向上に貢献します。
-
人物検出・属性推定モデルの学習: 年齢層、性別、人数構成が異なる画像が含まれているため、人物の検出、顔認識、表情推定など、多様なタスクに対応するAIモデルの開発に活用できます。
-
画像認識・分類AIの基盤データとして: 人物画像の特徴を抽出したり、分類したり、シーンを理解したりするような、様々な画像認識タスクの基礎データとして利用できます。
提供の背景
生成AIの普及に伴い、人物の偽画像や偽動画がインターネット上で増え、社会的な課題となっています。ある調査では、18歳以上の約37.5%がディープフェイクと思われるコンテンツを目にした経験があり、約14.6%が悪用されたと認識していることが報告されています。
さらに、オンラインでの本人確認で使われる顔映像に、AIが生成したコンテンツが紛れ込む可能性や、なりすましを目的とした偽映像のリスクも指摘されています。
こうした状況の中、偽画像や偽映像を見つける技術、そして生成AIコンテンツの特徴を分析する取り組みが広がっています。しかし、本物の画像と生成AI画像を体系的に比較できるデータ、特に日本人やアジア人の顔の特徴を反映した学習データは、これまで十分に整っていませんでした。
そこでPIXTAは、この課題を解決するため、人物の実写画像とAI生成画像をそれぞれ500点ずつ収録した、計1,000点のデータセットを作成しました。単独人物と複数人物の両方のシーンを含めることで、より実際の状況に近い条件でAIの判定や検証が行えるように工夫されています。
このデータセットが、偽画像の検知、本人確認の安全性向上、オンラインサービスの信頼性確保など、幅広いAI開発や研究に役立つことが期待されています。
PIXTAの機械学習用画像・動画データ提供サービスについて
PIXTAは、国内最大級のストックフォトサイトとして、1億点以上の商用利用可能な画像・動画・音声データを、機械学習の用途や要件に合わせて提供しています。
オープンデータでは手に入りにくい豊富な日本人画像ライブラリと、機械学習専門チームによる高度なアノテーション(データにタグ付けする作業)技術を組み合わせることで、AI開発者のデータ収集を一貫してサポートしています。画像認識AIや物体検知AIなどの開発に力を入れている自動車・製造業界の大手企業をはじめ、多くの企業から高い評価を得ています。
もし既存のストックデータでは要件を満たせない場合は、新規で撮影することも可能です。創業20年の豊富な撮影経験を活かし、学習要件に合わせたデータを撮影するサービスも提供しています。

PIXTAの機械学習用画像・動画データ提供サービスに関する詳細は、以下のリンクから確認できます。
また、PIXTAでは撮影サービスも提供しています。


