AIが「生成を拒否した」ことを証明する世界初の技術「CAP-SRP」が登場
2026年1月13日、VeritasChain Standards Organization(VSO、本部:東京都渋谷区)は、AIコンテンツ生成システム向けのオープンな技術仕様「CAP(Content / Creative AI Profile)」のバージョン0.2を正式に公開しました。この新仕様には、AIシステムが有害なコンテンツの生成を「拒否した」ことを暗号技術を使って証明できる、世界初の機能「Safe Refusal Provenance(SRP)」が含まれています。

背景:Grok AIの安全装置が回避された問題
2025年12月、Elon Musk氏が率いるxAI社の生成AI「Grok」に画像編集機能が追加された後、このAIの「安全装置(セーフガード)」が回避され、大規模な有害画像生成問題が急速に広がりました。
Grokの「Spicy Mode」という成人向けコンテンツ生成機能(2025年夏に導入)と組み合わせることで、実在する人物の写真から、その人の同意なしに性的画像(NCII:Non-Consensual Intimate Images)を作り出すことが可能になっていました。
この問題を受けて、各国政府や規制当局は迅速に対応を開始しました。
-
インドネシア(1月10日):Grokへのアクセスを一時的に遮断した最初の国となりました。
-
マレーシア(1月10日):アクセス制限を発表しました。
-
英国Ofcom(1月12日):X社に対する正式な調査を開始し、多額の罰金を科す可能性を示唆しました。
-
その他:フランス、EU当局、オーストラリア、インド、ブラジルなど、多くの国や地域が調査を始めています。
X社は1月3日に、違法なコンテンツを作成するユーザーへの警告を発表し、画像生成機能を有料プランの利用者のみに制限しました。しかし、英国科学技術相からはこの措置が「侮辱的」だと批判されています。
「安全装置は機能していた」を検証できない構造的な問題
今回の事件は、現代のAIガバナンスにおける根本的な問題点を浮き彫りにしました。それは、AIを提供する側が「安全装置は正常に機能していた」と主張しても、それを第三者が客観的に確認する手段がないという点です。
AIプロバイダーが「何百万件もの有害なリクエストをブロックした」と主張しても、その主張を証明する確かな証拠がないのが現状でした。これまでのAIシステムでは、「何を作ったか」は記録できても、「何を断ったか」を証明する仕組みがなかったのです。
CAP-SRPの技術革新:「負の証明」を可能にする世界初のオープン仕様
CAP v0.2に含まれるSafe Refusal Provenance(SRP)拡張は、この「負の証明」の問題を解決するために作られた、世界初のオープンな技術仕様です。
主な技術的な特徴は以下の通りです。
- 生成の試みと拒否を暗号技術で記録
すべての生成リクエスト(GEN_ATTEMPT)と、その結果(生成成功:GEN、または生成拒否:GEN_DENY)が、デジタル署名とハッシュチェーンによって、誰も改ざんできない形で記録されます。 - プライバシーを守りながら検証
有害な指示(プロンプト)そのものを公開することなく、そのハッシュ値(PromptHash)を使うことで、「特定のリクエストが拒否された」ことを数学的に証明できます。これにより、監査する人や法執行機関は、元の有害なコンテンツを見ることなく、AIプロバイダーの対応が適切だったかを検証できます。 - 完全性不変条件
CAP-SRPは、すべての生成試行に対して、必ず一つの結果イベントが存在するという数学的な保証を提供します。このルールにより、AIが都合の悪い結果だけを記録しない、という不正な行為を技術的に排除します。 - SCITT透明性サービスとの連携
IETFで標準化が進むSCITT(Supply Chain Integrity, Transparency, and Trust)という技術と連携し、第三者による検証を可能にします。
5つの独立調査が「世界初」を検証
VSOは、CAP-SRPの「世界初」という主張を裏付けるために、異なる手法とAI研究プラットフォームを使った5つの独立した調査を実施しました。その結果、170以上の学術論文、技術標準、業界の導入事例、規制文書を詳しく調べた結果、以下の結論が得られました。
| CAP機能 | 世界初判定 | 確信度 | 検証結果 |
|---|---|---|---|
| Safe Refusal Provenance(SRP) | ✅ 完全に世界初 | 高 | 5調査すべてが支持 |
| 完全性不変条件 | ✅ 世界初(AI拒否への適用) | 高 | 5調査すべてが支持 |
| 統合ライフサイクル監査 | ✅ 世界初(統合フレームワーク) | 高 | 5調査すべてが支持 |
| Evidence Pack形式 | ✅ 世界初(AI監査特化) | 中〜高 | 5調査すべてが支持 |
既存技術との比較
-
C2PA(Content Credentials):コンテンツが「本物か?」を証明しますが、拒否の証明機能はありません。
-
IETF SCITT:汎用的な透明性ログですが、AIの拒否イベントの定義や完全性不変条件は含まれません。
-
Guardtime KSI:ログの完全性を保証しますが、AI監査の仕組みやEvidence Pack形式はありません。
-
主要AIプロバイダー各社:内部ログは存在しますが、公開された仕様や暗号技術による検証、完全性の保証はどれも不足しています。
規制への対応:EU AI Act、DSA、TAKE IT DOWN Actに準拠
CAP-SRPは、現在作られている、またはこれから施行される主要なAI規制に対応できるように設計されています。
-
EU AI Act 第12条(記録保持):高リスクAIシステムに対して、すべてのイベントを自動で記録するよう義務付けています。CAP-SRPのイベントモデルとEvidence Pack形式は、この要件に追加の開発なしで対応できます。
-
EU DSA 第35条(独立監査):大規模オンラインプラットフォームに対して、毎年独立した監査を義務付けています。CAP-SRPのEvidence Packは、監査する人がログの完全性を暗号技術で検証できる、構造化された情報を提供します。
-
米国 TAKE IT DOWN Act:同意のない性的画像(NCII)を48時間以内に削除するよう義務付けています。CAP-SRPは、削除依頼への対応を証明するための「作られていない証拠」として機能します。
「私たちを信頼してください」から「検証してください」へ
VSOのファウンダー兼テクニカルディレクターである上村十勝氏は、次のように述べています。
「『私たちを信頼してください』という時代は終わりました。今回のGrok事件は、AIプロバイダーの善意に頼る『信頼ベース』のガバナンスモデルが限界に達したことをはっきりと示しています。有料化や利用規約の強化だけでは、根本的な問題は解決しません。」
「CAP-SRPは、『検証してください』と言えるAIシステムへの転換を可能にします。xAI社が『何百万件もの有害なリクエストをブロックした』と主張するなら、その主張を暗号技術で証明できるべきです。CAP-SRPを導入していれば、監査する人は独立してその主張を検証できます。これは不信からではなく、検証を通じて正当な信頼の基盤を築くことにつながります。」
C2PAとの補完関係
CAP-SRPは、既存のコンテンツ認証標準であるC2PA(Coalition for Content Provenance and Authenticity)を置き換えるものではなく、お互いを補い合う関係にあります。
-
C2PA:「このコンテンツは本物か?」を証明します(コンテンツの認証)。
-
CAP-SRP:「AIはなぜこの判断をしたか?」を証明します(システムの責任を明確にする)。
両方を組み合わせることで、作られたコンテンツにはC2PAの認証情報を付け、AIシステムの判断過程にはCAPの監査記録を提供する、包括的な透明性のエコシステムが実現します。「C2PAがコンテンツの『パスポート』であるならば、CAPはAIシステムの『フライトレコーダー』です。」
公開リソースと今後の展開
本日より、以下の情報が利用可能です。
-
CAP v0.2仕様書/SRP拡張仕様/JSONスキーマ/テストベクター:
https://github.com/veritaschain/cap-spec -
世界初検証レポート:
https://github.com/veritaschain/cap-spec/blob/main/docs/CAP_WorldFirst_Final_Consolidated_Report.md -
論文「非生成の証明: AI コンテンツ モデレーション ログの暗号完全性の保証 — Grok インシデントからインスピレーションを得たケーススタディとプロトコル設計」:
https://doi.org/10.5281/zenodo.18213616
すべての仕様書およびコードは、CC BY 4.0ライセンスの下でオープンに公開されており、商業目的でも非商業目的でも自由に利用できます。
VSOは、CAP仕様の国際標準化に向けて、以下の取り組みを進めています。
-
IETF標準化:
draft-kamimura-scitt-refusal-eventsとしてSCITTワーキンググループに提出済みです。 -
規制当局との連携:EU、英国、シンガポール、豪州を含む50以上の地域にある規制当局と話し合いを進めています。
-
業界での採用:クリエイティブ産業、メディア企業、AIプロバイダーとの早期採用プログラムを準備中です。
VeritasChain Standards Organization(VSO)について
VeritasChain Standards Organization(VSO)は、「アルゴリズム時代の信頼をコード化する」をミッションに掲げる独立した国際標準化団体です。東京を本部とし、アルゴリズム取引向けの監査記録標準「VeritasChain Protocol(VCP)」や、AIコンテンツ生成向けの「CAP」を開発しています。
公式サイト:
https://veritaschain.org
GitHub:
https://github.com/veritaschain
免責事項
本プレスリリースに記載された「世界初」という主張は、2026年1月13日時点での調査に基づいています。VSOは、公開されている標準仕様、学術論文、業界の導入事例を詳しく調べた結果、CAP-SRPの主要な機能について、先行する同等の公開仕様が存在しないことを確認しています。ただし、公開されていない内部のシステムについては、この検証の範囲外です。

