2026年1月13日、VeritasChain Standards Organization(VSO)は、AIが有害なコンテンツの生成を「拒否した」ことを暗号技術を使って証明できる、世界初のオープンな技術仕様「CAP(Content / Creative AI Profile)」バージョン0.2を公開しました。この仕様には、特に「Safe Refusal Provenance(SRP)」という機能が含まれており、AIの透明性と説明責任を高めることを目指しています。

Grok AIセーフガード回避問題とその影響
この新しい技術仕様は、2025年12月に発生したxAI社の生成AI「Grok」に関する問題を受けて開発されました。Grokのイメージ編集機能が追加された後、AIの安全装置(セーフガード)が回避され、同意のない性的画像(NCII)を含む有害なコンテンツが大量に生成されてしまうという事態が発生しました。
この問題に対し、インドネシア、マレーシア、英国(Ofcom)などの国や地域がGrokへのアクセス制限や正式調査を開始し、AIに対する国際的な規制対応が急速に進むこととなりました。
AIの「拒否」を証明する難しさ
これまでのAIシステムでは、AIプロバイダーが「安全装置は正常に機能していた」と主張しても、それを第三者が客観的に確認する手段がありませんでした。AIが「何を生成したか」は記録できても、「何を生成しなかったか」、つまり有害なリクエストを「拒否した」ことを証明する仕組みがなかったのです。内部の記録は改ざんされる可能性があり、外部からの検証は困難でした。
世界初のオープン仕様「CAP-SRP」の技術革新
CAP v0.2に含まれるSafe Refusal Provenance(SRP)は、この「AIが拒否したこと」を証明する問題を解決するために作られました。主な特徴は以下の通りです。
-
生成試行と拒否の暗号学的記録: AIへのすべてのリクエストと、その結果(生成成功または拒否)が、改ざんできない形で記録されます。デジタル署名とハッシュという技術で、記録の信頼性が保証されます。
-
プライバシー保護型の検証: 有害な内容のプロンプト(AIへの指示)そのものを公開することなく、そのハッシュ値(識別情報)を使って「特定のリクエストが拒否された」ことを数学的に証明できます。これにより、監査する側は元の有害コンテンツを見ることなく、AIプロバイダーの対応を検証できます。
-
完全性不変条件: すべてのAIの生成試行に対して、必ず何らかの結果(生成成功、拒否、エラー)が記録されるという数学的な保証です。これにより、「都合の悪い結果だけを記録しない」という不正を防ぎます。
-
SCITT透明性サービスとの統合: 国際的な標準であるSCITTアーキテクチャと連携し、第三者による検証を可能にします。
VSOは、CAP-SRPの「世界初」という主張を裏付けるため、5つの独立した調査を実施し、この技術の革新性を確認しました。
既存技術との関係と世界の規制への対応
CAP-SRPは、コンテンツの真正性を証明する「C2PA(Content Credentials)」とは異なる役割を持ちます。C2PAが「このコンテンツは本物か?」を証明するのに対し、CAP-SRPは「AIはなぜこの判断をしたか?」を証明し、AIシステムの説明責任を果たすものです。両者を組み合わせることで、より包括的な透明性が実現します。
この技術仕様は、EU AI Act(記録保持の義務付け)、EU DSA(独立監査の義務付け)、米国 TAKE IT DOWN Act(同意のない性的画像の削除義務)といった、現在策定中または施行予定の主要なAI規制にも対応するように設計されています。
VSOのファウンダー兼テクニカルディレクターである上村十勝氏は、「『私たちを信頼してください』の時代は終わりました。今回のGrok事件は、AIプロバイダーの善意に依存する『信頼ベース』のガバナンスモデルが限界に達したことを示しています。CAP-SRPは、『検証してください』と言えるAIシステムへの転換を可能にします。これは不信ではなく、検証を通じた正当な信頼の基盤を構築することです」と述べています。
公開リソースと今後の展望
本日より、以下のリソースが利用可能です。
-
CAP v0.2仕様書/SRP拡張仕様/JSON Schema/テストベクター:
https://github.com/veritaschain/cap-spec -
世界初検証レポート:
https://github.com/veritaschain/cap-spec/blob/main/docs/CAP_WorldFirst_Final_Consolidated_Report.md -
論文「非生成の証明: AI コンテンツ モデレーション ログの暗号完全性の保証 — Grok インシデントからインスピレーションを得たケーススタディとプロトコル設計」:
https://doi.org/10.5281/zenodo.18213616
すべての仕様書およびコードは、CC BY 4.0ライセンスの下でオープンに公開されており、商用・非商用を問わず自由に利用できます。
VSOは今後、CAP仕様の国際標準化に向けて、IETFへの提出や、世界中の規制当局、クリエイティブ産業、メディア企業、AIプロバイダーとの連携を進めていく予定です。
VeritasChain Standards Organization(VSO)は、「アルゴリズム時代の信頼をコード化する」をミッションに掲げる独立した国際標準化団体です。公式サイトは https://veritaschain.org/ です。

