Skip to content

aegis-standard/aef-incident-lab

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

30 Commits
 
 
 
 

Repository files navigation

AEF Incident Lab — AI 行为事故档案

本仓库是 AEF(Agent Evidence Format)的公共事故案例实验室。我们收集真实世界中已经发生的 AI 事故,并展示:如果这些事故发生时存在 AEF 记录,证据链会是什么样。


真实事故与 AEF 证据还原

事故 1:三星前高管泄露半导体商业计划书(2025 年 10 月)

三星电子前副总裁崔某在 ChatGPT 中粘贴 110 页合资半导体工厂商业计划书,要求 AI 进行摘要和 PPT 制作。这些内容可能进入 OpenAI 训练集。

没有 AEF:三星只能“全面禁用 AI”,无法精确追溯哪些会话涉及机密。

如果有 AEF:安全团队可精确检索每次 tool.call 事件,确认涉及机密的会话。human.override 可显示员工是否收到过系统警告。完整事件链可回放整个交互过程。

完整案例分析


事故 2:“沙王二世”深度伪造诈骗(2026 年)

诈骗分子在 YouTube 发布 AI 深度伪造视频,冒充沙特国王萨勒曼宣布虚假投资计划。数千名投资者被骗,金额超 200 万美元。

没有 AEF:无法证明视频由 AI 生成而非人工剪辑,受害者难以追责。

如果有 AEF:生成视频的 AI Agent 会留下完整执行链——task.createdtool.call.started(生成帧)→ tool.call.completed(输出视频)。integrity_hash 锚定生成输出与执行之间的密码学联系。

完整案例分析


事故 3:特朗普暗金“Signal-Gate”群聊泄密(2025 年 3 月)

《大西洋月刊》主编被意外拉入美国高级官员的 Signal 群聊,群内讨论针对胡塞武装的军事打击。泄密后所有官员否认讨论过“战争计划”。

没有 AEF:政府内部决策和 AI 辅助分析完全不可追溯,官员可以否认一切。

如果有 AEF:任何 AI 辅助的风险评估、部署建议、外交对策都以不可篡改的因果图记录。human.override 可以区分 AI 的推荐与官员手动修改后的最终指令。

完整案例分析


事故 4:DeepSeek 商标抢注纠纷(2026 年 3 月)

中国开源大模型公司 DeepSeek 在商标注册中遭遇恶意抢注。争议核心是商标的初始使用时间能否被独立验证。

没有 AEF:商标争议依赖公司内部记录,法律诉讼周期可达数年。

如果有 AEF:从模型训练到 API 上线的每一步都构成不可篡改的时间线。ERC 公证收据为每条事件提供独立密码学证明,大幅缩短证据验证周期。

完整案例分析


AEF 技术演示案例(虚构场景)

以下三个虚构案例展示了 AEF 在不同 AI 事故类型中的完整证据链:

编号 标题 事故类型 AEF 证据
001 AI 误删关键配置文件 工具误用(tool misuse) ✅ 完整回放 + ERC 收据
002 AI 修改生产配置并推卸责任 多 Agent 协作(multi-agent) ✅ 因果图 + 责任链
003 人类覆盖被忽略导致部署失败 人类覆盖违规(human override violation) ✅ human.override 事件 + replay
004 AI 交易决策无法追溯 量化交易 ✅ AEF 事件链 + 因果图

每个案例包含:

  • README.md — 事故描述、事件列表、因果图、关键证据、结论
  • events.json — 完整 AEF 事件文件(含 SHA-256 完整性哈希)
  • receipt.json — ERC 责任收据

什么是 AEF

AEF 是一份开放、中立、已冻结的 AI 代理执行证据格式宪法。它定义了:

  • 什么叫一次真实发生的 AI 行为
  • 什么叫一次合法的回放
  • 什么叫一次人类干预
  • 什么叫一条不可篡改的证据链

详见 aef-core


如何贡献

如果你想提交一个新的 AI 事故案例(真实或虚构),请参考 incidents/001/ 的格式:

  1. 创建 incidents/<编号>/ 目录
  2. 提供 README.md(事故描述、事件表、因果图、结论)
  3. 提供 events.json(AEF 事件文件,含完整 SHA-256 哈希)
  4. 提供 receipt.json(ERC 公证收据)
  5. 提交 PR

About

AI 行为事故档案 — 用 AEF 回放、证明、归责每一次 AI 事故

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors