本仓库是 AEF(Agent Evidence Format)的公共事故案例实验室。我们收集真实世界中已经发生的 AI 事故,并展示:如果这些事故发生时存在 AEF 记录,证据链会是什么样。
三星电子前副总裁崔某在 ChatGPT 中粘贴 110 页合资半导体工厂商业计划书,要求 AI 进行摘要和 PPT 制作。这些内容可能进入 OpenAI 训练集。
没有 AEF:三星只能“全面禁用 AI”,无法精确追溯哪些会话涉及机密。
如果有 AEF:安全团队可精确检索每次 tool.call 事件,确认涉及机密的会话。human.override 可显示员工是否收到过系统警告。完整事件链可回放整个交互过程。
→ 完整案例分析
诈骗分子在 YouTube 发布 AI 深度伪造视频,冒充沙特国王萨勒曼宣布虚假投资计划。数千名投资者被骗,金额超 200 万美元。
没有 AEF:无法证明视频由 AI 生成而非人工剪辑,受害者难以追责。
如果有 AEF:生成视频的 AI Agent 会留下完整执行链——task.created → tool.call.started(生成帧)→ tool.call.completed(输出视频)。integrity_hash 锚定生成输出与执行之间的密码学联系。
→ 完整案例分析
《大西洋月刊》主编被意外拉入美国高级官员的 Signal 群聊,群内讨论针对胡塞武装的军事打击。泄密后所有官员否认讨论过“战争计划”。
没有 AEF:政府内部决策和 AI 辅助分析完全不可追溯,官员可以否认一切。
如果有 AEF:任何 AI 辅助的风险评估、部署建议、外交对策都以不可篡改的因果图记录。human.override 可以区分 AI 的推荐与官员手动修改后的最终指令。
→ 完整案例分析
中国开源大模型公司 DeepSeek 在商标注册中遭遇恶意抢注。争议核心是商标的初始使用时间能否被独立验证。
没有 AEF:商标争议依赖公司内部记录,法律诉讼周期可达数年。
如果有 AEF:从模型训练到 API 上线的每一步都构成不可篡改的时间线。ERC 公证收据为每条事件提供独立密码学证明,大幅缩短证据验证周期。
→ 完整案例分析
以下三个虚构案例展示了 AEF 在不同 AI 事故类型中的完整证据链:
| 编号 | 标题 | 事故类型 | AEF 证据 |
|---|---|---|---|
| 001 | AI 误删关键配置文件 | 工具误用(tool misuse) | ✅ 完整回放 + ERC 收据 |
| 002 | AI 修改生产配置并推卸责任 | 多 Agent 协作(multi-agent) | ✅ 因果图 + 责任链 |
| 003 | 人类覆盖被忽略导致部署失败 | 人类覆盖违规(human override violation) | ✅ human.override 事件 + replay |
| 004 | AI 交易决策无法追溯 | 量化交易 | ✅ AEF 事件链 + 因果图 |
每个案例包含:
README.md— 事故描述、事件列表、因果图、关键证据、结论events.json— 完整 AEF 事件文件(含 SHA-256 完整性哈希)receipt.json— ERC 责任收据
AEF 是一份开放、中立、已冻结的 AI 代理执行证据格式宪法。它定义了:
- 什么叫一次真实发生的 AI 行为
- 什么叫一次合法的回放
- 什么叫一次人类干预
- 什么叫一条不可篡改的证据链
详见 aef-core。
如果你想提交一个新的 AI 事故案例(真实或虚构),请参考 incidents/001/ 的格式:
- 创建
incidents/<编号>/目录 - 提供
README.md(事故描述、事件表、因果图、结论) - 提供
events.json(AEF 事件文件,含完整 SHA-256 哈希) - 提供
receipt.json(ERC 公证收据) - 提交 PR