信任校准

AI 生成的代码需要按风险等级进行对等验证。盲目接受所有输出或逐行审查每一行代码都是浪费时间。本教程帮助你校准信任度，建立高效的验证策略。

验证债务问题

研究表明，AI 生成的代码缺陷率高于人工编写的代码：

指标	AI vs 人工	来源
逻辑错误	多 1.75 倍	ACM 研究，2025
安全缺陷	45% 包含漏洞	Veracode GenAI 报告，2025
XSS 漏洞	多 2.74 倍	CodeRabbit 研究，2025
PR 体积增长	+18%	Jellyfish，2025
每 PR 事故率	+24%	Cortex.io，2026
变更失败率	+30%	Cortex.io，2026

验证等级划分

不同类型的代码需要不同程度的审查。将验证力度与风险匹配：

模板代码

验证等级： 快速浏览

配置文件、导入语句等。花 10-30 秒扫一眼，信任整体结构。

工具函数

验证等级： 快速测试

格式化、辅助函数等。花 1-2 分钟跑一个正常路径测试。

业务逻辑

验证等级： 深度审查 + 测试

花 5-15 分钟逐行审查，覆盖边界情况。

安全关键代码

验证等级： 最高级 + 工具辅助

认证、加密、输入验证等。花 15-30 分钟，使用静态分析、模糊测试、同行评审。

代码类型	验证等级	时间投入	技术手段
模板代码（配置、导入）	快速浏览	10-30 秒	扫一眼，信任结构
工具函数（格式化、辅助）	快速测试	1-2 分钟	一个正常路径测试
业务逻辑	深度审查 + 测试	5-15 分钟	逐行审查，边界情况
安全关键代码（认证、加密）	最高级 + 工具	15-30 分钟	静态分析、模糊测试、同行评审
外部集成（API、数据库）	集成测试	10-20 分钟	Mock + 真实端点测试

没有同行评审时，用以下方式弥补：

高测试覆盖率（>70%）：你的安全网
快速审查（Vibe Review）：介于”盲目接受”和”逐行审查”之间的中间层
- 阅读提交信息/摘要
- 扫一眼 diff 中是否有意外的文件变更
- 运行测试
- 在应用中快速检查
- 如果通过就发布
静态分析工具：ESLint、SonarQube、Semgrep 捕捉你遗漏的问题
时间约束：不要花 30 分钟审查一个 10 行的工具函数

独立开发者工作流：
生成 → 快速审查 → 测试通过？ → 发布
                ↓
        测试失败？ → 深度审查 → 修复

有多名开发者时：

AI 初审：让 Claude 或 Copilot 先审查（可发现 70-80% 的问题）
人工签字确认：AI 审查不等于批准
关键路径由领域专家审查：安全代码交给安全培训过的审查者
轮换审查者：防止形成审查盲区

团队工作流：
生成 → AI 审查 → 人工审查 → 合并
          ↓              ↓
     标记问题        最终批准

”证明它能用”清单

在发布 AI 生成的代码前，逐项验证：

正常路径可用（手动测试或自动化）
边界情况已处理（null、空值、边界值）
错误状态优雅处理（没有静默失败）

输入验证已就位（永远不信任用户输入）
没有硬编码的密钥（搜索 password、secret、key）
认证/授权检查完整（没有绕过现有防护）

需要避免的反模式

反模式	问题所在	更好的做法
”能编译就发布”	语法正确不等于逻辑正确	至少跑一个测试
”AI 写的一定安全”	AI 优化的是合理性，不是安全性	安全关键代码始终手动审查
”测试通过就完事”	测试可能没有覆盖变更的部分	检查修改行的测试覆盖率
”跟上次一样”	上下文变了，AI 可能生成不同的代码	每次生成都是独立的
”高级工程师写的提示词”	资深不等于输出质量有保证	审查输出，而非输入
”只是模板代码”	即使模板代码也可能隐藏问题	至少扫一眼看有没有意外

随时间校准信任度

初始阶段：谨慎对待

刚接触 Claude Code 时审查所有内容
追踪失败模式

Bug 是从哪里溜进来的？记录问题模式
加强关键路径

在有过事故的领域加倍投入审查力度
放松低风险领域

对于稳定的、有测试的代码类型，可以更多信任 AI
定期审计

偶尔抽查那些”被信任”的代码

信任校准流程图

┌─────────────────────────────────────────────────────────┐
│                    信任校准流程                           │
├─────────────────────────────────────────────────────────┤
│                                                         │
│  AI 生成代码                                             │
│         │                                               │
│         ▼                                               │
│  ┌──────────────┐                                       │
│  │ 什么类型？    │                                       │
│  └──────────────┘                                       │
│    │    │    │                                          │
│    ▼    ▼    ▼                                          │
│  模板  业务  安全                                        │
│  代码  逻辑  关键                                        │
│    │    │    │                                          │
│    ▼    ▼    ▼                                          │
│  扫一  测试+ 完整审查                                    │
│  眼    审查  +工具                                       │
│    │    │    │                                          │
│    └────┴────┘                                          │
│         │                                               │
│         ▼                                               │
│   测试通过？ ──否──► 调试并修复                           │
│         │                                               │
│        是                                               │
│         │                                               │
│         ▼                                               │
│       发布                                              │
│                                                         │
└─────────────────────────────────────────────────────────┘