跳到主要内容

ops

核对日期:2026-05-13。

这个目录保存发布、监控、灰度和回滚相关资料。即使项目只是本地演示,也应该能说明如果上线会怎么运营。

1. 发布前门禁

  • 核心 eval 通过率达到目标。
  • 安全负例通过率达到目标。
  • 失败样例已进入回归集。
  • 成本和延迟在目标范围内。
  • 高风险动作需要人工确认。
  • 有功能开关和回滚方案。

2. 运行期告警

告警触发条件处理
成本异常单小时成本超过预算限流、降级、检查异常请求
延迟异常p90 超过目标检查模型、检索、工具耗时
安全异常注入或越权样例触发停用相关能力,进入安全复盘
质量异常负反馈或 eval 回归回滚 prompt 或模型版本