前端运维知识体系
面向高级前端工程师的运维知识库。目标是把一个真实的前端项目从源代码送到生产环境,并能独立完成部署、监控、调优、排障、安全加固。
本知识体系定位
本文档不是 SRE 教程,也不是 DevOps 工程师转岗指南。它解决的是这样的问题:
- 前端独立部署一个 Next.js / Nuxt / SPA 应用到云服务器,配齐 HTTPS、CDN、监控
- 前端在 K8s 集群里维护自己的应用,看得懂 yaml,会调资源限制、写 Helm chart
- 前端能在生产事故中独立排查问题,从浏览器一路排查到 Nginx、容器、网络
- 前端能和后端、运维、SRE 顺畅沟通,不被技术黑话挡在外面
- 前端能主导前端项目的可观测性建设,从 RUM 到 APM 全链路
学习路线图
按学习路径拆成三个阶段:
| 阶段 | 模块 | 学完后你能做什么 |
|---|---|---|
| 入门(必备) | 01 / 02 / 03 / 04 / 06 | 独立把项目跑在云服务器上,配 HTTPS、自动化部署 |
| 进阶(独立交付) | 05 / 07 / 08 / 09 | 在 K8s 集群运维前端应用,建立监控告警,做性能优化 |
| 专家(团队骨干) | 10 / 11 / 12 | 主导安全加固、Node.js 服务运维、用 IaC 管理基础设施 |
模块清单
| 模块 | 重点 |
|---|---|
| 01 Linux 基础与 Shell | 文件权限、进程、网络排查、Shell 脚本、journalctl |
| 02 网络协议深入 | TCP/IP、DNS、HTTP/1-2-3、TLS、WebSocket、CDN |
| 03 Nginx 深度实践 | 反代、负载均衡、SPA fallback、限流、调优、故障案例 |
| 04 Docker 容器化 | namespace/cgroup、Dockerfile、多阶段构建、compose、安全 |
| 05 Kubernetes 生产实践 | Pod、Service、Ingress、HPA、Helm、RBAC、前端应用部署 |
| 06 CI/CD 流水线 | GitHub Actions、GitLab CI、缓存、部署策略 |
| 07 云服务与基础设施 | 阿里云、AWS、Cloudflare、对象存储、Serverless |
| 08 监控与可观测性 | Sentry、Web Vitals、Prometheus、ELK、OpenTelemetry |
| 09 性能优化与缓存 | HTTP 缓存、CDN、Service Worker、首屏优化 |
| 10 安全加固 | CSP、HSTS、DDoS/WAF、依赖安全、容器安全、Vault |
| 11 Node.js 服务端运维 | PM2、内存泄漏、性能剖析、零停机部署、SSR 运维 |
| 12 基础设施即代码 | Terraform、Pulumi、Ansible、GitOps |
文档结构约定
每篇文档按以下骨架展开(按主题适当裁剪):
- 概念与原理 — 是什么、为什么需要、底层机制
- 核心知识 — 关键概念、架构、命令/配置
- 生产实践 — 真实场景配置示例、最佳实践
- 性能调优 — 调优参数、基准测试方法
- 故障排查 — 常见问题、排查思路、案例
- 安全考量 — 该主题相关的安全风险与加固
- 常见反模式 — 不应该这样做(附原因)
- 延伸阅读 — 权威资料链接
阅读建议
- 不需要按编号顺序读,从你当前最痛的问题切入即可
- 每个模块的 README 是导航页,先看模块 README 再决定深入哪一篇
- 命令和配置示例都来自真实生产项目,可以直接复制改造
- 故障案例尽量复现,光看不如自己踩一遍