可观测性(Observability)
可观测性 = 系统状态的"外部可探知性"。本 group 解决 L3 第四问:"出了事能不能 5 分钟定位?"
本 group 包含
| 文档 | 核心问题 | V2 节点 |
|---|---|---|
| Log / Metric / Trace | 三大支柱是什么关系? | 控制论 §1 |
| Tracking | 分布式追踪如何落地? | B4 抽象 |
| Communication Information Theory | 监控信号的信息论基础? | 控制论 §3 |
| Wiener Filter | 如何从噪声中提取信号? | 控制论 §3 |
| Vibration Linearization | 波动信号如何线性化? | 控制论 §2 |
可观测性的 3 大支柱
可观测性 = 3 大支柱
1. Logging — 发生了什么(事件流)
2. Metric — 程度如何(数值序列)
3. Tracing — 在哪发生(调用链)阅读顺序
log-metric-trace (三大支柱)
↓
tracking (分布式追踪)
↓
communication-information-theory (信息论基础)
↓
wiener-filter / vibration-linearization (信号处理)与其他 group 的关系
- 上游:02-code / 03-deployment(代码 → 埋点 + 部署 → 可观测)
- 下游:L4 monitoring(可观测 → 监控 + SLO)
关键洞察
可观测性的核心不是"埋点多"——是"能反推系统状态"——
- Log 没埋关键事件 → 出了事不知道发生了什么
- Metric 维度不全 → 不知道是哪个 BC 出问题
- Trace 没串联 → 不知道跨服务延迟在哪 可观测性 = 在你没有预设告警规则时也能定位问题。
相关链接
- L3 Deployment——可观测性的部署面
- L4 Monitoring——可观测 → 监控
- V2 B2 认识自己——观测 = 认识系统