Skip to content

可观测性(Observability)

可观测性 = 系统状态的"外部可探知性"。本 group 解决 L3 第四问:"出了事能不能 5 分钟定位?"

本 group 包含

文档核心问题V2 节点
Log / Metric / Trace三大支柱是什么关系?控制论 §1
Tracking分布式追踪如何落地?B4 抽象
Communication Information Theory监控信号的信息论基础?控制论 §3
Wiener Filter如何从噪声中提取信号?控制论 §3
Vibration Linearization波动信号如何线性化?控制论 §2

可观测性的 3 大支柱

可观测性 = 3 大支柱
  1. Logging  — 发生了什么(事件流)
  2. Metric   — 程度如何(数值序列)
  3. Tracing  — 在哪发生(调用链)

阅读顺序

log-metric-trace (三大支柱)

tracking (分布式追踪)

communication-information-theory (信息论基础)

wiener-filter / vibration-linearization (信号处理)

与其他 group 的关系

  • 上游:02-code / 03-deployment(代码 → 埋点 + 部署 → 可观测)
  • 下游:L4 monitoring(可观测 → 监控 + SLO)

关键洞察

可观测性的核心不是"埋点多"——是"能反推系统状态"——

  • Log 没埋关键事件 → 出了事不知道发生了什么
  • Metric 维度不全 → 不知道是哪个 BC 出问题
  • Trace 没串联 → 不知道跨服务延迟在哪 可观测性 = 在你没有预设告警规则时也能定位问题

相关链接

Last updated:

从名家方法论与工程化思路中蒸馏出自己的工程体系。