Track Errors First
a year ago
- #observability
- #software-development
- #error-tracking
- 传统可观测性聚焦于仪表盘、追踪、指标和日志,却常忽视最有价值的信号——错误。
- 异常意味着代码假设的失败,这使它们成为可观测性中最值得追踪的事件。
- 可观测性三大支柱(日志、指标、追踪)虽有用,但无法精确定位代码断裂点,这需要专业的错误追踪机制。
- 异常提供高价值事件数据,直接包含故障信息:堆栈追踪、局部变量、请求数据和用户上下文等。
- 错误追踪在可观测性平台常被抽象化处理,异常仅被视为普通数据点而非有意义的故障信号。
- 多数APM工具宣称追踪错误,实则仅作数量统计,缺乏理解与修复问题所需的完整上下文。
- 部分错误追踪工具演变为全功能可观测性平台,反而增加噪音并弱化了对错误的专注度。
- Bugsink创始人Klaas主张将错误追踪置于可观测性核心,批评当前趋势正将错误边缘化。