Hasty Briefsbeta

双语

What CI looks like at a 100-person team (PostHog)

2 months ago
  • #AI
  • #FlakyTests
  • #CI/CD
  • PostHog的CI系统在一周内运行了575,894个任务,处理了11.8亿条日志,并执行了3300万次测试。
  • Mendral是一个AI代理,专门用于诊断CI故障、隔离不稳定的测试,并通过PR提交修复方案。
  • PostHog的CI基础设施每天处理合并到主分支的65次提交和105个PR测试。
  • 在规模化场景下,即使99.98%的通过率也会因海量测试执行产生显著噪音。
  • Mendral能大规模处理日志,检测追踪不稳定测试,提交修复PR,并像团队成员一样在Slack上协作。
  • 不稳定的测试很少是随机的,其根本原因通常是确定性的,如时序依赖或共享状态问题。
  • 路由问题(确定故障通知对象)与诊断故障本身同等重要。
  • 在PostHog这样的公开代码库工作,确保了Mendral行为的透明度和可问责性。
  • AI编程工具增加了代码变更频率,使得大多数团队的CI挑战日益增长。
  • PostHog工程团队展现了高效运作的典范:运行22,477项测试仍保持99.98%通过率。