Hasty Briefsbeta

双语

An Interview with Zen Chief Architect Mike Clark

a year ago
  • #Performance Optimization
  • #CPU Architecture
  • #x86 vs ARM
  • Zen微架构在八年内将AMD的CPU市场份额从10%提升至25%
  • Zen首席架构师Mike Clark讨论x86与ARM指令集的灵活性,指出两者通过适当微架构都能实现相近的每瓦性能
  • x86指令集的变长指令和更强内存模型不会从根本上限制性能或能效
  • 更大页尺寸(如16k或64k)可通过减少TLB压力使Zen架构受益,但4k页仍可通过页合并等技术管理
  • CPU与GPU因侧重低延迟与吞吐量工作负载,缓存行和寄存器大小不同(64字节 vs 128+字节)
  • 由于带宽限制,分散/聚集操作在CPU上具有挑战性,但软件更广泛采用可推动硬件改进
  • 正确使用时非临时存储能超越常规存储,因其减少缓存污染并简化内存子系统操作
  • 现代CPU流水线在概念上与旧设计(如Bulldozer)相似,但专有优化使详细原理图无法公开
  • 像`sqrtpd`这样的长延迟指令由调度器处理,其非流水线化执行避免与其他操作重叠
  • 鼓励软件开发人员采用新ISA特性(如更宽向量、AI指令)并提供反馈以指导未来硬件设计