Optimization of 32-bit Unsigned Division by Constants on 64-bit Targets
5 days ago
- #64-bit-performance
- #compiler-optimization
- #division-by-constants
- 提出了一种针对64位CPU上32位无符号常数除法的优化方法,改进了现有的GM方法。
- 指出了当前编译器生成代码(例如针对x/7的代码)的局限性,未能充分利用64位处理器的能力。
- 报告了性能提升:在微基准测试中,英特尔至强w9-3495X处理器上实现1.67倍加速,苹果M4芯片上实现1.98倍加速。
- 提到了针对LLVM/GCC的实际实现补丁;LLVM补丁已合并至主分支。
- 将本工作置于现有文献背景中,引用了Granlund、Montgomery等人的贡献。