GNU C Library Sees Up to 12.9x Improvement with New Generic FMA Implementation
6 months ago
- #FMA
- #GNU C Library
- #performance
- Adhemerval Zanella为GNU C库贡献了新的通用FMA实现方案
- 新实现主要采用整数运算,避免了设置舍入模式带来的性能开销
- 修复内容包括:信号NaN问题、使用math_uint128.h进行64位乘法运算、arm32舍入模式修复
- 该实现展现出显著的性能提升,某些情况下可达12.9倍加速
- Glibc 2.43将包含来自CORE-MATH项目的额外优化数学函数
- 已添加remainder、frexpf等函数的优化实现版本
- 将多个函数的SVID处理移至兼容符号,从而提升性能
- Glibc 2.43计划于2024年2月正式发布