Load-Store Conflicts
a year ago
- #compression
- #microarchitecture
- #performance
- meshoptimizer实现了高效的网格数据解压缩几何压缩算法。
- 索引解码器在不同编译器中的性能差异与微架构细节相关。
- 边FIFO结构用于编码/解码三角形索引时的冗余处理。
- 存储到加载的转发对性能至关重要;加载/存储大小不匹配会导致问题。
- GCC-14通过使用向量操作更新FIFO,性能优于Clang-20。
- GCC-15因存储-加载冲突导致显著的性能倒退。
- Apple M4在Clang-17下展现出卓越性能,得益于高效的加载/存储对。
- 存储-加载转发问题可能导致高性能代码中出现意外的性能骤降。