Hasty Briefsbeta

双语

AVX2 is slower than SSE2-4.x under Windows ARM emulation

10 days ago
  • #Performance
  • #Windows ARM
  • #AVX2
  • 在Prism模拟环境下,Windows ARM平台上的AVX2指令集模拟运行速度比SSE2-4.x模拟更慢
  • 基准测试显示,在ARM架构模拟运行时,AVX2代码性能仅为SSE2-4.x的2/3
  • Intel硬件原生AVX2比SSE2-4.x快2.7倍,但在ARM模拟环境下反而更慢
  • 模拟性能较低的可能原因包括:128位NEON操作与256位AVX2的差异、Prism模拟器新推出/未优化、以及对双精度浮点的优化不足
  • 对于性能敏感型应用,建议直接编译ARM原生版本,而非依赖x64模拟运行