Hasty Briefsbeta

双语

NumKong: 2'000 Mixed Precision Kernels for All

2 months ago
  • #Numerical Computing
  • #Open Source
  • #SIMD
  • NumKong是一个大型开源项目,包含2000多个SIMD内核,支持7种编程语言的混合精度数值计算。
  • 该项目支持多种硬件扩展,如RISC-V向量扩展、Intel AMX和Arm SME矩阵块。
  • NumKong为地理空间计算(Haversine和Vincenty算法)和网格对齐(Kabsch和Umeyama算法)提供高性能实现。
  • 支持从BFloat16、Float16到Float6乃至Int4/UInt4的广泛数值类型。
  • NumKong提供WebAssembly SIMD后端,适用于AI沙盒、边缘计算和浏览器环境。
  • 项目注重数值稳定性和精度,基准测试显示其性能可与NumPy+OpenBLAS和PyTorch+MKL组合媲美。
  • 虽为USearch设计,但NumKong已开源通用,提供14+种编程语言绑定。
  • 文章探讨了2026年RISC-V、Intel AMX和Arm SME架构的发展挑战与现状。
  • 包含补偿求和、查表转换等先进内核设计模式。
  • 项目采用显式内存管理和并行策略,避免隐式内存分配和线程操作。