NumKong: 2'000 Mixed Precision Kernels for All
2 months ago
- #Numerical Computing
- #Open Source
- #SIMD
- NumKong是一个大型开源项目,包含2000多个SIMD内核,支持7种编程语言的混合精度数值计算。
- 该项目支持多种硬件扩展,如RISC-V向量扩展、Intel AMX和Arm SME矩阵块。
- NumKong为地理空间计算(Haversine和Vincenty算法)和网格对齐(Kabsch和Umeyama算法)提供高性能实现。
- 支持从BFloat16、Float16到Float6乃至Int4/UInt4的广泛数值类型。
- NumKong提供WebAssembly SIMD后端,适用于AI沙盒、边缘计算和浏览器环境。
- 项目注重数值稳定性和精度,基准测试显示其性能可与NumPy+OpenBLAS和PyTorch+MKL组合媲美。
- 虽为USearch设计,但NumKong已开源通用,提供14+种编程语言绑定。
- 文章探讨了2026年RISC-V、Intel AMX和Arm SME架构的发展挑战与现状。
- 包含补偿求和、查表转换等先进内核设计模式。
- 项目采用显式内存管理和并行策略,避免隐式内存分配和线程操作。