Hasty Briefsbeta

双语

Flash-KMeans: Fast and Memory-Efficient Exact K-Means

2 months ago
  • #K-Means
  • #GPU Optimization
  • #Machine Learning
  • Flash-KMeans被提出作为一种针对现代GPU工作负载的快速且内存高效的精确实K-Means算法
  • 现有GPU实现的K-Means算法受限于系统约束,包括分配阶段的IO瓶颈和质心更新阶段硬件级原子写冲突
  • Flash-KMeans提出两项核心创新:绕过中间内存物化的FlashAssign技术,以及将高冲突原子散射转化为局部归约的排序逆更新方法
  • 该算法包含系统协同设计,如分块流重叠和面向缓存优化的编译启发式策略,以实现实际部署可行性
  • 评估表明Flash-KMeans较基线方法最高可获得17.9倍加速,并分别以33倍和200倍以上的优势超越cuML、FAISS等工业标准库