Hasty Briefsbeta

双语

CUDA Tile Open Sourced

2 months ago
  • #CUDA
  • #GPU
  • #MLIR
  • CUDA Tile IR 是一种基于MLIR的中间表示和编译器基础设施,专为CUDA内核优化设计。
  • 其核心聚焦于基于分块的计算模式及针对NVIDIA张量核心单元的优化策略。
  • 该项目为NVIDIA GPU上的分块计算表达与优化提供了完整的生态系统。
  • 主要组件包括:CUDA Tile方言、Python绑定、字节码及一致性测试套件。
  • 系统要求包含:CMake 3.20.0+、C++17编译器、Python 3.6+、MLIR/LLVM源码及Ninja构建系统。
  • 构建选项支持从GitHub自动下载、使用本地LLVM源码或预编译的LLVM库。
  • 提供Python绑定支持以编程方式操作中间表示。
  • 默认启用基于LLVM lit测试框架的测试功能。
  • 可通过预编译库或源码编译两种方式集成到其他项目中。
  • 示例代码演示了如何编译并运行简单的Tile IR内核。
  • 目前暂不接受外部代码贡献,但鼓励通过GitHub Issues提交反馈。
  • 项目采用Apache License v2.0许可证(含LLVM例外条款)。