CUDA Tile Open Sourced
2 months ago
- #CUDA
- #GPU
- #MLIR
- CUDA Tile IR 是一种基于MLIR的中间表示和编译器基础设施,专为CUDA内核优化设计。
- 其核心聚焦于基于分块的计算模式及针对NVIDIA张量核心单元的优化策略。
- 该项目为NVIDIA GPU上的分块计算表达与优化提供了完整的生态系统。
- 主要组件包括:CUDA Tile方言、Python绑定、字节码及一致性测试套件。
- 系统要求包含:CMake 3.20.0+、C++17编译器、Python 3.6+、MLIR/LLVM源码及Ninja构建系统。
- 构建选项支持从GitHub自动下载、使用本地LLVM源码或预编译的LLVM库。
- 提供Python绑定支持以编程方式操作中间表示。
- 默认启用基于LLVM lit测试框架的测试功能。
- 可通过预编译库或源码编译两种方式集成到其他项目中。
- 示例代码演示了如何编译并运行简单的Tile IR内核。
- 目前暂不接受外部代码贡献,但鼓励通过GitHub Issues提交反馈。
- 项目采用Apache License v2.0许可证(含LLVM例外条款)。