Apex GPU: Run CUDA Apps on AMD GPUs Without Recompilation
3 months ago
- #CUDA
- #AMD
- #GPU-Computing
- APEX GPU技术允许通过LD_PRELOAD方式在AMD显卡上直接运行未经修改的CUDA应用程序,无需重新编译。
- 该技术在运行时将CUDA调用动态转换为AMD等效指令,覆盖内存管理、流处理、事件和内核等核心操作。
- 支持38个CUDA函数、15+种cuBLAS运算及8+种cuDNN神经网络运算。
- 需在Linux系统下配备AMD显卡(RDNA2/RDNA3或CDNA架构)及ROCm 5.0+运行环境。
- 实现极低开销(典型工作负载下<1%),并通过100%测试通过率达到生产就绪状态。
- 包含HIP/cuBLAS/cuDNN桥接模块,各模块体积精巧(分别为40KB/22KB/31KB)。
- 可无缝兼容PyTorch、TensorFlow等主流框架,无需代码改动。
- 采用CC BY-NC-SA 4.0非商业许可,商业使用需另行授权。
- 未来规划包括支持CUDA驱动API、统一内存架构及性能分析工具。
- 欢迎社区参与测试、补全功能模块及完善文档体系。