Hasty Briefsbeta

双语

Apex GPU: Run CUDA Apps on AMD GPUs Without Recompilation

3 months ago
  • #CUDA
  • #AMD
  • #GPU-Computing
  • APEX GPU技术允许通过LD_PRELOAD方式在AMD显卡上直接运行未经修改的CUDA应用程序,无需重新编译。
  • 该技术在运行时将CUDA调用动态转换为AMD等效指令,覆盖内存管理、流处理、事件和内核等核心操作。
  • 支持38个CUDA函数、15+种cuBLAS运算及8+种cuDNN神经网络运算。
  • 需在Linux系统下配备AMD显卡(RDNA2/RDNA3或CDNA架构)及ROCm 5.0+运行环境。
  • 实现极低开销(典型工作负载下<1%),并通过100%测试通过率达到生产就绪状态。
  • 包含HIP/cuBLAS/cuDNN桥接模块,各模块体积精巧(分别为40KB/22KB/31KB)。
  • 可无缝兼容PyTorch、TensorFlow等主流框架,无需代码改动。
  • 采用CC BY-NC-SA 4.0非商业许可,商业使用需另行授权。
  • 未来规划包括支持CUDA驱动API、统一内存架构及性能分析工具。
  • 欢迎社区参与测试、补全功能模块及完善文档体系。