Parrot – A C++ library for fused array operations using CUDA/Thrust6 months ago#CUDA#GPU-acceleration#C++https://nvlabs.github.io/parrot/Copy LinkParrot 是一个基于 CUDA/Thrust 实现数组融合运算的 C++ 库。它提供具有融合求值语义的 GPU 加速运算。特性包括数组运算的隐式融合、GPU 加速和可链式操作。快速入门示例展示了矩阵行向量的 softmax 计算。可查阅性能对比及更多示例代码。