Show HN: I built a tensor library from scratch in C++/CUDA
a year ago
- #machine-learning
- #tensor-library
- #PyTorch-compatible
- DSC是一个兼容PyTorch的张量库和机器学习模型推理框架
- 提供类似NumPy/PyTorch的直观API,并优化了易用性
- 内置神经网络支持(nn.Module),可轻松移植PyTorch模型
- 支持多后端(CPU/CUDA),通过dsc.set_default_device()无缝切换
- 极简外部依赖,核心运算采用可移植C++编写以保证效率和跨平台性
- 定制内存分配器实现零运行时分配,支持线性分配器降低开销
- 要求:需C++20兼容编译器和GNU Make进行构建
- 安装步骤:克隆仓库→配置虚拟环境→编译C++库
- 支持CUDA后端GPU加速,需安装NVIDIA CUDA工具包
- 集成pytest单元测试,以NumPy作为正确性参考基准