Hasty Briefsbeta

双语

Show HN: I built a tensor library from scratch in C++/CUDA

a year ago
  • #machine-learning
  • #tensor-library
  • #PyTorch-compatible
  • DSC是一个兼容PyTorch的张量库和机器学习模型推理框架
  • 提供类似NumPy/PyTorch的直观API,并优化了易用性
  • 内置神经网络支持(nn.Module),可轻松移植PyTorch模型
  • 支持多后端(CPU/CUDA),通过dsc.set_default_device()无缝切换
  • 极简外部依赖,核心运算采用可移植C++编写以保证效率和跨平台性
  • 定制内存分配器实现零运行时分配,支持线性分配器降低开销
  • 要求:需C++20兼容编译器和GNU Make进行构建
  • 安装步骤:克隆仓库→配置虚拟环境→编译C++库
  • 支持CUDA后端GPU加速,需安装NVIDIA CUDA工具包
  • 集成pytest单元测试,以NumPy作为正确性参考基准