Hasty Briefsbeta

双语

NanoChat – The best ChatGPT that $100 can buy

4 months ago
  • #AI-development
  • #LLM
  • #ChatGPT-clone
  • nanochat是一个类似ChatGPT的LLM全栈实现,专为在单台8XH100节点上运行而设计。
  • speedrun.sh脚本可在约4小时内,在8XH100节点上完成100美元档位的nanochat训练与推理。
  • 训练完成后,用户可通过运行python -m scripts.chat_web命令,在类似ChatGPT的网页界面中与LLM交互。
  • 项目包含report.md文件中的评估指标,展示模型在多种基准测试中的性能表现。
  • nanochat支持扩展至更高档位(如300美元的d26模型和1000美元档),需调整数据分片和批量大小。
  • 代码简洁、可自由修改,基于原生PyTorch实现,可适配不同GPU配置。
  • 项目灵感源自nanoGPT和modded-nanoGPT,并鸣谢HuggingFace、Lambda及Alec Radford。
  • 该项目采用MIT开源协议,鼓励研究引用。