Hasty Briefsbeta

双语

Tinker by Thinking Machines

8 months ago
  • #research
  • #api
  • #machine-learning
  • Tinker是一个专为研究人员设计的训练API,提供对模型训练和微调的控制,同时管理底层基础设施。
  • 核心功能包括:forward_backward(执行前向和反向传播)、optim_step(更新权重)、sample(生成文本标记)和save_state(保存训练进度)。
  • 采用LoRA技术进行高效微调,通过训练小型附加模块而非修改全部原始权重,以更低计算量达到全参数微调的效果。
  • 自动处理调度调优、资源管理和基础设施可靠性,支持GPU集群的分布式训练编排。
  • 支持从紧凑型到大型的各种开源模型,并计划持续扩展可选模型范围。
  • 允许在训练期间及完成后下载模型权重。
  • 初期免费提供服务,即将推出基于使用量的计费模式。