Hasty Briefsbeta

双语

Tinker by Thinking Machines

8 months ago

#research
#api
#machine-learning

Tinker是一个专为研究人员设计的训练API，提供对模型训练和微调的控制，同时管理底层基础设施。
核心功能包括：forward_backward（执行前向和反向传播）、optim_step（更新权重）、sample（生成文本标记）和save_state（保存训练进度）。
采用LoRA技术进行高效微调，通过训练小型附加模块而非修改全部原始权重，以更低计算量达到全参数微调的效果。
自动处理调度调优、资源管理和基础设施可靠性，支持GPU集群的分布式训练编排。
支持从紧凑型到大型的各种开源模型，并计划持续扩展可选模型范围。
允许在训练期间及完成后下载模型权重。
初期免费提供服务，即将推出基于使用量的计费模式。