Hasty Briefsbeta

双语

First 70B model released with all training epochs and data

8 months ago

#Korean
#LLM
#checkpoints

Tri系列韩语大语言模型首次发布中间检查点（0.5B/1.9B/7B）
按固定token间隔发布检查点：约200亿token（0.5B）、400亿（1.9B）、1600亿（7B和70B）
包含最初用于系统启动的0.5B和1.9B版本，现可用于小规模训练分析
检查点下载链接：Tri-0.5B、Tri-1.9B、Tri-7B、Tri-70B（SFT预览版）
提供Hugging Face的`AutoModelForCausalLM`和`AutoTokenizer`使用示例