First 70B model released with all training epochs and data
8 months ago
- #Korean
- #LLM
- #checkpoints
- Tri系列韩语大语言模型首次发布中间检查点(0.5B/1.9B/7B)
- 按固定token间隔发布检查点:约200亿token(0.5B)、400亿(1.9B)、1600亿(7B和70B)
- 包含最初用于系统启动的0.5B和1.9B版本,现可用于小规模训练分析
- 检查点下载链接:Tri-0.5B、Tri-1.9B、Tri-7B、Tri-70B(SFT预览版)
- 提供Hugging Face的`AutoModelForCausalLM`和`AutoTokenizer`使用示例