Trained LLMs exclusively on pre-1913 texts
2 months ago
- #time-locked-models
- #historical-research
- #large-language-models
- 基于Qwen3架构的40亿参数大语言模型家族,在800亿历史数据token上从头训练,知识截止时间严格限定
- 模型具有时间锁定特性,无法获取知识截止日期之后的任何信息
- 该项目旨在为人文社科和计算机科学研究提供观察历史的时间窗口
- 模型会重现训练数据中存在的历史偏见和观点,这一特性有助于理解历史话语体系
- 正在开发责任访问框架,在向研究人员开放模型的同时防止滥用
- 项目公开征集关于历史时期、地域范围、研究问题、验证方法和访问框架的建议