Hasty Briefsbeta

双语

Trained LLMs exclusively on pre-1913 texts

2 months ago
  • #time-locked-models
  • #historical-research
  • #large-language-models
  • 基于Qwen3架构的40亿参数大语言模型家族,在800亿历史数据token上从头训练,知识截止时间严格限定
  • 模型具有时间锁定特性,无法获取知识截止日期之后的任何信息
  • 该项目旨在为人文社科和计算机科学研究提供观察历史的时间窗口
  • 模型会重现训练数据中存在的历史偏见和观点,这一特性有助于理解历史话语体系
  • 正在开发责任访问框架,在向研究人员开放模型的同时防止滥用
  • 项目公开征集关于历史时期、地域范围、研究问题、验证方法和访问框架的建议