Hasty Briefsbeta

双语

Trained LLMs exclusively on pre-1913 texts

4 months ago

#time-locked-models
#historical-research
#large-language-models

基于Qwen3架构的40亿参数大语言模型家族，在800亿历史数据token上从头训练，知识截止时间严格限定
模型具有时间锁定特性，无法获取知识截止日期之后的任何信息
该项目旨在为人文社科和计算机科学研究提供观察历史的时间窗口
模型会重现训练数据中存在的历史偏见和观点，这一特性有助于理解历史话语体系
正在开发责任访问框架，在向研究人员开放模型的同时防止滥用
项目公开征集关于历史时期、地域范围、研究问题、验证方法和访问框架的建议