Show HN: TheorIA – An Open Curated Physics Dataset (Equations,Explanations,JSON)
a year ago
- #open-data
- #machine-learning
- #theoretical-physics
- TheorIA是一个经过精心整理、开放且高质量的理论物理方程与推导数据集
- 它解决了理论物理领域缺乏用于训练机器学习模型的结构化数据集的问题
- 条目包含结构化格式的方程、推导过程及解释,并带有AsciiMath数学标记
- 每个条目均由具有物理背景的人员编写和审核,并包含贡献者元数据
- 数据集采用'entries/'文件夹下每个文件存储一个条目的方式组织,便于协作
- 使用ArXiv式分类系统进行筛选,并通过'manifest.json'文件记录版本更新
- 数据集采用CC-BY 4.0许可协议,鼓励使用、混编和教学应用
- 欢迎通过GitHub提交贡献,合并前需通过JSON模式验证
- 既可作为独立JSON文件使用,也可合并为单一文件用于训练流程
- 建议用户引用该数据集,并通过GitHub参与问题讨论或协作开发