The Well: 15TB of Physics Simulations
2 months ago
- #dataset
- #machine-learning
- #physics-simulations
- The Well是一个大规模机器学习数据集集合,包含时空物理系统的数值模拟数据
- 它提供15TB数据,涵盖16个跨领域数据集,包括生物系统、流体动力学和磁流体动力学模拟等领域
- 这些数据集既可单独使用,也可作为机器学习与计算科学研究的综合基准测试套件
- 支持通过PyPI安装或源码编译,并提供CUDA等不同硬件加速选项
- 单个数据集大小从6.9GB到5.1TB不等,需要较大磁盘空间
- 支持本地下载或通过Hugging Face流式读取,推荐本地下载以获得更好性能
- 包含基准测试工具,并实现了替代建模的先进模型
- 预训练模型检查点已托管在Hugging Face平台,便于直接加载使用
- 该项目由Polymathic AI主导,汇集了全球多所研究机构的贡献
- 鼓励研究者在论文中引用该项目,维护团队欢迎通过邮件咨询问题或反馈