Hasty Briefsbeta

双语

SimpleFold: Folding Proteins Is Simpler Than You Think

5 months ago
  • #bioinformatics
  • #machine-learning
  • #protein-folding
  • SimpleFold是一个基于流匹配的蛋白质折叠模型,使用通用Transformer层构建。
  • 它不依赖三角注意力或配对表示偏置等昂贵模块。
  • 在超过860万蒸馏蛋白质结构和实验PDB数据上训练完成。
  • 参数量级达30亿,是迄今为止最大的蛋白质折叠模型。
  • 在标准折叠基准测试中展现出竞争力表现。
  • 因其生成式训练目标,在集成预测中表现出强大性能。
  • 对蛋白质结构预测中依赖复杂领域专用架构的传统提出挑战。
  • 提供PyTorch和MLX后端的安装指南。
  • 包含从序列预测蛋白质结构的Jupyter notebook教程。
  • 提供多种参数量级(1亿至30亿)的预训练模型。
  • 配备折叠任务和双态预测的评估脚本。
  • 包含训练指导和数据集处理细节说明。
  • 代码和模型附有特定许可协议,建议用户仔细查阅。