Hasty Briefsbeta

双语

Genome modelling and design across all domains of life with Evo 2 - PubMed

2 months ago
  • #DNA sequencing
  • #genome modelling
  • #artificial intelligence
  • Evo 2是一个基于90亿个高度精选基因组图谱DNA碱基对训练的生物基础模型
  • 该模型具备100万token的上下文窗口,并保持单核苷酸分辨率
  • 无需任务微调即可预测基因变异的功能影响,包括非编码致病突变和具有临床意义的BRCA1变异体
  • 模型能学习与生物特征相关的表征,如外显子-内含子边界、转录因子结合位点和蛋白质结构元件
  • 在基因组尺度上生成的线粒体、原核和真核序列,比既往方法具有更高的自然度和连贯性
  • 还能生成经实验验证的染色质可及性模式
  • 模型及相关资源(包括参数、训练代码和OpenGenome2数据集)已完全开源以加速生物探索与设计
  • 部分作者披露了利益冲突,包括与生物技术公司的隶属关系及顾问职务