Genome modelling and design across all domains of life with Evo 2 - PubMed
2 months ago
- #DNA sequencing
- #genome modelling
- #artificial intelligence
- Evo 2是一个基于90亿个高度精选基因组图谱DNA碱基对训练的生物基础模型
- 该模型具备100万token的上下文窗口,并保持单核苷酸分辨率
- 无需任务微调即可预测基因变异的功能影响,包括非编码致病突变和具有临床意义的BRCA1变异体
- 模型能学习与生物特征相关的表征,如外显子-内含子边界、转录因子结合位点和蛋白质结构元件
- 在基因组尺度上生成的线粒体、原核和真核序列,比既往方法具有更高的自然度和连贯性
- 还能生成经实验验证的染色质可及性模式
- 模型及相关资源(包括参数、训练代码和OpenGenome2数据集)已完全开源以加速生物探索与设计
- 部分作者披露了利益冲突,包括与生物技术公司的隶属关系及顾问职务