Meta新AI预测超6亿种未知蛋白质结构

日期:2022-11-11来源:环球科学点击:359 字号: 手机:

扫描微阅读

图片来源:ESM Metagenomic Atlas (CC BY 4.0)

 

据《自然》新闻(Nature news)报道,近日,Meta 公司开发的 ESMfold 模型预测了细菌、病毒和其他微生物的 6.17 亿种未知蛋白质结构。这些蛋白质结构与任何已知的结构都不同,不曾出现在实验确定的蛋白质结构数据库或 Alphafold 数据库中。相关论文已发布于bioRxiv 预印本网站。

 

与DeepMind公司的Alphafold相比,ESMfold模型大大提高了预测速度,仅2星期就完成了超6亿种蛋白质结构的预测(作为对比,Alphafold平均需要数分钟才能生成一个预测结果)。但ESMfold预测结果的准确性也饱受争议。今年 7 月,Alphafold2 发布了对 2.14 亿 个已知蛋白质三维结构的预测,其中35%的预测结果是高度准确的(达到了实验室测定的结构精度),80%的蛋白质结构可靠性足以用于后续研究。但根据META研究团队的论文,在ESMfold的 6.17 亿 个预测结果中,只有约三分之一被认为是“高置信”(high confience)的预测结果——研究者认为这些预测符合实际结构,且有时可以提供原子尺度的细节特征。一些科学家也提出,ESMFold 提供的数亿 个低置信度的预测结果存在很大问题,其中有些预测结果可能缺乏明确的结构,另一些可能属于被误判的非编码DNA。

名称:电话:
共0条评论

已关闭