首页 > 数字化 > 正文

继围棋之后,谷歌人工智能可准确预测蛋白质三维空间结构

2020-12-03 14:59:53来源: 南方都市报  

困扰科学家近50年之久的蛋白质折叠问题有了新的解决方法。当地时间11月30日,谷歌旗下DeepMind公司宣布,其开发的AI程序AlphaFold可以准确地预测蛋白质三维空间结构——而高效地破解和疾病有关的蛋白质结构,有助于研究人员发现新型药物。

AlphaFold在蛋白质结构预测竞赛中斩获第一

在今年的蛋白质结构预测竞赛(下称“CASP”)中,AlphaFold程序击败其余近百支参赛团队获得第一,并达到了与实验室测试基本相当的准确性水平。

CASP竞赛每两年举办一次,被业界视为“蛋白质奥林匹克”。主办方会面向全球发布未知的蛋白质序列,每个参赛团队运用自己设计的算法来预测其结构。随后,主办方会将预测结果和实验室结果进行比较,并根据两者的接近性给出0-100的得分。

根据CASP主席、马里兰大学教授约翰·莫尔特(John Moult )的说法,分数达到90 分左右,就意味着这个算法具有和实验室方法一样的破解能力。

今年的CASP比赛已经是第14届。Deepmind称AlphaFold拿下了92.4的平均分,即便是在难度最大的挑战中,AlphaFold的得分中位数也达到了87分。

据莫兰特介绍道,在中等难度的蛋白质结构预测中,其他团队的最高得分为75分,而AlphaFold能够获得90分。

蛋白质靶标的两个示例,绿色为实验室结果,蓝色为计算机预测。图自Deepmind。

早在2018年,AlphaFold首次参加CASP,就在98个参赛团队中名列榜首,准确地从43种蛋白质中预测出了25种蛋白质结构,而第二名的获奖团队仅准确预测出3种。

最新版本的AlphaFold算法不仅表现优于竞争对手,较18年参赛的旧版本相比也有长足进步。图自《自然》官网。

蛋白质折叠问题已困扰科学家近50年

蛋白质为什么重要?DeepMind官网介绍,蛋白质几乎可以支持生命所有的功能,而蛋白质的作用很大程度上取决其3D结构。

人类当前面临的许多挑战,例如开发新的疾病治疗方法或寻找可分解工业废物的酶,都与蛋白质及其作用密切相关。确定蛋白质的形状和功能一直是一个重要的研究领域,而在此前的研究中,每种蛋白质结构的确定可能要花费数年的艰巨工作,并且要使用数百万美元的专用设备。

弄清楚蛋白质会折叠成什么样,被称为“蛋白质折叠问题”。“在过去将近50年的时间里,我们一直在试图解答这个问题。“约翰·莫尔特说。

据《自然》报道,研究人员此前普遍通过X射线、低温电子显微镜等实验技术来确定蛋白质的结构。在80年代至90年代,研究人员曾使用计算机来预测蛋白质结构,但结果并不令人满意。

而AlphaFold可能会为科学家们提供解答这一问题的新思路。德国图宾根马克斯·普朗克生物学研究所演化生物学家安德烈·卢帕斯(Andrei Lupas)已经带领团队花费了十年时间,试图破解一种细菌的蛋白质结构。而AlphaFold在“半小时”内就给出了它的预测。

“它(AlphaFold)将改变研究、改变医学、改变一切,” 卢帕斯说。

DeepMind在官网宣称,像AlphaFold这样能够准确预测蛋白质结构的系统,可以加速许多有重大社会意义的研究,例如,因为不了解蛋白质的结构,研究人员无法进一步了解嗜睡病、利什曼病等热带医学疾病,而这些疾病每年造成了成千上万人的死亡。

此外,DeepMind称,这类系统对于许多基础性的研究也有促进作用:以往开发一种新型药物,可能需要花费超过25亿美元和十年以上的时间,而这类AI系统通过破解和疾病有关的蛋白质结构,有助于研究人员发现新型、有效的药物。

责任编辑:hnmd003

相关阅读

推荐阅读