新闻中心

当前位置: 首页 > 新闻中心 > 学院新闻 > 正文

AIR观点|许锦波:AI预测蛋白质结构将引领智能药物发现

来源:       发布时间:2022-06-08

         

         

6月2日,2022北京智源大会AI赋能生命健康专题论坛成功召开,AIR许锦波教授、聂再清教授、彭健教授均线上出席演讲。生命健康关系着国计民生,是人工智能技术交叉落地最重要的领域之一。生命健康领域覆盖面非常广,从未知疾病预警、新药开发,到老药新用、辅助诊断、医疗影像、智能手术机器人,很多方向都有AI的用武之地。除了上述三位AIR的教授外,本次论坛还邀请到了加州大学圣巴巴拉分校计算机系助理教授李磊,加拿大MILA实验室助理教授唐建,星药科技创始人&CEO李成涛以及智源健康计算中心负责人黄文灏、叶启威,智源青年科学家袁洋等,为大家介绍在AI+生命健康领域最新前沿进展。


         

         



     


A671


蛋白质是组成人体细胞、组织的重要成分,参与了细胞生命活动的每一个进程。对蛋白质功能的研究,有助于了解人体内部的生命活动,对于疾病的发生和药物治疗起到极其关键的作用。另一方面,结构决定功能。因此,想要了解蛋白质的功能,就必须先探究蛋白质的三维结构。在2022年北京智源大会上,清华大学智能产业研究院(AIR)卓越访问教授许锦波详细介绍了蛋白质结构预测的发展历史以及前沿进展。


许教授首先介绍了蛋白质的基础知识。蛋白质是由不同氨基酸按一定顺序通过脱水缩合形成的多条多肽链。这些多肽链因为自身以及环境中的溶剂的力作用,在三维空间上折叠成一种具有特定形状的结构。传统方法需要利用专门的实验手段和仪器(比如冷冻电镜)才能解析出一个蛋白质的结构,耗费时间从几个月到几年不等,费用也特别昂贵。很自然地,人们就希望能设计专门的计算机模型和算法,实现对任意输入的氨基酸序列,自动预测其折叠后的三维结构,这就是所谓的蛋白质结构预测问题。


蛋白质结构预测具有非常大的挑战,被誉为结构生物学界的半个世纪难题。大概在2016年之前的方法大多都是基于能量优化,即根据蛋白质最终的折叠状态位于能量最低点,从而利用能量函数来进行构象搜索。然而,蛋白质含有成千上万的原子,构象空间巨大,而能量函数本身不光滑,导致优化效率很低。从2016年之后,得益于深度学习的发展,研究人员考虑利用深度神经网络直接预测原子之间的相互作用关系。特别是许教授团队基于ResNet开发出RaptorX-Contact方法,首次证明了深度学习方法在预测蛋白质三维结构中的无限潜力和可能性,在号称蛋白质结构预测的奥林匹克比赛CASP12上展现了其强大的性能。许教授的方法能实现原子之间的空间距离的精准预测。


在这之后,就是广为人知的AlphaFold2在CASP14上取得了惊人的预测精度,引起了学术界的广泛关注。作为第二代深度学习算法,AlphaFold2的成功主要来自于三个方面的原因:进化论、大量的蛋白质序列数据和适量的蛋白质结构数据。关于第一点,同一个家族的蛋白质结构相似,空间中相邻的氨基酸相互影响,同时进化。另外两个原因为深度神经网络的学习提供了充分的训练信号。尽管AlphaFold2已经取得了瞩目的成功,但是蛋白质结构预测仍然存在很多需要进一步解决的问题。例如,蛋白质复合物结构预测、蛋白质和其他分子(peptide, DNA, RNA)的相互作用预测、抗体抗原相互作用预测、点突变对结构和功能的影响、蛋白质优化和设计等。


最后,许锦波教授总结了领域的发展现状并且展望了未来趋势。AI 颠覆了蛋白质结构预测,改变了分子生物学家的传统思维模式:基于序列的研究变成基于结构的研究。然而,未来我们只是简单地沿着AlphaFold2 的路线做点改进,重新训练一个模型?答案显然是否定的。我们更重要的是,需要以现有的研究成果为基础,重点解决前面所提到的比如复合物结构预测的问题。


关于论坛

图片

3BDB5

2022年北京智源大会于5月31日至6月2日召开,汇聚26场由各领域领军学者主导的专题论坛。大会将紧紧围绕这些当前学术领域迫切需要解决的问题,以及产业落地过程中存在的诸多挑战,延续一贯以来的“内行认可”品质口碑,分享真正内行认可的重大成果与真知灼见,献上一场诚意满满的AI盛宴!


讲者介绍


1395E


许锦波教授,清华大学卓越访问教授、美国芝加哥丰田计算技术研究所教授、《Bioinformatics》编委。他毕业于中国科学技术大学计算机系,中国科学院计算技术研究所和加拿大滑铁卢大学,是美国麻省理工学院数学系和人工智能实验室博士后。许教授的研究兴趣包括人工智能和机器学习、优化算法和计算生物学。他于 2016 年首次证明了深度学习可以大幅度提高蛋白质结构预测的性能,引领了人工智能在蛋白质结构预测领域的突破。许教授曾获美国斯隆研究奖、美国自然科学基金早期职业奖、《PLoS Computational Biology》创新突破奖、国际计算生物学顶级会议 RECOMB 最佳论文奖和时间检验奖 (Test-of-Time Award),并多次接受英美杂志如《纽约时报》、《经济学人》、《财富》、《自然》 和《科学》的采访。许教授也是2021年未来科学大奖论坛的主讲嘉宾,2021年北京大学顶尖讲学者和2022年在瑞典的诺贝尔论坛特邀嘉宾。


   

上一条:AIR观点|张亚勤:自动驾驶将是第四次工业革命的重要技术和场景 下一条:AIR观点|聂再清:数据驱动的个性化营养健康管理是慢病管理的核心

关闭

相关新闻

邮箱:Airoffice@air.tsinghua.edu.cn
电话:(010)82151160  

地址:北京市海淀区清华科技园启迪科技大厦C座12层

官方微信

京ICP备15006448号  |   版权所有©清华大学智能产业研究院