我们现在正在经历数字3.0时代,这是一个将信息与物理世界、生物世界融合的智能感知时代。健康计算就是在生物世界的数字化与智能化的大趋势下,我们可以用人工智能和数据驱动的第四科学研究范式,辅助人类探索并解决生命健康的问题。——马维英
活动介绍
北京智源大会是人工智能领域盛会,已成功举办两届。2021北京智源大会于6月1日至6月3日在线上线下同步召开。本次会议共设29个专题论坛,从AI基础研究、跨界融合、到产业应用,为各界人士提供了一个交流和碰撞想法的平台。本次会议聚集了八千余位AI领域的科学家、企业家、投资者、学界人员、业界人员,累计参与观看直播和讨论人次达200万。
2021年6月3日,清华大学智能产业研究院惠妍讲席教授、首席科学家马维英教授应邀参加2021北京智源大会AI 制药论坛,并做主题为《健康计算》的演讲,向大家介绍了健康计算这一新兴研究热点中人工智能的现状、挑战及机遇,及清华大学智能产业研究院(AIR)在健康计算领域的计划与部署。
讲者介绍
马维英博士现为清华大学智能产业研究院惠妍讲席教授、首席科学家。他的研究方向包括人工智能的几个核心领域(搜索与推荐、大数据挖掘、机器学习、自然语言理解与生成、计算机视觉)以及人工智能在生命科学、生物制药、基因工程、以及个体化精准医疗等领域的跨学科研究与应用。他此前曾任字节跳动副总裁兼人工智能实验室主任、前微软亚洲研究院常务副院长。
马博士曾在世界级会议和学报上发表过逾 300 篇论文,并拥有 160 多项技术专利。他是电气电子工程师学会会士(IEEE Fellow),曾任国际信息检索大会(SIGIR 2011)联合主席、国际互联网大会(WWW 2008)的程序委员会联合主席。他于2017年获得吴文俊人工智能科学技术奖二等奖,并曾入选TOP100科学家,全球排名第86位。
报告内容
在报告开始,马维英教授简短的介绍了健康计算的定义,回顾了数字1.0到3.0的进程,以及介绍了AI在生物医疗领域的现状和未来的发展及机遇。
1. 大趋势:生物世界的数字化 自动化 智能科学计算
我们现在正在经历数字3.0时代,之前有内容数字化为主的1.0时期,也有信息网络化为主的2.0时期,在人工智能兴起的这一轮,数字3.0是将信息与物理世界、生物世界融合的智能感知时代。
现在有公司试图用计算的方式加入传统实验,来成为一种可以盈利的服务。AI其实已经在加速生命健康与生物医药领域的发展。开发一种新药平均需要10余年的时间以及25亿美金的资金投入,这养的每个人都可以用的平均药,还远没有到个性化医疗的程度。AI已经有很多方式来加速相关领域的发展。例如AI CRISPR基因编辑来寻找靶点,以加速新靶点的开发。再例如抗体/TCR/个性化的疫苗、蛋白质结构甚至下一步功能的端到端预测。同时,也有一些研究人员在通过机器人技术来自动化湿实验。
2. 健康计算:用计算的方法(人工智能、数据驱动的第四研究范式)辅助人类探索并解决生命健康的问题。
两个领域中间的知识GAP较大,相比于原来的CV/NLP等领域更需要专业知识。生物领域的数据并没有统一的标注,获取相应数据的难度也较大,迭代速度相应受到较大影响。与此同时跨界的人才也非常稀缺。这是非常大的挑战,但是这也是我们的机会。
3. 推动生命科学、生物医药、基因工程、个人健康各领域从鼓励、开环向协同、闭环发展
推进这几个领域有几个策略,如对生物医疗大数据进行更深入的挖掘,如医疗知识库、文献数据库等并没有很好的被利用,如并没有专门对该领域所设计的预训练模型,而构建这样一个模型需要同时有AI以及相对应的医疗领域的专业知识。
4.清华智能产业研究院(AIR):健康计算研究在AIR有四个子方向:
AI增强个人健康与公共卫生:从测量、评估、知道、干预以及到健康管理,形成一个数据闭环,以更好的利用AI的优势。
AI 医疗与生命科学:如智慧医疗、医疗相关的知识图谱与知识引擎,可能需要用到医疗相关知识以及representation learning相对应的技术。
AI新药发现与制造:目前AIR有合作教授即将加入。我们认为现有挑战是公开优质的数据较为稀缺,我们希望在这一块利用基因编辑基因工程等手法来增强对靶点的预测;药物设计针对大分子药,相比小分子挑战更大,机会也更大;药物疗效预测闭环,能开发可解释的药物疗效模型。或基于现有药进行推荐。针对第三期失败的药,分析个性化疗效,以推荐适合的病人,增加药物使用效率和精准度。
基因组分析和编辑:数据压缩编码、基因搜索以及基因价值发现。
5. TDC数据集:
美国六所大学合作收集并整理的,能直接运用于机器学习及其他AI技术的数据库,这是一个非常有意义的工作。如果我们能创建一个类似于计算机视觉中ImageNet数据集一样意义的医疗领域的数据集,那是一个非常不得了的工作。
6. 同时也有一个AI 生命科学破壁计划:
a.提供一个旗舰式的数据集
b.为生命科学家广泛采用应对复杂生物医学挑战的人工智能技术奠定基础
马维英教授也表达了希望中国也有这样一个破壁计划的心愿。这样的计划也会带来更多的尖端跨界人才。
7. 通过AI技术的发展,我们可以从多个方向来增强个人健康的管理和改善健康状态。
现在人一般得了病了才去看医生,技术发展到现在我们应该转变这样被动的方法,而转为主动的,AI主导的健康管理。如新一代的可穿戴式设备,能够对血糖进行更好的监控。再比如AI作为嗅觉感知器来收集健康信息。
基于个性化推荐引擎的智能健康管理系统。如慢性病的判断,如外卖公司对饮食进行统计,通过对食物全链条的数据使用AI处理和分析,能够对个人健康产生较大意义。
增强个人健康的关键技术包括支持健康计算的多模态AI、面向健康计算的知识图谱与推理、个性化推荐引擎,以及,因为相关数据较为敏感,面向隐私保护的机器学习。
8. 多模态AI:
通过不同的表达和模型,来完成更好的、协同的优化学习,也是一个非常关键的技术和研究方向。
9. 总结
健康计算随着数字化3.0时代的到来,也迎来了前所未有的挑战和机遇。马维英教授认为健康计算将推动生命科学、生物医药、基因工程以及个人健康等各领域从孤立、开环向协同、闭环发展。基于此,人类健康服务也将更快速、精准、安全、经济、普惠。健康计算下个十年蕴含着巨大的科学发展与产业创新的机会。
点击此处阅读原文
撰文 /Rui Wang
编辑排版 / 冼晓晴
校对责编 / 黄妍