聂再清：人工智能最有前景的行业是生物世界的数字化

来源：发布时间：2021-05-28

我看到最有前景的，但现在发展却相对缓慢的方向就是生物世界的数字化，即我们如何利用AI技术赋能制药行业，我觉得这是人工智能未来可以提供巨大价值的行业。

——聂再清

【活动介绍】

数博会中国国际大数据产业博览会（简称“数博会”），是全球首个以大数据为主题的国家级展会，迄今已成功举办五届。2021年数博会将聚焦5G背景下的大数据新兴应用，深入探讨人工智能、工业互联网、量子信息、区块链等大数据新兴产业的发展趋势。数博会将更注重创新、融合与开放，立足共赢，围绕大数据最新技术创新与成就，开展高端对话、系列论坛、大赛、展览会等丰富多彩的活动，为高科技企业搭建合作、交流、推介、展示的国际舞台，开拓大数据发展的无限商机和无穷可能。

清华大学国强教授、清华大学智能产业研究院（AIR）首席研究员聂再清于5月26日出席了2021中国国际大数据产业博览会“聚医疗新势能、启数智新未来”论坛（医渡云），并发表“AI+医疗大数据：构建个性化主动健康管理平台”的主题演讲，5月27日出席人工智能高端对话——AI经济共享未来圆桌会议，与主持人杨澜及众多同行就AI经济问题作深入探讨。

【讲者介绍】

聂再清教授现任清华大学国强教授、智能产业研究院首席研究员。2004年获得美国亚利桑那州立大学博士学位，师从美国人工智能学会前主席Subbarao Kambhampati教授，本科和硕士毕业于清华大学计算机科学与技术系。2017年加入阿里巴巴，任阿里巴巴人工智能实验室北京负责人和阿里巴巴天猫精灵首席科学家。此前就职于微软亚洲研究院，任首席研究员，他是微软学术搜索，人立方，以及企业智能助理EDI的发起人和负责人，也是微软自然语言理解平台LUIS的技术负责人。

【AI+医疗大数据：构建个性化主动健康管理平台】

2020年，习近平总书记将“面向人民的生命健康”列为新时期我国科技发展的四大方向之一，国务院每年也为生命健康领域更好地蓬勃发展提供了充足的政策支持。

当前正处于生命健康领域发展的最好时期，具体原因有如下几个方面：

第一，人口老龄化越来越严重，长期处于亚健康状态的年轻人也越来越常见，在各个年龄段，人们对于健康管理都有丰富而且大量的需求；

第二，国家不断出台政策推动健康产业的快速发展，推动大健康产业的发展，建设健康中国；

第三，生物医药领域的融资规模在当前处于绝对领先地位，大健康产业正在酝酿和形成超过10万亿的巨大蓝海市场；

第四，人工智能的进入使得医疗健康技术正在发生范式变迁，我国医疗大健康产业处于酝酿爆发式发展的前夜。

但是目前已有的个人健康管理体系是依赖于症状驱动的被动应对式的健康管理体系，还存在着一定的局限性。这种完全依赖于人工的开环健康管理方式，在医疗资源配置极不均衡的条件下，会导致患者就诊体验差以及增加医生工作负荷等问题。而我们真正需要的是一种针对个人的形成数据闭环的主动健康管理方式，而现在新一代的技术发展使得这种新方式变成了可能。越来越多的物联网设备可以监控个人的健康状况。以可穿戴设备——血糖检测系统为例，一枚小小的贴片就可以实现血糖状况的实时监测，将个人活动与疾病、预防和治疗的反馈构成闭环，还有类似嗅癌犬的AI疾病嗅探器等等。人工智能的发展正在赋能这种新型个人健康管理的协同和闭环体系的形成，通过自动学习人类的行为，将结果反馈回来指导人类，很多时候即便不去医院也能知道自己的健康水平。

因此，聂再清教授介绍了一种人工智能赋能的主动健康管理方式——4P新方式，即提前预防(Predictive)，主动预防(Preventive)，个性化(Personalized)，主动参与(Participatory)。这这种AI赋能的主动健康管理方式，利用智能手机和传感器/可穿戴设备的实时信息和数据流，使得用户可以对特定事件进行提早预防，治疗也会有了以用户为中心的数据闭环而变得个性化。改变现有的医疗开环系统，通过构建个人健康的“测量-估计-指导-影响”闭环系统（Measure-Estimate-Guidance-Influence），帮助人们管理健康。

下图是对主动健康管理和现有体系的对比。在现有体系中，更多还是倾向于使用专业的医疗设备进行健康管理，而在个性化主动健康管理体系中，物联网则会起到很大的作用，借助各种的传感器，可以以用户为中心积累数据，将非个性化的服务变成个性化服务，同时利用AI辅助决策，对用户行为、饮食、就诊参考等各方面提出针对性建议。最好的治疗是不治疗，是通过良好的生活方式变得更健康。这是一种更好的健康管理模式，也是更方便的健康管理方式。

聂再清教授认为，个性化主动健康管理必定成为一个趋势，而人工智能在其中的方方面面都发挥着不可忽视的关键作用。从辅助诊断中的智能阅片，到AI制药中寻找药物和靶点的结合，再到人工智能在基因组学中的应用，AI正在逐渐渗透生命健康的各个领域。虽然AI在该领域的应用还处于初级阶段，但是它进入也让人们看到了更多的希望，同时也带来了很多的挑战。比如数据共享是生命健康管理闭环形成的关键，当前数据链路还没有打通，而跨界人才的稀缺也是不可忽视的问题。

下面这张图这是聂再清教授介绍的大数据和AI驱动的个性化主动健康管理平台。希望将个人健康数据，基因测序与编辑数据，医院数据，以及医学知识库如学术文献和各类知识专家库等医疗大数据进行挖掘整理，利用AI赋能于健康、医疗、制药、基因等各个方面。在真正实现个人健康的个性化主动管理的同时，产生一定的产业影响力。

在个性化主动健康管理方面，聂再清教授主要介绍了四个方面的关键技术。第一个是支持健康计算的多模态AI，第二个是面向健康计算的知识图谱和推理，第三个是个性化推荐引擎，第四个是面向隐私保护的机器学习。

1. 支持健康计算的多模态AI

现阶段在医疗和健康领域，多模态信息是广泛存在的。病历是文本信息，X光片等是图像信息，同时还有很多AIOT实时的流数据，位置信息等构成的时空数据，以及个人的健康体检等记录数据。这些数据可能具有不同的形态，却可以以一种形式映射到语义空间。深度学习在单一模态中具有很成功的应用，那么如何将不同模态的数据联系在一起，以提高AI的认知能力，在这里还有很广泛的可探索空间。

聂再清教授所在研究院在做大量多模态应用的AI工作，包括多模态信息的表示，多模态信息的对齐，多模态信息的融合，多模态信息的转换等等。同时，也在尝试更多的运用规则和知识，将这些逻辑推理的工作和深度学习进行结合以增强结果的可解释性。

2. 面向健康计算的知识图谱和推理

想要做好这些工作，离不开一个很好的知识图谱的搭建。例如现阶段进行的食物计算，就是知识挖掘工作和知识图谱很好的结合。通过定量计算，建立食物和营养之间的关系，以及食物和治疗疾病的关系，为用户膳食提供指导和推荐。

3. 个性化推荐引擎

通过构建这样的知识图谱，就可以真正实现主动健康管理的个性化推荐。通过将大量多元异构的内容（膳食/营养，运动/娱乐，就诊科室/大夫等）推荐给真正需要他们的用户，为用户的主动健康管理提供帮助。

4. 面向隐私保护的机器学习

我们正都身处于大数据时代，数据隐私是这个时代下不可忽视的问题之一。当前的公开数据所在比重越来越少，机构内的私有数据和用户的个人隐私数据是当前真正的最为大量的数据。与此同时，数据的拥有模式使得数据孤岛的问题逐渐强化，而数据孤岛却不利于大数据真正的应用。如何在使数据产生质量的同时，让数据所有机构放心，让个人用户放心，这是当下着眼要解决的。

近来利用多方安全计算和联合建模解决数据孤岛问题的工作收到大量的关注。要大家都能够参与到多方安全计算的努力中来，最需要解决的问题之一是提高用户参与提供数据的意愿。因此，对于用户的激励机制很重要。在联邦学习中，数据可用而不可见，如何利用激励机制，高效的实现数据的价值和质量的公平匹配也是亟待提供更为优质的方案的。

医疗大数据产业正处于爆发阶段，大数据和AI驱动的个性化主动管理平台也一定会成为未来的趋势。如何利用多模态AI、知识图谱与推理、个性化的推荐引擎和面向隐私保护的机器学习这四个关键性技术赋能个性化健康管理平台，是全面实现个性化主动健康管理必须要取得突破的方向。

【人工智能高端对话——AI经济共享未来】

5月27日，聂再清教授出席2021中国国际大数据产业博览会人工智能高端对话——AI经济共享未来圆桌会议，与商汤科技副总裁张果琲，海信集团高级副总裁、海信智能科技集团总裁陈维强，国双创始人兼CEO祁国晟、源讯中国及相关地区副总裁孙冀军及主持人杨澜就AI问题进行了短平快的思想交锋。

针对杨澜提出的AI技术安全性问题，聂再清教授首先提出了“用技术手段来处理安全问题”的观点，并举例：现实生活中很多人应该都收到过扰骚扰电话，大家都觉得这是一件很烦恼的事情，因为电话另一端可能是机器在自动打电话，聂再清在天猫精灵的研究团队想出的解决办法则是用机器来判断是否是机器打来的骚扰电话，对不能准确判断的陌生可疑电话用机器来自动接电话，并和广告推广人员进行自动对话和记录谈话内容。电话主人只需要在有时间的时候浏览一下是否有一下真正他们需要的推广信息。在他看来，人们可以用技术去对付技术可能带来的破坏。聂再清教授还提到，设计人员在进行人工智能系统设计时就应该将安全可控性纳入考虑范围，做到系统的权限完全可控，随时可降级。每一个智能系统都是由人设计的，最终也要由技术研发人员以及技术使用者（经常是产品和运营团队）负责。

聊到人工智能技术应用中的伦理和法律问题，聂再清教授指出，现今社会，用户确实在使用技术的时候面临着便利和隐私的权衡，这时候，决策权应该交给用户，由用户来决策到底需不需要这份便利。其次，就算是用户需要使用这份便利的时候，算法也应当做到让用户可用不可见，且应当被用在用户同意这那个功能上而非其他功能上。最后，解决技术使用中的便利和隐私问题，肯定还需要相关法律的帮助。

谈到智慧城市建设中是否存在技术壁垒问题，祁国晟、孙冀军、张果琲均认为在智慧城市的建设在各个厂之间竞争是良性的，大家既可以合作，也可以竞争。而聂再清教授则提出了他在这个过程中看到的一些挑战，例如数据孤岛——各个大公司在同一个问题的数据集（非业务数据）是否可以实现某种程度的共享（或费用分摊，而不是重复建设），是不是可以更多的共享一些非关键创新的数据集和能力建设？虽然现如今做标注很火，但是会不会可能是重复标注？

最后，谈到对于未来两年人工智能和实体经济结合最快最充分的领域的预测，聂再清教授认为，落地最快应是影响人们日常生活，有大量使用量、大量数据的行业，包括衣食住行各个领域。在他看来，个性化推荐就是大规模影响用户，能够且已经带来大量价值的技术，也应该是落地最快的。而聂再清教授认为最有前景，不一定是最快的行业，是生物世界的数字化，即如何复用深度学习和NLP等AI领域近年来的成果，在制药行业产生颠覆性的创新，为癌症治疗等医学难题带来新突破。

【资料下载】

公众号回复“数博会” 📦获取演讲完整PPT

撰文/张嘉欢刘聆羽

编辑排版 / 刘聆羽

校对责编 / 聂再清黄妍

关于AIR

新闻中心

AIR团队

科学研究

产业交流

人才招聘

院级合作单位

新闻中心

学院新闻

大师对话

学术简报

媒体报道

聂再清：人工智能最有前景的行业是生物世界的数字化

相关新闻

AIR 科研｜LLM RL最强算法，清华AIR-字节跳动SIA-Lab联合发布

【点击预约直播】张亚勤对话诺奖得主巴里·马歇尔

重磅首发！清华AIR与亚信科技联合发布《DeepSeek赋能自智网络高阶演进评测报告》

最新动态

官方微信