新闻中心

当前位置: 首页 > 新闻中心 > 学院新闻 > 正文

AIR观点|聂再清:数据驱动的个性化营养健康管理是慢病管理的核心

来源:       发布时间:2022-06-08

         

         

6月2日,2022北京智源大会AI赋能生命健康专题论坛成功召开,AIR聂再清教授、许锦波教授、彭健教授均线上出席演讲。生命健康关系着国计民生,是人工智能技术交叉落地最重要的领域之一。生命健康领域覆盖面非常广,从未知疾病预警、新药开发,到老药新用、辅助诊断、医疗影像、智能手术机器人,很多方向都有AI的用武之地。除了上述三位AIR的教授外,本次论坛还邀请到了加州大学圣巴巴拉分校计算机系助理教授李磊,加拿大MILA实验室助理教授唐建,星药科技创始人&CEO李成涛以及智源健康计算中心负责人黄文灏、叶启威,智源青年科学家袁洋等,为大家介绍在AI+生命健康领域最新前沿进展。


         

         



     

8777D


“引导合理膳食”是“健康中国 2030”规划目标之一。2020年《中国居民营养与慢性病状况报告》显示,我国超重及肥胖症、糖尿病患者数量全球第一,其中不合理的饮食方案与膳食模式是造成这一系列问题的主要原因。(资料来源:https://www.who.int/zh/news-room/fact-sheets/detail/healthy-diet


随着智能手机、可穿戴设备的发展,个性化健康数据与行为数据的采集也更加方便。如何更好地利用多维度健康数据,融合营养健康知识进行“数据驱动的个性化营养健康管理”是聂再清教授带领的DAIR Lab(AIR大数据智能实验室)所关注解决的的核心问题之一。


DAIR-Health: 个性化营养健康管理框架

当前,“数据驱动的个性化营养健康管理”面临着一系列技术挑战。首先是缺乏专业的营养健康知识图谱,知识图谱是数据驱动健康管理的“大脑”,其数据丰富和专业程度决定了“大脑”输出的准确程度和推理的广度;其次,健康领域高价值数据缺失,使得针对营养健康场景的模型训练难度大、外推能力受限;最后个性化营养健康算法对可解释性要求高。针对上述挑战,DAIR Lab提出了DAIR-Health个性化营养健康管理技术框架,包含“营养健康知识挖掘”、“针对营养健康场景的检索增强预训练模型”以及“面向营养健康管理的可解释个性化推荐”核心模块。


260D8

个性化营养健康管理框架


个性化营养健康管理框架的核心是营养健康知识图谱目前营养健康领域正缺乏一个大规模且专业的营养健康知识图谱,且面临如下挑战:

  • 高质量的标注数据有限,而人工标注成本高、周期长,难以跟上知识更新迭代;

  • 预训练模型+Prompt Tuning类的算法表现依赖提示模板,模板手动设计耗时耗力,且仅提供一种模板难以应对复杂语境变化,研究人员不能高效凭经验判断哪个模板更有效。

因此,聂再清教授提出融合了Snowball思想的Prompt-Snowball模型解决在构建大规模营养健康知识图谱过程中专业人员标注成本高和周期长的问题。将少量标注数据作为种子知识,自动挖掘多个提示模板用以识别实体知识,确认的实体知识又可以用来作为种子知识。Prompt-Snowball不仅能够减少人工标注,减轻手动设计提示模板的限制,还可以发掘不具有完整自然语义但有效的提示模板。实验结果表明该方法可大幅提升小样本学习场景下关系抽取性能。


12F71

营养健康知识挖掘


针对当前营养健康场景下的预训练模型面临的痛点和问题,聂教授团队认为检索增强的预训练模型范式在营养健康场景下具有很大的应用潜力。首先,其可以动态检索支撑材料的特性,可以支持知识的随时更新,且低频高价值样本也不会被淹没。其次,可以利用远程监督技术对支撑材料进行富标注,来暴露规则。最后,模型检索到的支撑材料及模型给出的重要度可以用来作为解释,可以更好满足营养健康场景下对于可解释性的需求。将知识图谱与文本库引入预训练模型,能够丰富模型的标注样本库,未来研究团队还会考虑将医疗图像等信息引入,进行多模态增强。


3A504图片针对营养健康场景的检索增强预训练模型


面向营养健康管理的可解释个性化推荐


当前营养健康推荐场景,更多是“迎合式”推荐,并未考虑推荐是否真正健康和适合。Nutrition Knowledge Graph Attention Network (NKGAT),通过构造饮食异质信息网络,结合营养健康知识图谱内的菜品关联和用户兴趣(用户历史建模),从食品营养成分出发建模用户个性化的偏好和健康评分,充分考虑推荐过程中的营养健康因素,避免迎合式的饮食推荐,提升用户依从性。同时,可解释营养推荐还能够基于图谱提供推荐理由,兼顾透明性融合用户偏好和营养健康。


3C579

图片面向营养健康管理的可解释个性化推荐


       


中国饮食营养健康知识图谱NutritionKG

依托技术框架内的核心技术,聂教授在本次大会上发布了中国饮食营养健康知识图谱“NutritionKG”(图谱地址:http://health.baai.ac.cn/thudair/)。该图谱由“清华(AIR)-智源健康计算联合研究中心”与美团、国家卫健委科学技术研究所、北大第一医院妇产科联合研发,包含三万多实体,千万级别的关系数量,对复杂的中国饮食进行营养计算,通过整合大数据知识赋予其营养健康标签。NutritionKG中+V菜品特别由美团联合卫健委营养专家进行权威标注,提供具有专家建议的精准标签。


5BF37图片

     
“AI辅助孕期饮食营养健康管理”示范性应用探究      
       

“清华(AIR)-智源健康计算联合研究中心”与北京大学第一医院妇产科杨慧霞教授团队合作开展,探索“AI辅助孕期饮食营养健康管理”的示范性应用,开发孕期营养健康管理应用 “智护母婴”。该应用基于DOHaD理论,用AI辅助从早孕期开始强化生活方式干预对母体及子代生长发育的影响。DOHaD理论表明生命早期的1000天是影响婴儿健康成长以及未来全生命周期健康的关键阶段,摄取合理的营养对孕妇自身的健康以及婴儿的健康成长和发育至关重要。

“智护母婴”的主要功能有:

  • 满足精准营养的智能菜品推荐。基于NutritionKG和个性化推荐技术,根据孕产妇的个人健康数据、生活习惯等,依据《妊娠合并糖尿病实用手册》等专业医学指导,为孕产妇推荐满足营养摄入需求和个性化口味的菜品组合。

  • 精准营养管理。根据用户的饮食打卡,自动计算热量及6大营养成分摄入,帮助用户进行更精准的营养管理。

  • 孕育科普宣传。提供科学权威的孕育知识,为母婴人群提供专业知识科普。

1285B

图片


特别感谢

以上工作要特别感谢团队成员及合作单位的大力支持,他们分别是:

  • 清华大学智能产业研究院(AIR)团队成员:聂再清、张嘉欢、马为之、李鹏、黄婷婷、刘洋、马维英;

  • 北京智源人工智能研究院团队成员:张学丰、史业民、黄文灏;

  • 合作单位:国家卫健委科学技术研究所,北京大学第一医院杨慧霞教授团队,美团外卖团队

       
清华智能产业研究院
,赞10


关于论坛


3BDB5

图片

2022年北京智源大会于5月31日至6月2日召开,汇聚26场由各领域领军学者主导的专题论坛。大会将紧紧围绕这些当前学术领域迫切需要解决的问题,以及产业落地过程中存在的诸多挑战,延续一贯以来的“内行认可”品质口碑,分享真正内行认可的重大成果与真知灼见,献上一场诚意满满的AI盛宴!


讲者介绍

图片

2758F


聂再清,现任清华大学国强教授、智能产业研究院(AIR)首席研究员。2004年获得美国亚利桑那州立大学博士学位,师从美国人工智能学会前主席Subbarao Kambhampati教授,本科和硕士毕业于清华大学计算机科学与技术系。2017年加入阿里巴巴,任阿里巴巴人工智能实验室北京负责人和阿里巴巴天猫精灵首席科学家。此前就职于微软亚洲研究院,任首席研究员。聂再清博士发表学术论文50余篇,申请了近30项专利,已经授权的有5项全球专利、18项美国专利、和1项中国专利。聂再清博士是微软学术搜索和人立方的发起人和负责人,也是微软自然语言理解平台LUIS的技术负责人。发明的知识图谱相关技术(包括实体信息挖掘、关系抽取技术、和实体名消歧技术)、对象级别的信息搜索技术、语音语义一体化理解技术等,被广泛应用于互联网搜索引擎、聊天机器人、以及智能助手等领域。引领了业内大数据驱动的知识图谱(knowledge graph)挖掘和应用相关技术的创新,在微软期间被授予Microsoft Golden Star奖。在阿里巴巴集团达摩院期间,聂再清博士作为天猫精灵首席科学家,带领团队从无到有实现天猫精灵的所有相关算法研发和创新工作,把人工智能最前沿技术真正落地到千家万户,为千万家庭带来欢乐和陪伴。2019年他所带领的团队获得吴文俊人工智能科技进步奖。


       

关于 DAIR 实验室

大数据人工智能实验室(DAIR Lab)实验室是AIR科研方向的横向支撑实验室之一,由聂再清教授任实验室主任。DAIR Lab致力于针对大数据和人工智能应用中普遍存在的海量数据利用、数据多源异构、高质量训练数据缺乏、数据安全和数据孤岛问题,研究如何利用多模态预训练模型来提升来提高AI的综合认知能力、如何利用主动学习和半监督学习来提升训练数据生产效率、和如何实现以数据不动,数据价值流动为目标的安全高效协同联邦学习体系。打造机器自学习大数据平台,提高人机协作效率,低成本生产高质量知识图谱和ML-Ready数据,解决多种联邦场景下(包括同、异构数据,同、异构设备)的安全联邦学习算法的和质效优化问题。为自动驾驶、健康医疗、生物制药等重点国家行业需求,提供理论支持和技术保障,推动我国在大数据和人工智能领域的战略布局和产业升级。


   

上一条:AIR观点|许锦波:AI预测蛋白质结构将引领智能药物发现 下一条:AIR×大疆:ICRA机器人Sim2Real挑战赛完美收官!

关闭

相关新闻

邮箱:Airoffice@air.tsinghua.edu.cn
电话:(010)82151160  

地址:北京市海淀区清华科技园启迪科技大厦C座12层

官方微信

京ICP备15006448号  |   版权所有©清华大学智能产业研究院