11月9日,清华大学智能产业研究院(AIR)首届博士生论坛及奖学金颁奖活动在图灵报告厅举办,AIR执行院长刘洋教授、AIR教师代表、硕博学生、以及产业合作伙伴代表参加了本次活动。
AIR是面向第四次工业革命的国际化、智能化、产业化的校级研究机构,AIR的使命之一就是培养具有创新思维、国际视野、产业敏锐度、掌握一流先进技术的人工智能领域科技与产业领军人才。本次博士生论坛为同学们营造了学术自由交流、链接产业互动的平台,也充分展示了AIR人才培养的阶段成果。
论坛首先邀请刘洋教授就博士生科研选题的方法论做主题报告。在分享中刘洋教授指出博士生研究选题是科研道路上面对的第一个重要问题,也是关乎研究成败的战略性重大决策。树立正确的科研三观对选题至关重要,AIR研究生们应当具备推陈出新、创新至上的科研世界观;追求卓越、锻炼能力的研究人生观;创造知识、服务国家的价值观。结合选题在重要性、创新性、前沿性、探索性、基础性、复杂性、系统性、可行性、承接性、适应性的综合考量,充分的调研和思索,尽可能多找出候选题目。刘洋教授还对文献调研以及阅读方法向现场的同学传授了经验,并最后鼓励学生们独立思考,理性决策,有勇气选择具有挑战性的研究题目。
AIR执行院长刘洋教授作报告
做面向产业,具有产业价值和影响力的研究是AIR刻在名字里的基因,这一基因决定了AIR博士生培养的底色。我们和产业不仅有科研合作,还携手共同培养未来优秀的产业人才。本次论坛特别邀请到联想研究院人力资源总监任晓洪女士、高校合作经理邢悦女士从企业视角,带来对科研人才培养和校企合作的思考。
通过交流,在场的同学们立体直观地感受到了联想全球化的研发布局,以及持续的研发资金投入。联想研究院携手国内知名高校与科研机构,借助联想丰富的产品场景,通过学术合作,一起探索、定义、解决新的技术问题,并取得一系列丰硕成果。
活动现场任晓洪总监还为同学们介绍了联想的人才观及培养体系,一个年轻创新、多元包容、注重科研、自由探索的新联想跃然于面前。联想完备的职业发展通路、自上而下对科研的支持与重视、丰富的朋辈交流活动、全球化持续赋能的培养理念,给同学们留下了深刻印象,让人真切领略到联想舞台的无限可能。
联想研究院人力资源任晓洪总监为AIR同学介绍联想人才观及培养体系
联想高校合作经理邢悦为AIR同学介绍联想高校合作
AIR为进一步完善人才培养体系,自2022年起设立多个奖学金项目,鼓励学生科研创新、勇于探索、全面发展。本年度首次评选了院长奖学金、清华之友-智能产业研究院联想奖学金,经答辩评审,共6名同学获得上述奖学金荣誉,并在论坛期间举行了奖学金颁奖仪式。
任晓洪女士与刘洋教授为获得联想奖学金的博士生陈小雪、孔祥哲、李健雄进行颁奖
联想是首家资助AIR学生培养的企业。未来,双方希望能继续促进企业与高校之间合作,通过奖学金项目激励AIR博士生。
刘洋教授为获得院长奖学金的博士生杨宗翰、温皓、罗弈桢进行颁奖
院长奖学金是AIR院设最高荣誉奖学金,未来将持续增加奖励力度,不断鼓励AIR学生奋勇拼搏,勇毅前行。
在论坛的学生报告分享环节,邀请6名同学围绕“复杂场景的三维重建和逆渲染”、“几何机器学习用于抗体设计”、“离线数据驱动的可持续进化决策方法”、“基础模型与控制理论和算法的交叉研究”、“基于大模型和用户行为记录的移动端任务自动化助手”、“生物医药领域的多模态表示学习与大模型”等领域方向,对近期科研阶段工作做了主题报告。
参会师生就精彩的学术报告,积极发言,深入探讨。论坛会场还遴选了AIR博士生二十余份优秀科研论文,供集中展示与交流。
本次论坛促进了AIR博士生学术思想和研究成果的交流与分享,取得了热烈反响。
附:学生报告分享
陈小雪同学的研究方向是计算机视觉,主要涉及三维视觉与场景理解。曾在CVPR,Neurips和ICCV等国际顶级计算机会议上共计发表超过10篇论文,研究课题涉及三维物体检测、语义理解和透明物体重建等任务。
在本次分享中,陈小雪聚焦基于室外场景的逆渲染给出了她的科研内容的介绍。具体来说,从多视图图像重建三维场景是计算机图形学和视觉领域的一项基本任务,这个过程被称之为逆渲染。考虑到现有算法的缺陷,她针对室外场景几何复杂、光照建模困难的问题,提出了基于神经辐射场的场景属性建模,通过将几何建模为SDF场、场景外观参数化为与视图相关的辐射场、光照建模为基于时间的环境贴图、材质建模为基于微表面的BRDF实现了室外场景的属性分解。此外,她提出基于蒙特卡洛积分的可微重渲染过程,从而实现了高精度的图像重渲染结果。这项技术成果地从捕获的二维图像重建高保真度的三维场景,可以随意在室外场景中添加或删除对象,编辑场景,以及根据用户需求调整光照效果,进而修改室外天气,对于推动AR/VR,数字城市等未来应用的发展具有显著的潜力和意义。
孔祥哲同学主要研究基于几何图学习解决科学领域(尤其是生物、化学、制药等领域)的问题。在这些领域中,我们的研究对象多是三维空间中的微观粒子(原子、分子等)。在小分子生成领域上,我提出了主子图的概念以及相应的抽取和分子分解算法,并开发了基于主子图的小分子设计与优化模型,相关论文在NeurIPS 2022上进行了口头汇报。在抗体设计领域,他将条件抗体设计形式化为了几何图生成的任务,并将E(3)-等变性内嵌入多通道注意力图网络,提出了渐进式的非自回归生成算法,在条件抗体设计上取得了SOTA的效果。相关论文发表在ICLR 2023上,并获杰出论文奖提名。进一步地,结合实际落地需求,孔祥哲同学考虑了未知抗体结构和结合构象的场景,设计了首个端到端全原子条件抗体设计的模型,仅依赖抗原决定簇和给定的框架序列即可生成完整的抗原-抗体复合物。相关论文发表在ICML 2023上。他希望生成式AI强大的空间探索能力最终可以实现传统药物研发过程难以完成的困难靶点药物发现(例如癌症、HIV等疾病相关靶点以及跨膜靶点)。
李健雄同学的主要研究方向为离线强化学习等基于数据驱动的智能决策算法,致力于研发具有高泛化性和高可用性的智能体,让智能决策算法跳出仿真器和游戏AI的应用场景,推动智能决策在实际任务中的应用。李健雄提出了一种基于离线数据驱动的可持续进化决策框架。该框架包含有高泛化性的离线策略学习,兼顾稳定性与最优性的离线策略微调,以及虚实结合的离线策略评估三个环节。这三个环节互为一个有机的整体,完成了离线策略学习的数据闭环,目标是实现决策模型在不断的学习与数据积累过程中可持续进化,为开发高通用性和高泛化性的决策模型提供一条可行的技术路径。目前,基于该可持续进化框架中的各项研究难点,李健雄已在ICLR和NeurIPS等A类会议发表论文数篇,所提出的智能决策算法有望应用于智慧交通、自动驾驶、智能机器人等决策领域中,系列科研成果也应用于AIR同百度、毫末智行等企业的合作中,进一步提高自动驾驶的驾驶性能。
杨宗瀚同学的主要研究方向是基础模型和控制理论和算法的交叉,目前聚焦于模型的安全可靠性。他提出了基础模型高效微调的最优控制理论框架;基于反馈控制理论,设计了一系列测试时微调的高效算法,从而使基础模型在诸如文本理解和生成上的行为更加安全可靠。论文发表于ICLR, ICML, NeurIPS,ACL等顶级会议上,以及顶级期刊Nature Machine Intelligence并被选为封面文章。其工作曾被加州理工学院Anima Anandkumar、马里兰大学Tom Goldstein等国际知名学者团队引用,并被基础模型领域创业独角兽Cohere作为基线模型进行分析研究。基础模型与控制的交叉具有广阔的前景。一方面,当前基础模型的安全性受到社会各界的广泛关注,利用控制理论和算法可以提高基础模型的可靠性和可解释性;另一方面,利用基础模型在不同场景中进行控制和决策是基础模型领域的下一步,这可以让基础模型的能力在更加实用的场景中最大化的发挥价值。
报告五:基于大模型和用户行为记录的移动端任务自动化助手
温皓同学的主要研究方向是移动端模型加速以及移动端基础模型应用。他致力于研发高性能、智能化和个性化的手机端个人助理。在研究成果方面,他已经在ACM MobiCom2023会议上发表了题为《AdaptiveNet: Post-deployment Neural Architecture Adaptation for Diverse Edge Environments》的论文。该论文介绍了AdaptiveNet这一用于多样化边缘环境的后部署神经架构自适应方法。该方法通过自动生成不同的弹性化结构,使神经网络能够适应不同的边缘设备,从而提高模型的性能和效果。此外,他还和合作者们提出了基于app特定知识的移动端自动化助手,并有一篇在投论文。在产业应用方面,温皓和他的合作者们针对数据中心电池寿命预测问题提出了一种基于检索的跨域时间序列预测模型,并投稿IEEE GreenCom 2023。
罗弈桢同学分享了他在生物医药领域的多模态表示学习与大模型领域的三项研究工作,包括基于多模态数据的AI药物研发下游任务框架KEDD、小分子多模态表示学习模型MolFM和生物医药多模态大模型BioMedGPT。通过桥接以大小分子结构、单细胞测序为代表生命语言模态和以知识图谱、文本为代表的人类语言模态,能够解决传统AI模型在生物医药研发中的两大挑战。首先,借助模态融合,能够让AI像人类专家一样学习生命科学知识,从而加深理解;其次,借助模态翻译,研究者可以为模型的预测结果提供解释,甚至采用自然语言交互的形式进行分子设计。这将为AI4Science研究带来新范式,并在实际的药物研发场景中极大地提升效率、降低成本。