11月4日,第46期AIR学术沙龙如期举行。本期活动荣幸邀请到了上海人工智能实验室青年科学家,科学智能中心负责人白磊博士,为清华师生带来了一场题为《AGI and Science 人工智能赋能科学研究的新机遇》的深度分享。
白磊博士是上海人工智能实验室青年科学家,科学智能中心负责人。博士毕业于新南威尔士大学,其后于悉尼大学任博士后研究员,主要研究方向为科学多模态大模型、自主发现系统、及其在跨学科交叉领域的应用。已在Nature子刊、Science子刊、IEEE TPAMI、NeurIPS、CVPR、KDD等人工智能领域顶级期刊会议发表学术论文100余篇,并长期担任相关期刊会议的审稿人或程序委员会委员。基于其研究工作入选国家及上海市人才计划,获2024年IEEE TCSVT最佳论文奖、2022年世界人工智能大会云帆奖、2020年新南威尔士大学工程研究卓越奖、2019年谷歌博士奖等。负责或参与研发书生科学多模态大模型Intern-S1、书生科学发现系统Intern-Discovery、风乌气象海洋大模型等,相关成果多次被新华社、人民网、中国新闻周刊、环球时报等主流媒体报道,入选国家发改委“一带一路”推广案例。
白磊博士首先强调了人工智能在科学研究中的重要性。AI 与科学的结合始终伴随人工智能技术的发展,代表性突破包括AlphaFold蛋白质结构预测获得诺贝尔奖、AI气象预测入选2023年Nature十大科学进展、基因组模型Evo2可分析生成DNA、RNA序列,微软MatterGen材料模型破解化学机械电子属性等。
人工智能驱动的科学研究不仅是计算能力的增强,更是研究者、研究工具与研究对象的共同提升与协同进化。它可以实现更高频率的科学创新与发现,推动跨学科交叉融合,打破学科壁垒并拓展科研人员的认知边界。跨机构的协作亦有望将科学发现工程化、系统化,从而带来范式性的变革契机。
白磊博士将 AI 赋能科学的演进归纳为五个阶段,分别是:计算加速、知识增强、深度推理、全流程闭环优化和交叉学科的创新涌现。

第一阶段旨在通过创新的深度学习技术和模型架构创新,显著提升对复杂系统数据(如大气数据、基因数据、材料数据)的处理效率,实现高效的数据压缩与加速计算,为后续分析与应用奠定基础。
以大气数据为例,大气系统具有多维复杂特征,数据存储成本高、传输难度大,为数据科学研发带来壁垒,通过人工智能方法可以将大气数据压缩400倍,显著降低数据存储成本,提升数据共享效率。风乌气象大模型将全球气象预报可用时效提高到10.75天,预测结果超越传统数值模式,计算开销降低2000倍以上。该工作首次推动AI中期气象模型迈入全球10公里级时代。
然而,第一阶段存在诸多问题,深度模型本质上是高维函数拟合,往往缺乏明确的机制性解释、可解释性不足并依赖训练数据的分布,易出现过拟合,导致理论发展有时滞后于实践积累。虽然观测数据已达到 PB 级别,但如何将海量数据高效转化为机制洞察仍是一大挑战。
第二阶段通过引入领域知识来指导预测与优化任务,并借此挖掘新知识。构建“通专融合”的知识与数据双驱动体系,将智能体与实验反馈连接成闭环,从而提升条件优化与决策效率。
例如在气象预测中,引入专家知识可以提高模型的可解释性。通过专家标注构建领域级的思维链数据,有助于更好地指导预测任务;在雷达相关任务中,采用统一架构可同时处理雷达序列理解、反演、图像理解及临近预报等任务,并在若干雷达任务上超过对应专用模型与部分闭源通用模型。
面向医药企业的应用示例中,通过 AI 优化反应工艺,降低某些催化剂用量 10 倍、扩大可探索空间 20 倍,最终产率超越人类专家4.5倍。
高质量的科学假设往往依赖跨学科知识的整合。创造力是AGI的里程碑之一,假设提出是模型能力的重要反映。第三阶段的核心目标是推动AI模型在科学发现中进行深度推理,自主提出兼具高创新性与可行性的科学假设,并将其应用于解决复杂的自然科学问题
具体来说,可以通过解耦研究背景与研究灵感,分别深入理解现有方法和寻找跨领域启发,以兼顾假设的可行性与创新性。进一步的,通过排序机制对生成的多个假设进行优先级排序,快速找到最值得优先尝试的候选方案。由此,在1012量级的参数组合空间,仅用10次实验就找到了兼具高催化活性和稳定性的新配方。


阶段四:全流程闭环优化(Intern Agent)
第四阶段的核心目标是构建名为 Intern Agent 的多智能体科研框架,通过人工智能集成,实现从假设生成到实验执行的全流程自动化、闭环优化与人机协同,极大提升科研效率并拓展科学发现的边界。

InternAgent旨在解决人类科研全流程效率低、难以规模化并行、试错周期长与成本高的问题;突破人类科学家在交叉学科创新上的能力局限;弥补通用大模型在科学领域深度知识与严谨推理能力上的不足。
InternAgent作为首个面向科学发现的全流程通用多智能体框架,具备科研任务可扩展、人类专家可交互的特色。InternAgent包含数据层和执行层。其中数据层进行科研数据、科学知识解析;执行层通过假设生成、实验规划、工具生成等智能体,完成从科研任务规划到方案具体执行的全过程。最终形成垂直领域的专业智能体(如AI疾病学家、AI地球科学家等)。
InternAgent的关键机制首先在于多轮实验反馈迭代,能够细化分步实验方案,在实验中实时捕获异常并动态调整策略,形成“算法-实验-数据-再优化”的闭环;其次,想法自进化树与可插拔人机协同反馈:Agent能够使一个科研想法从规划、假设到方法论不断自进化,形成“进化树”,并在各阶段灵活接入人类专家的反馈,持续注入领域知识。
InterAgent在产率预测、分子动力学模拟、分子动力学模拟、电力流预测、时间序列预测、增强子活性预测、扰动预测任务等六类科研任务中,获得显著超过人类设计的基线水平。并且InternAgent具有极强的代码能力:支持复杂的repo-level代码仓进化,在Auto2DSeg等任务中实现性能提升,此项能力超越了Google发布的AlphaEvolve。并且在算法实现能力超过AI-Scientist-V2。

此外,InterAgent已经成功实现多项应用落地,加速科学发现。首先在与临港实验室的合作中,InterAgent助力研发“虚拟疾病生物学家”,两周内自主发现并经人机协同验证了肝癌新靶点GPR160和肠癌新靶点ARG2。
其次,InterAgent作为“AI气候科学家”,能够打通从实验设计到决策支持的全流程,自动生成科学报告,快速识别地球系统异常,助力精准高效的气候变化治理。

阶段五:书生科学发现系统(Intern-Discovery)
第五阶段目标是构建 Intern-Discovery:一个跨学科、全流程的科学发现系统,它整合海量科学数据、专业工具与智能模型,推动从深度调研到实验执行与结果分析的闭环科研自动化,从而促进科学发现范式的变革。
首先,Intern-Discovery通过SCP协议打破资源孤岛与流程碎片化问题,实现数据、智能体、算力与实验设备的统一调度。

此外Intern-Discovery创新支持干湿实验协同,在智能体API基础上扩展对湿实验设备的兼容性,实现实验方案优化与全链条可追溯。已经成功用在荧光蛋白功能验证干湿实验上,将传统以周为单位的实验周期大幅压缩至6小时。

在分享的最后,白磊博士强调,人工智能在科学领域的深入应用,不仅是技术发展的必然,也是实现通用人工智能(AGI) 的关键路径。从计算加速到自主发现,从单点工具到协同网络,AI正在以前所未有的方式重塑科学研究的逻辑与边界。白磊博士的报告不仅梳理了技术演进的脉络,更为我们描绘了一个“人机共融、跨界创新”的科研新图景。

