AIR学术｜清华教授汪玉：资源受限下智能体协同环境探索方法

来源：发布时间：2022-12-28

智能系统未来不能只靠芯片的单独能力提升，更需要依靠系统能力的共同提升。

——汪玉

12月21日下午，学术沙龙第28期如期在线上举行。本期活动我们很荣幸地邀请到清华大学电子工程系长聘教授汪玉，为我们线上做了题为《资源受限下多智能体协同环境探索方法》的报告。

12513

讲者介绍

4CDD4

汪玉，清华大学电子工程系长聘教授、系主任，清华大学信息科学技术学院副院长，清华大学天津电子信息研究院院长，IEEE Fellow。

汪玉教授长期从事智能芯片、高能效电路与系统研究，ACM SIGDA执行委员会成员。共发表论文300余篇，谷歌学术引用近15000次。他先后获得中国计算机学会青竹奖、德国洪堡奖学金、国际设计自动化会议40岁以下杰出创新奖、CCF科学技术奖技术发明一等奖等荣誉。他还曾获得4次国际会议最佳论文奖，以及12次国际会议最佳论文奖提名。汪教授同时担任IEEE TCAD, ACM TODAES等期刊的编委，ASP-DAC 2025等国际会议技术委员会主席（TPC Chair）。

报告内容

汪玉教授首先带我们回顾了人工智能算法与硬件的发展历程，并介绍了团队近几年在单体智能硬件系统设计方面的工作。随后，他详细介绍了团队在协同环境探索这一多智能体应用下，从通信受限和强化学习两个角度展开的探索与研究。最后，汪玉教授也介绍了未来关于构建涵盖任务定义、测试仿真、软硬件部署和实际环境验证等多个模块的协同智能开放平台的计划。

单体硬件系统设计

过去十年是AI领域定制加速器的黄金十年，新器件和新架构的发展为智能硬件能效带来了5~6个数量级的提升。汪玉教授团队在这一领域的发展中也做出了重要贡献，在神经网络加速器、模拟域存内计算架构等方向有诸多优秀的工作。

26707

而面向未来十年，汪玉教授认为芯片的单独能力提升将会面临瓶颈，需要聚焦“芯片-系统”计算能力的共同提升。未来AI的发展呈现出大模型、多任务、稀疏化和动态网络等趋势。

2917D

面向未来云端大规模拓展的趋势，汪玉教授团队采用时空分复用异构多核等方式将AI加速器虚拟化的资源利用率提升10倍。

1CEE2

面向非结构化特征与稀疏计算的发展，汪玉教授团队通过软硬件协同优化方法，将算法结构化映射至电路架构上，使稀疏图处理能效提升2~3个量级，稀疏计算开源项目dgSPARSE已被多个开源框架集成。

22E5D

在模型设计方面，汪玉教授团队提出以建模为核心的高效NAS框架，可以在小时量级时间内实现算法模型架构的自动化设计。

30FD1

通信受限下协同环境探索

尽管我们已经看到了单体智能的飞速发展，单体智能的能力却难以无限提高，当前的人工智能系统也正呈现出由单体向协同的发展趋势。分布式协同系统作为协同系统的一种，不依赖中心节点控制，延迟与接入代价也更低，但面临着通信、感知、计算与数据等多种资源受限的问题。

2B068

具体到定位与建图的应用中，要从单机拓展到多机，就要在多机之间共享场景描述子与定位信息等数据。而在实际场景下由于通信资源受限，就存在感知精度与通信量的权衡取舍。

27B2A

汪玉教授团队提出仅在多机之间传输子地图，并以计算换通信、利用子地图完成场景识别与配准定位，从而在保证识别和配准精度的条件下减少了30%数据传输。

而在此基础上，考虑到不同无人平台对感知精度的需求不同，通过高数据效率的环境信息表示可以进一步降低通信量。基于GMM地图的多机环境探索相对3D点云可减少98%数据传输，而基于拓扑地图的多机环境探索相比2D栅格可减少90%数据传输。

37982

除此之外，机器人自主探索测试集Explore-Bench也已开源。

22490

基于强化学习的协同环境探索

在协同探索中，传统规划方法往往存在短视与非合作的问题。强化学习因其具有建模复杂协同探索策略的能力，逐渐得到关注与发展。但目前强化学习方法在多机探索中的应用尚不成熟，面临缺少高效多机协同探索框架、可扩展性差和泛化性差等挑战。

24CC4

25831

299CA

为解决可扩展性差的问题，需要设计与智能体数量无关的策略。汪玉教授团队提出基于强化学习的可扩展多智能体协同探索框架MAANS，其基于输入维度可变的高阶特征完成动作规划，能够零样本泛化到其他智能体数量以及智能体中途上下线的情况，并能够产生比人工设计方法更优的合作策略。

1F54D

团队还提出基于拓扑图的高泛化强化学习协同探索框架MANTP。

20EF0

强化学习相关工作都基于课题组开源的高性能多智能体算法MAPPO，该工作的开源仓库是https://github.com/marlbenchmark/on-policy。

23BAD

汪玉教授表示，未来还将建设协同智能开放平台，涵盖典型基础任务定义、测试集与仿真器、实际软硬件基础平台、实际任务测试验证环境以及数字孪生等多方面研究内容，并围绕智能无人系统构建公益课程、互动社区与实践赛事体系。汪玉教授也希望能够与大家一同探索，进一步提升多智能体协同系统的能效与各方面能力，推动其在真实应用场景中的落地。

文稿撰写 / 李翔宇

排版编辑 / 王影飘

校对责编 / 黄妍

关注AIR公众号并回复“学术沙龙第28期”

即可下载完整PPT

相关新闻

AIR学术｜字节跳动李航：推进人工智能新前沿

3月5日下午，第42期AIR学术沙龙如期举行。本期活动荣幸邀请到了字节跳动李航博士，为我们作题为《推进人工智能新前沿》的报告。本次活动由中国工程院院士、清华大学智能产业研究院（AIR）院长张亚勤主持。讲者简介Hang Li is the Head of Research at ByteDance Technology. He is an ACM Fellow, ACL Fellow, and IEEE Fellow. He graduated from Kyoto University and received his Ph.D. from the University of Tokyo. Prio...

2025/03/19

AIR学术｜西湖大学于开丞：浅谈自主智能——Autolab 的视角

11月28日下午，由DISCOVER实验室主办的第三十八期AIR青年科学家论坛如期举行。本期活动荣幸第邀请到了西湖大学工学院助理教授于开丞，为AIR的老师和同学们做了题为Large Visual-Centric Models in Society Autolab Perspective的精彩报告，本次活动由清华大学智能产业研究院（AIR）助理教授龚江涛主持。讲者介绍于开丞博士，西湖大学工学院博士生导师、助理教授，人工智能企业KMina联合创始人兼首席科学家。于开丞先后于2016年...

2024/12/04

AIR学术｜南京大学姚遥：Creating a Realistic 3D World

11月28日晚，由DISCOVER实验室主办的第三十七期AIR青年科学家论坛如期举行。本次活动有幸邀请到南京大学智能科学与技术学院的姚遥副教授，为AIR的老师和同学们做了题为Creating a Realistic 3D World的精彩报告。嘉宾介绍姚遥副教授是2022年国家级人才计划青年项目（海外）入选者。曾任苹果公司高级研究员，Altizure创始团队核心成员（被苹果收购）。2015年于南京大学获学士学位，2019年于香港科技大学获博士学位。主要研究方向...

2024/12/04

主讲人		时间
地点		精彩回顾

关于AIR

新闻中心

AIR团队

科学研究

产业交流

人才招聘

院级合作单位

新闻中心

学院新闻

大师对话

学术简报

媒体报道

AIR学术｜清华教授汪玉：资源受限下智能体协同环境探索方法

相关新闻

AIR学术｜字节跳动李航：推进人工智能新前沿

AIR学术｜西湖大学于开丞：浅谈自主智能——Autolab 的视角

AIR学术｜南京大学姚遥：Creating a Realistic 3D World

最新动态

官方微信