AIR学术｜西湖大学修宇亮：利用个人相册进行低成本数字人重建

来源：发布时间：2024-09-18

9月12日早，由DISCOVER实验室主办的第三十五期AIR DISCOVER青年科学家论坛如期举行。本活动有幸邀请到西湖大学工学院助理教授修宇亮，为AIR的老师和同学们做了题为 《Democratizing Human Digitization From Causal Photos》的精彩报告。

undefined

讲者介绍

修宇亮，将于2025年春季入职西湖大学工学院，担任助理教授、博士生导师，以及远兮实验室（Endless AI Lab, http://endless.do）负责人。个人主页链接：xiuyuliang.cn。拟于2024年底于马克斯·普朗克智能系统研究所获得博士学位。他主要的研究方向为基于人的数字化。共发表相关领域国际知名会议及期刊论文多篇，包括CVPR、ICCV、ICLR、ECCV、TPAMI等。

报告内容

在本次报告中，修宇亮博士首先介绍了自己的研究方向为数字人的重建和数字人的生成。接下来介绍了两种3D表达。分别为显式表达和隐式表达。如下图所示。并且讨论了两种3D表达在人体重建中的优缺点。在本次讲座中，修宇亮博士介绍了他博士期间的研究成果。

修宇亮博士认为目前的单目人体重建中主要存在四个问题，如下图所示。针对重建速度慢的这个问题。修宇亮博士及其团队提出了第一种从单目视频以实时速度对人体进行渲染重建的方法MonoPort，消除了需要输入多视角图片的需求，也消除了对人体数据进行预采集的需求。大大减少了重建的时间。

针对当时主流的单目人体重建方法在复杂以及挑战的姿势重建效果差这一问题，修宇亮博士及其团队提出了方法ICON。该方法对于复杂和挑战性姿势有着更好的泛化性。同时，与主流方法相比，其需要的训练数据也更加的少。仅需要八分之一的训练数据即可达到SOTA性能。由于该方法对复杂姿势出色的泛化性。ICON也被用来制作2022世界杯期间的精彩进球。

虽然ICON在复杂姿势以及挑战性姿势上具有很好的表现。但是其在宽松衣物上的表现并不好。针对人体宽松衣物的问题。修宇亮博士及其团队提出了方法ECON。方法框架如下图所示。该方法首先从单张图片中获得人物正面以及方面的法线贴图。并通过这两张法线贴图获得2.5D的正面的表面和反面的表面。最终将两个表面间的缝隙进行填充获得完成的穿着衣物的人体模型。

在生成带有完整纹理的数字人中，现有的方法都存在两个问题，那就是人物背部的几何纹理十分的平滑以及背后的纹理十分的模糊。为了能够解决该问题，修宇亮博士及其团队提出了方法TeCH。该方法将基于图像的重建视为条件生成任务，从输入图像和根据图像生成的描述性文本中中获取条件，并根据该条件生成3D人体模型。

在报告的最后，修宇亮博士着重介绍了自己博士生涯中的封箱之作PuzzleAvatar。该工作提出了一个新任务Album2Human（通过个人相册中的多张图片进行人体重建）。在PuzzleAvatar中，不需要使用任何的估计器，仅需要输入一组“OOTD”（每日服装）作为输入重建出个性化并且带有纹理的3D人体模型，这组照片中的人物可以是任何的身体姿势、相机姿势、取景、光照条件和背景。同时PuzzleAvatar可以应用在非常多的场景，比如像虚拟试衣以及文本编辑人物等场景。

undefined

相关新闻

AIR学术｜字节跳动李航：推进人工智能新前沿

3月5日下午，第42期AIR学术沙龙如期举行。本期活动荣幸邀请到了字节跳动李航博士，为我们作题为《推进人工智能新前沿》的报告。本次活动由中国工程院院士、清华大学智能产业研究院（AIR）院长张亚勤主持。讲者简介Hang Li is the Head of Research at ByteDance Technology. He is an ACM Fellow, ACL Fellow, and IEEE Fellow. He graduated from Kyoto University and received his Ph.D. from the University of Tokyo. Prio...

2025/03/19

AIR学术｜西湖大学于开丞：浅谈自主智能——Autolab 的视角

11月28日下午，由DISCOVER实验室主办的第三十八期AIR青年科学家论坛如期举行。本期活动荣幸第邀请到了西湖大学工学院助理教授于开丞，为AIR的老师和同学们做了题为Large Visual-Centric Models in Society Autolab Perspective的精彩报告，本次活动由清华大学智能产业研究院（AIR）助理教授龚江涛主持。讲者介绍于开丞博士，西湖大学工学院博士生导师、助理教授，人工智能企业KMina联合创始人兼首席科学家。于开丞先后于2016年...

2024/12/04

AIR学术｜南京大学姚遥：Creating a Realistic 3D World

11月28日晚，由DISCOVER实验室主办的第三十七期AIR青年科学家论坛如期举行。本次活动有幸邀请到南京大学智能科学与技术学院的姚遥副教授，为AIR的老师和同学们做了题为Creating a Realistic 3D World的精彩报告。嘉宾介绍姚遥副教授是2022年国家级人才计划青年项目（海外）入选者。曾任苹果公司高级研究员，Altizure创始团队核心成员（被苹果收购）。2015年于南京大学获学士学位，2019年于香港科技大学获博士学位。主要研究方向...

2024/12/04

主讲人		时间
地点		精彩回顾

关于AIR

新闻中心

AIR团队

科学研究

产业交流

人才招聘

院级合作单位

新闻中心

学院新闻

大师对话

学术简报

媒体报道

AIR学术｜西湖大学修宇亮：利用个人相册进行低成本数字人重建

相关新闻

AIR学术｜字节跳动李航：推进人工智能新前沿

AIR学术｜西湖大学于开丞：浅谈自主智能——Autolab 的视角

AIR学术｜南京大学姚遥：Creating a Realistic 3D World

最新动态

官方微信