刘菁菁首席研究员/国强教授

刘菁菁教授，清华大学博士生导师，美国麻省理工学院 (MIT) 计算机科学博士，英国剑桥大学MBA。刘教授目前研究方向包括多模态大模型 (Multimodal LLM)、AI for Science、强化学习等，已在国际顶级学术会议及期刊 (CVPR, NeurIPS, ICML, ACL, etc.) 发表论文100多篇，引用量超过17000次，曾获 CVPR 和 WACV 国际学术会议 Best Student Paper Honorable Mention Awards。2021年加入清华大学之前，刘教授曾任美国微软公司资深首席研究部门主管，带领科研团队在视觉加语言多模态人工智能 (Multimodal AI)、自然语言处理等科研领域开展大模型预训练的前沿研究。2014年加入美国微软研究院 (Microsoft Research) 之前，刘教授曾任美国麻省理工学院计算机科学与人工智能实验室 (MIT CSAIL) 研究科学家，专注语音对话系统研究。

个人主页：

Google Scholar

研究领域：

多模态大模型，AI for Science，强化学习

近期论文著作摘选：

[1]Tianyuan Zou, Yang Liu, Peng Li, Yufei Xiong, Jianqing Zhang, Jingjing Liu, Xiaozhou Ye, Ye Ouyang, Ya-Qin Zhang, Contrastive Private Data Synthesis via Weighted Multi-PLM Fusion, ICML 2025. (arxiv/2502.00245)

[2]Jinliang Zheng, Jianxiong Li, Dongxiu Liu, Yinan Zheng, Zhihao Wang, Zhonghong Ou, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan, Universal Actions for Enhanced Embodied Foundation Models, CVPR 2025. (arxiv/2501.10105)

[3]Hanlin Wu, Yuxuan Song, Jingjing Gong, Ziyao Cao, Yawen Ouyang, Jianbing Zhang, Hao Zhou, Wei-Ying Ma, and Jingjing Liu, A Periodic Bayesian Flow for Material Generation, ICLR 2025 (Spotlight). (arxiv/2502.02016)

[4]Yinan Zheng, Ruiming Liang, Kexin Zheng, Jinliang Zheng, Liyuan Mao, Jianxiong Li, Weihao Gu, Rui Ai, Shengbo Eben Li, Xianyuan Zhan, and Jingjing Liu, Diffusion-Based Planning for Autonomous Driving with Flexible Guidance, Rethinking Diffusion Posterior Sampling: From Conditional Score Estimator to Maximizing a Posterior, ICLR 2025 (Oral).(arxiv/2501.15564)

[5]Tongda Xu, Jian Li, Xinjie Zhang, Xingtong Ge, Dailan He, Xiyan Cai, Ming Sun, Yan Wang, Jingjing Liu, Ya-Qin Zhang, Rethinking Diffusion Posterior Sampling: From Conditional Score Estimator to Maximizing a Posterior, ICLR 2025.(arxiv/2501.18913)

[6]Zhe Wang, Xiaoliang Huo, Siqi Fan, Jingjing Liu, Ya-Qin Zhang, Yan Wang, IROAM: Improving Roadside Monocular 3D Object Detection Learning from Autonomous Vehicle Data Domain, ICRA 2025. (arxiv/2501.1816)

[7]Zhe Wang, Shaocong Xu, Zhuang Xucai, Tongda Xu, Yan Wang, Jingjing Liu, Yilun Chen, and Ya-Qin Zhang, CoopDETR: A Unified Cooperative Perception Framework for 3D Detection via Object Query, ICRA 2025.(arxiv/2502.19313)

[8]Jianxiong Li, Zhihao Wang, Jinliang Zheng, Xiaoai Zhou, Guanming Wang, Guanglu Song, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Junzhi Yu, Xianyuan Zhan, Robo-MUTUAL: Robotic Multimodal Task Specification via Unimodal Learning, ICRA 2025. (arxiv/2410.01529)

[9]Jinliang Zheng, Jianxiong Li, Sijie Cheng, Yinan Zheng, Jiaming Li, Jihao Liu, Yu Liu, Jingjing Liu, and Xianyuan Zhan, Instruction-Guided Visual Masking, NeurIPS 2024. (arxiv/2405.19783)

[10]Xin Ma, Yang Liu, Jingjing Liu, and Xiaoxu Ma, Mesa-Extrapolation: A Weave Position Encoding Method for Enhanced Extrapolation in LLMs, NeurIPS 2024.

[11]Tianyuan Zou, Yang Liu, Peng Li, Jianqing Zhang, Jingjing Liu, and Ya-Qin Zhang, FuseGen: PLM Fusion for Data-generation based Zero-shot Learning, EMNLP 2024. (arxiv/2406.12527)

[12]Jianxiong Li, Jinliang Zheng, Yinan Zheng, Liyuan Mao, Xiao Hu, Sijie Cheng, Haoyi Niu, Jihao Liu, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan, DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning, ICML 2024. (arxiv/2402.18137)

[13]Qiying Yu, Quan Sun, Xiaosong Zhang, Yufeng Cui, Fan Zhang, Yue Cao, Xinlong Wang, Jingjing Liu, CapsFusion: Rethinking Image-Text Data at Scale, CVPR 2024. (arxiv/2310.20550)

[14]Quan Sun, Yufeng Cui, Xiaosong Zhang, Fan Zhang, Qiying Yu, Yueze Wang, Yongming Rao, Jingjing Liu, Tiejun Huang, Xinlong Wang, Generative Multimodal Models are In-Context Learners, CVPR 2024. (arxiv/2312.13286)

[15]Qiying Yu, Yudi Zhang, Yuyan Ni, Shikun Feng, Yanyan Lan, Hao Zhou, and Jingjing Liu, Multimodal Molecular Modeling via Modality Blending, ICLR 2024. (arxiv/2307.06235)

[16]Yinan Zheng, Jianxiong Li, Dongjie Yu, Yujie Yang, Shengbo Eben Li, Xianyuan Zhan, and Jingjing Liu, Safe Offline Reinforcement Learning with Feasibility-guided Diffusion Model, ICLR 2024. (arxiv/2401.10700)

[17]Yuxuan Song, Jingjing Gong, Hao Zhou, Mingyue Zheng, Jingjing Liu, and Wei-Ying Ma, Unified Generative Modeling of 3D Molecules with Bayesian Flow Networks, ICLR 2024.(arxiv/2403.15441)

[18]Quan Sun, Qiying Yu, Yufeng Cui, Fan Zhang, Xiaosong Zhang, Yueze Wang, Hongcheng Gao, Jingjing Liu, Tiejun Huang, Xinlong Wang, Emu: Generative Pretraining in Multimodality, ICLR 2024. (arxiv/2307.05222)

[19]Tongda Xu, Dailan He, Ziran Zhu, Yanghao Li, Lina Guo, Yuanyuan Wang, Zhe Wang, Hongwei Qin, Yan Wang, Jingjing Liu, Ya-Qin Zhang, Idempotence and Perceptual Image Compression, ICLR 2024. (arxiv/2401.08920)

[20]Shanzhi Yin, Tongda Xu, Yongsheng Liang, Yuanyuan Wang, Yanghao Li, Yan Wang, and Jingjing Liu, Bandwidth-efficient Inference for Neural Image Compression, ICASSP 2024. (arxiv/2309.02855)

[21]Yanghao Li, Tongda Xu, Yan Wang, Jingjing Liu, and Ya-Qin Zhang, Idempotent Learned Image Compression with Right-Inverse, NeurIPS 2023.(proceedings.neurips)

[22]Bowen Gao, Bo Qiang, Haichuan Tan, Yinjun Jia, Minsi Ren, Minsi Lu, Jingjing Liu, Wei-Ying Ma, and Yanyan Lan, DrugCLIP: Contrasive Protein-Molecule Representation Learning for Virtual Screening, NeurIPS 2023.(arxiv/2310.06367)

[23] Hideaki Takahashi, Jingjing Liu, Yang Liu, Breaching FedMD: Image Recovery via Paired-Logits Inversion Attack, CVPR 2023. (arxiv/2304.11436)

[24] Tongda Xu, Han Gao, Yuanyuan Wang, Hongwei Qin, Yan Wang, Jingjing Liu, Ya-Qin Zhang, Correcting the Sub-optimal Bit Allocation, ICML 2023. (arxiv/2209.14575)

[25] Qiying Yu, Yang Liu, Yimu Wang, Ke Xu, and Jingjing Liu, Multimodal Federated Learning via Contrastive Representation Ensemble, ICLR 2023. (arxiv/2302.08888)

[26] Jianxiong Li, Xianyuan Zhan, Haoran Xu, Xiangyu Zhu, Jingjing Liu, and Ya-Qin Zhang, When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement Learning, ICLR 2023. (arxiv/2205.11027)

[27] Jianxiong Li, Xiao Hu, Haoran Xu, Jingjing Liu, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang, Mind the Gap: Offline Policy Optimization for Imperfect Rewards, ICLR 2023. (arxiv/2302.01667)

[28] Bu Jin, Xinyu Liu, Yupeng Zheng, Pengfei Li, Hao Zhao, Tong Zhang, Yuhang Zheng, Guyue Zhou, and Jingjing Liu, ADAPT: Action-aware Driving Caption Transformer, ICRA 2023. (arxiv:2302.00673)

[29] Qiying Yu, Jieming Lou, Xianyuan Zhan, Qizhang Li, Wangmeng Zuo, Yang Liu, and Jingjing Liu, Adversarial Contrastive Learning via Asymmetric InfoNCE, ECCV 2022. (arxiv:2207.08374)

[30] Tianlong Chen, Yu Cheng, Zhe Gan, Jianfeng Wang, Lijuan Wang, Jingjing Liu, and Zhangyang Wang, Adversarial Feature Augmentation and Normalization for Visual Recognition, Transactions on Machine Learning Research (TMLR), 2022. (arxiv:21Z03.12171)

[31] Zhe Gan, Yen-Chun Chen, Linjie Li, Tianlong Chen, Yu Cheng, Shuohang Wang, Jingjing Liu, Lijuan Wang and Zicheng Liu, Playing Lottery Tickets with Vision and Language, AAAI 2022.(arxiv:2104.11832)

[32] Jinghui Chen, Yu Cheng, Zhe Gan, Quanquan Gu, and Jingjing Liu, Efficient Robust Training via Backward Smoothing, AAAI 2022.(arxiv:2010.01278)

[33] Linjie Li, Jie Lei, Zhe Gan, and Jingjing Liu, Adversarial VQA: A New Benchmark for Evaluating the Robustness of VQA Models, ICCV 2021.(arxiv:2106.00245)

[34] Xiaohan Chen, Yu Cheng, Shuohang Wang, Zhe Gan, Jingjing Liu, Zhangyang Wang, The Elastic Lottery Ticket Hypothesis, NeurIPS 2021. (arxiv:2103.16547)

[35] Tianlong Chen, Yu Cheng, Zhe Gan, Jingjing Liu, Zhangyang Wang, Data-Efficient GAN Training Beyond (Just) Augmentations: A Lottery Ticket Perspective, NeurIPS 2021. (arxiv:2103.00397)

[36] Linjie Li, Jie Lei, Zhe Gan, Licheng Yu, Yen-Chun Chen, Rohit Pillai, Yu Cheng, Luowei Zhou, Xin Eric Wang, William Yang Wang, Tamara L. Berg, Mohit Bansal, Jingjing Liu, Lijuan Wang, Zicheng Liu, VALUE: A Multi-Task Benchmark for Video-and-Language Understanding Evaluation, NeurIPS 2021. (arxiv:2106.04632)

[37] Xiaohan Chen, Yu Cheng, Shuohang Wang, Zhe Gan, Zhangyang Wang, Jingjing Liu, EarlyBERT: Efficient BERT Training via Early-bird Lottery Tickets, ACL 2021 (Oral). (arXiv:2101.00063)

[38] Shuohang Wang, Luowei Zhou, Zhe Gan, Yen-Chun Chen, Yuwei Fang, Siqi Sun, Yu Cheng, Jingjing Liu, Cluster-Former: Clustering-based Sparse Transformer for Question Answering, Findings of ACL 2021. (arxiv/2009.06097)

[39] Chen Zhu, Yu Cheng, Zhe Gan, Furong Huang, Jingjing Liu, and Tom Goldstein, Adaptive Learning Rates with Maximum Variation Averaging, ECML 2021. (arXiv:2006.11918v1)

[40] Jie Lei*, Linjie Li*, Luowei Zhou, Zhe Gan, Tamara L. Berg, Mohit Bansal, and Jingjing Liu, Less is More: ClipBERT for Video-and-Language Learning via Sparse Sampling, CVPR 2021 (Oral). (arXiv:2102.06183)

[41] Mingyang Zhou, Luowei Zhou, Shuohang Wang, Yu Cheng, Linjie Li, Zhou Yu, and Jingjing Liu, UC2: Universal Cross-lingual Cross-modal Vision-and-Language Pre-training, CVPR 2021. (arXiv:2104.00332)

[42] Liqun Chen*, Dong Wang*, Zhe Gan, Jingjing Liu, Ricardo Henao, and Lawrence Carin, Wasserstein Contrastive Representation Distillation, CVPR 2021. (arXiv:2012.08674).

[43] Shuyang Dai, Zhe Gan, Yu Cheng, Chenyang Tao, Lawrence Carin, and Jingjing Liu, APo-VAE: Text Generation in Hyperbolic Space, NAACL 2021. (arXiv:2005.00054)

[44] Siqi Sun, Yen-Chun Chen, Linjie Li, Shuohang Wang, Yuwei Fang, and Jingjing Liu, LightningDOT: Pre-training Visual-Semantic Embeddings for Real-Time Image-Text Retrieval, NAACL 2021. (arXiv:2103.08784)

[45] Boxin Wang, Shuohang Wang, Yu Cheng, Zhe Gan, Ruoxi Jia, Bo Li, and Jingjing Liu, InfoBERT: Improving Robustness of Language Models from an Information Theoretic Perspective, ICLR 2021. (arXiv:2010.02329)

[46] Yuwei Fang*, Shuohang Wang*, Zhe Gan, Siqi Sun, and Jingjing Liu, FILTER: An Enhanced Fusion Method for Cross-lingual Language Understanding, AAAI 2021. (arXiv:2009.05166)

[47] Zhe Gan, Yen-Chun Chen, Linjie Li, Chen Zhu, Yu Cheng, and Jingjing Liu, Large-Scale Adversarial Training for Vision-and-Language Representation Learning, NeurIPS 2020 (Spotlight) (arXiv:2006.06195)

[48] Linjie Li, Yen-Chun Chen, Yu Cheng, Zhe Gan, Licheng Yu, and Jingjing Liu, HERO: Hierarchical Encoder for Video Language Omni-representation Pre-training, EMNLP 2020. (arXiv:2005.00200)

[49] Siqi Sun, Zhe Gan, Yuwei Fang, Yu Cheng, Shuohang Wang, and Jingjing Liu, Contrastive Distillation on Intermediate Representations for Language Model Compression, EMNLP 2020. (arXiv:2009.14167)

[50] Shuohang Wang, Yuwei Fang, Siqi Sun, Zhe Gan, Yu Cheng, Jiang Jing, and Jingjing Liu, Cross-Thought for Sentence Encoder Pre-training, EMNLP 2020. (arXiv:2010.03652)

[51] Yuwei Fang, Siqi Sun, Zhe Gan, Rohit Pillai, Shuohang Wang, and Jingjing Liu, Hierarchical Graph Network for Multi-hop Question Answering, EMNLP 2020. (arXiv:1911.03631)

[52] Yue Dong, Shuohang Wang, Zhe Gan, Yu Cheng, Jackie Chi Kit Cheung, and Jingjing Liu, Multi-Fact Correction in Abstractive Text Summarization, EMNLP 2020. (arXiv:2010.02443)

[53] Yu Cheng, Yizhe Zhang, Oussama Elachqar, Zhe Gan, and Jingjing Liu, Contextual Text Style Transfer, EMNLP 2020 (Findings of EMNLP). (arXiv:2005.00136)

[54] Yen-Chun Chen, Linjie Li, Licheng Yu, Ahmed El Kholy, Faisal Ahmed, Zhe Gan, Yu Cheng, and Jingjing Liu, UNITER: Learning UNiversal Image-TExt Representations, ECCV 2020. (arXiv:1909.11740)

[55] Jize Cao, Zhe Gan, Yu Cheng, Licheng Yu, Yen-Chun Chen, and Jingjing Liu, Behind the Scene: Revealing the Secrets of Pre-trained Vision-and-Language Models, ECCV 2020 (Spotlight). (arXiv:2005.07310)

[56] Liqun Chen, Zhe Gan, Yu Cheng, Linjie Li, Lawrence Carin, and Jingjing Liu, Graph Optimal Transport for Cross-Domain Alignment, ICML 2020. (arXiv:2006.14744)

[57] Yen-Chun Chen, Zhe Gan, Yu Cheng, Jingzhou Liu, and Jingjing Liu, Distilling Knowledge Learned in BERT for Text Generation, ACL 2020. (arXiv:1911.03829)

[58] Jiacheng Xu, Zhe Gan, Yu Cheng, and Jingjing Liu, Discourse-Aware Neural Extractive Model for Text Summarization, ACL 2020. (arXiv:1910.14142)

[59] Yizhe Zhang Siqi Sun, Michel Galley, Yen-Chun Chen, Chris Brockett, Xiang Gao, Jianfeng Gao, Jingjing Liu, and Bill Dolan, DialoGPT: Large-Scale Generative Pre-training for Conversational Response Generation, ACL 2020. (arXiv:1911.00536)

[60] Jingzhou Liu, Wenhu Chen, Yu Cheng, Zhe Gan, Licheng Yu, Yiming Yang, and Jingjing Liu, VIOLIN: A Large-Scale Dataset for Video-and-Language Inference, CVPR 2020. (arXiv:2003.11618)

[61] Yandong Li, Yu Cheng, Zhe Gan, Licheng Yu, Liqiang Wang, and Jingjing Liu, BachGAN: High-Resolution Image Synthesis from Salient Object Layout, CVPR 2020. (arXiv:2003.11690)

[62] Chen Zhu, Yu Cheng, Zhe Gan, Siqi Sun, Tom Goldstein, and Jingjing Liu, FreeLB: Enhanced Adversarial Training for Language Understanding, ICLR 2020. (arXiv: 1909.11764)

[63] Shuohang Wang, Yunshi Lan, Yi Tay, Jing Jiang, and Jingjing Liu, Multi-level Head-wise Match and Aggregation in Transformer for Textual Sequence Matching, AAAI 2020. (arXiv:2001.07234)

[64] Junjie Hu, Yu Cheng, Zhe Gan, Jingjing Liu, Jianfeng Gao, and Graham Neubig, What Makes A Good Story? Designing Composite Rewards for Visual Storytelling, AAAI 2020. (arXiv: 1909.05316)

[65] Zhe Gan, Yu Cheng, Ahmed EI Kholy, Linjie Li, Jingjing Liu, and Jianfeng Gao, Multi-step Reasoning via Recurrent Dual Attention for Visual Dialog, ACL 2019. (arXiv: 1902.00579)

[66] Linjie Li, Zhe Gan, Yu Cheng, and Jingjing Liu, Relation-aware Graph Attention Network for Visual Question Answering, ICCV 2019. (arXiv: 1903.12314)

[67] Yitong Li, Zhe Gan, Yelong Shen, Jingjing Liu, Yu Cheng, Yuexin Wu, Lawrence Carin, David Carlson, and Jianfeng Gao, StoryGAN: A Sequential Conditional GAN for Story Visualization, CVPR 2019. (arXiv: 1812.02784)

[68] Liyiming Ke, Xiujun Li, Yonatan Bisk, Ari Holtzman, Zhe Gan, Jingjing Liu, Jianfeng Gao, Yejin Choi, and Siddhartha Srinivasa. Tactical Rewind: Self-Correction via Backtracking in Vision-and-Language Navigation, CVPR 2019 (Oral). (arXiv: 1903.02547)

[69] Siqi Sun, Yu Cheng, Zhe Gan, and Jingjing Liu. Patient Knowledge Distillation for BERT Model Compression, EMNLP 2019. (arXiv: 1908.09355)

关于AIR

新闻中心

AIR团队

科学研究

产业交流

人才招聘

院级合作单位

AIR团队

研究团队

产业合作团队

行政团队

博士后

工程博士

研究生

刘菁菁首席研究员/国强教授

官方微信