AIR学术工作坊是AIR定期举办的中大型学术交流研讨活动,旨在提供一个学术交流、思想碰撞的平台,实现信息共享。
AIR学术工作坊第二期的主题是数据安全和可信AI,本次活动由聂再清教授主持,邀请到杨强教授、宋晓冬教授、朱军教授、邰骋教授、刘洋教授带来精彩报告。
数据安全和可信AI是AIR在大数据和AI交叉研究的一个重要方向,研究团队关注大数据和人工智能的挑战性问题,聚焦于构建DAIR机器自学习大数据平台,利用AI和公开数据,安全高效地发挥私有数据价值。并将平台应用于健康医疗、生物制药、自动驾驶与智慧交通、智联网(AIoT)等对人类日常生活密切相关的领域。
主持人介绍
聂再清现任清华大学国强教授、智能产业研究院首席研究员。2004年获得美国亚利桑那州立大学博士学位,师从美国人工智能学会前主席Subbarao Kambhampati教授,本科和硕士毕业于清华大学计算机科学与技术系。2017年加入阿里巴巴,任阿里巴巴人工智能实验室北京负责人和阿里巴巴天猫精灵首席科学家。此前就职于微软亚洲研究院,任首席研究员,他是微软学术搜索,人立方,以及企业智能助理EDI的发起人和负责人,也是微软自然语言理解平台LUIS的技术负责人。
报告简介
演讲主题:用户隐私,数据孤岛和联邦学习
主讲嘉宾:杨强
时间:9:10-9:50
摘要:随着人工智能(AI)的广泛应用,AI系统所面临的大数据挑战也日益凸显。一方面,AI系统的成功离不开大数据,另一方面,社会对于用户隐私的泄露也越来越不能容忍。最近,欧洲推出了严厉的个人数据隐私法案,而部门和机构之间的隔阂也使得部门墙成为数据孤岛间难以逾越的障碍。面对这一严峻挑战,杨教授团队提出横向和纵向“联邦学习",以及联邦迁移学习,用以建立机构间的桥梁,使得不同数据控制方可以参与联合建立AI模型,并协作使用模型来进行决策。各方数据不出本地,而用户隐私得到最好保护。杨教授将举例描述联邦迁移学习这一技术的几个最新研究和应用案例,包括数据确权定价,利益合理分配,安全联合建模。
个人介绍:杨强,加拿大工程院院士,微众银行首席人工智能官,香港科技大学讲席教授,AAAI 2021大会主席,中国人工智能学会(CAAI)荣誉副理事长,香港人工智能与机器人学会(HKSAIR)理事长以及智能投研技术联盟(ITL)主席。他是 AAAI/ ACM/ CAAI/ IEEE/ IAPR/ AAAS Fellow,也是《IEEE Transactions on Big Data》和《ACM Transactions on Intelligent Systems and Technology》创始主编,以及多个国际人工智能和数据挖掘领域杂志编委。曾获2019年度“吴文俊人工智能科学技术奖”杰出贡献奖,2017年ACM SIGKDD杰出服务奖。杨强毕业于北京大学,于1989年在马里兰大学获得计算机系博士学位,之后在加拿大滑铁卢大学和Simon Fraser大学任教,他的研究领域包括人工智能、数据挖掘、机器学习等。他曾任华为诺亚方舟实验室主任,第四范式公司联合创始人,香港科技大学计算机与工程系系主任以及国际人工智能联合会(IJCAI)理事会主席。领衔全球迁移学习和联邦学习研究及应用,最近的著作有《迁移学习》、《联邦学习》和《联邦学习实战》。
演讲主题:打造负责任的数据经济(英文)
主讲嘉宾:宋晓冬
时间:9:50-10:30
摘要:数据是现代经济和人工智能/机器学习的重要发展动力。但其中有许多敏感数据,这些数据的处理对个人和企业来说都是前所未有的挑战。而且随着数字时代的到来,挑战只会与日俱增。本次讲座中,宋晓冬教授会讲到保证负责任的数据使用所需的技术,包括安全计算、差异性隐私、联邦学习、数据权利相关的区块链技术,以及如何结合隐私计算技术和区块链以打造负责任的数据经济平台,在最大化社会福利和经济效率的同时,保护用户数据权利,公平分配数据创造的价值。
个人介绍:宋晓冬,加州大学伯克利分校电气工程与计算机科学系教授,研究方向为人工智能与深入学习,安全与隐私,曾获麦克阿瑟奖、古根海姆奖、美国国家科学基金会杰出青年教授奖、斯隆研究奖、《麻省理工科技评论》“35 岁以下科技创新 35 人”奖、ACM SIGSAC 杰出创新奖、安全和深度学习领域中顶级会议的最佳论文奖。宋晓冬教授是计算机协会会员、电气电子工程师学会会员,是计算机安全领域引用最多的学者(获AMiner奖)。宋晓冬教授在加州大学伯克利分校取得博士学位,被 Inc.列入 100 位女性创始人,也被列入Wired25创新者。
演讲主题:理解与评测对抗鲁棒性
主讲嘉宾:朱军
时间:10:30-11:10
摘要:对抗鲁棒性是评估人工智能系统的新维度,对高风险应用来说至关重要。对抗性攻击和防御已经取得很大发展,但我们对其理解还不透彻。该报告中,我会分享损失函数与对抗性训练的最新发展,它们能够进一步启发鲁棒算法。我还会向大家展示一个用于全面评估鲁棒性的平台。
个人介绍:朱军,清华大学计算机系教授、北京智源人工智能研究院首席科学家,曾任卡内基梅隆大学兼职教授。主要从事机器学习研究,担任IEEE TPAMI的副主编、AI编委,担任ICML、NeurIPS等领域主席20余次。获科学探索奖、CCF自然科学一等奖等,入选万人计划领军人才、MIT TR35中国先锋者以及IEEE“AI’s 10 to Watch”,获多项国际竞赛冠军和最佳论文奖。
演讲主题:高性能、保护隐私的生物识别技术
主讲嘉宾:邰骋
时间:11:10-11:50
摘要:自动指纹识别系统(AFIS)已经在刑侦、出入境等领域广泛应用了二十多年,但现有系统仍然存在一些问题:(1)对于现场指纹需要标注特征(2)在十亿级别数据库中搜索过于缓慢。邰骋教授将展示如何通过创新的图像处理算法、多尺度的图像表示和异构的分布式系统来克服这些缺陷。运用上述技术,邰骋教授的团队建设了十亿级别的高精度图像搜索系统,可以完成高精度的图像匹配,从而改变了行业的面貌。在商用的生物识别系统中,隐私是至关重要的。保护隐私的生物识别系统应该具有如下的特征:(1)不可逆(2)可撤销(3)不可关联。现有的解决方案离实用还有很大距离。邰骋教授团队调研现有的方法并为提升安全性和性能指出一些可行的方向。
个人介绍:邰骋,北京大数据研究院研究员,墨奇科技联合创始人,普林斯顿大学博士。邰骋博士的研究方向包括构建非结构化数据的算法和系统,研发了无标注的高精度图像搜索引擎,以无监督的方式实现了十亿级别图像的秒级高精度搜索,并在生物识别领域得到成功的应用。
演讲主题:联邦学习的技术挑战和应用展望
主讲嘉宾:刘洋
时间:11:50-12:30
摘要:数据安全和数据价值是数据要素市场化进程中的两个核心问题。为了全面护航各产业场景的数据安全,充分连接和挖掘数据价值,促进数据合作和多方共赢,近年来联邦学习、隐私计算等技术的研究进展和技术平台的建设速度加快。刘洋教授将综述性介绍联邦学习技术的最新挑战和研究进展,以及展望其在智慧医疗健康、自动驾驶、智慧城市等AI智能领域的前沿应用。
个人介绍:刘洋,清华大学智能产业研究院副研究员/副教授, 普林斯顿大学博士,清华大学本科毕业。曾任深圳前海微众银行股份有限公司资深研究员、AI部门研究团队负责人。她拥有10余项国际国内授权专利,超过100件专利申请,并在《Nature》、 AAAI、 IJCAI、 USENIX、ACM TIST 等知名学术期刊发表科研成果。她是《联邦学习》和《Federated Learning》的主要作者之一。她曾担任IEEE Intelligent Systems,ACM TIST等期刊客座编辑;曾获CCF科学技术奖科技进步杰出奖,AAAI人工智能创新奖等多个奖项。
精彩视频回顾及完整版PPT下载,请点击:
【预告】AIR学术工作坊第2期|数据安全和可信AI