祝贺！AIR获2022 IEEE Micro年度最佳论文（Top Picks）提名奖

来源：发布时间：2023-05-08

清华大学智能产业研究院（AIR）刘云新教授与上海交通大学、上海期智研究院、微软研究院以及美国罗彻斯特大学合作发表在第55届ACM/IEEE International Symposium on Microarchitecture (MICRO 2022)大会上的论文“ANT: 利用自适应数值类型进行低比特深度神经网络量化”（英文名称ANT: Exploiting Adaptive Numerical Data Type for Low-bit Deep Neural Network Quantization）获得了2022年体系结构领域IEEE Micro年度最佳论文（Top Picks）提名奖。该奖项每年从计算机体系结构领域四大顶会（ISCA，MICRO，HPCA，ASPLOS）几百篇文章中基于创新性和长期影响潜力选择前24篇文章，本论文是24篇文章之一，受到了国际学术界的高度认可。

论文简介

量化是一种降低日益增长的DNN模型计算和存储成本的技术，一般采用定点整数或浮点类型，但能带来的优化效果都非常有限：一方面它们都需要更多的比特来保持原始模型的精度；另一方面，可变长度的量化方法虽然能带来算法层面的好处，但因为编码和解码复杂而产生了显著的硬件开销。

论文提出了一种称为ANT的固定长度自适应数据类型，可以通过很小的硬件开销实现超低精度量化，也是首个混合多数值类型的量化方法。ANT有两项关键创新点，首先，ANT提出了一种特殊的数据类型 Flint，它结合了float和int的优点，以适应张量内部的自适应性，即不同大小值的重要性。其次，ANT提出了张量之间的自适应框架，根据每个张量的分布特征为其选择最佳类型。

undefined

ANT最大的优点是与现有AI加速器兼容，可以直接嵌入到商用GPU中，展示了其硬件友好性和兼容性。正因为这个特点，ANT受到包括包括华为昇腾在内的多个硬件厂商的关注，并获得了2022年华为火花奖。论文中为ANT设计了一个统一的处理体系结构，并展示了它与现有DNN加速器的易集成性，与最先进的量化加速器相比，ANT能实现2.8×的加速和2.5×的能效改进。Github链接：clevercool/ANT_Micro22 (github.com)

undefined

智慧物联

智慧物联是AIR的三大重点研究方向之一。利用5G、物联网、大数据、人工智能、云计算、边缘计算等前沿技术，围绕智慧城市、智慧园区、智慧楼宇、智慧交通、智能制造、工业互联网等应用场景，在智慧物联（AIoT）领域开展创新性理论探索研究和基础系统研究，攻克关键技术瓶颈，引领AIoT领域的研究工作和技术创新，开发具有自主知识产权的系统软件基础设施，打造新一代AIoT智能产业生态系统和决策大脑，赋能产业数字化转型升级，孵化新兴智能产业，利用数据驱动的智能决策赋能产业的绿色化和助力我国 “碳中和” 目标的实现，服务于国家和产业需求，推动我国在AIoT领域的战略布局和科研成果的产业落地。“利用自适应数值类型进行低比特深度神经网络量化”是该方向在提升智能计算系统能效方面的一个阶段性成果，AIR未来也将继续在智慧物联方向开展深入探索。

撰文：孙一

相关新闻

AIR 科研｜LLM RL最强算法，清华AIR-字节跳动SIA-Lab联合发布

清华大学智能产业研究院（AIR）与字节跳动（ByteDance）联合实验室 SIA-Lab 开源了其最新研发的大规模 LLM 强化学习系统 —— Decoupled Clip and Dynamic sAmpling Policy Optimization（DAPO）。在纯 RL 端的比较下超越了 DeepSeed R1 模型所使用的 GRPO 算法，取得新的 SOTA 结果。 •作者：禹棋赢，张正，陈江捷，于鸿利，戴炜楠，宋宇轩，周浩，刘菁菁，马维英，张亚勤，严林，乔木，Yonghui Wu，王明轩等（...

2025/03/19

【点击预约直播】张亚勤对话诺奖得主巴里·马歇尔

人工智能（AI）正以前所未有的速度颠覆医疗领域，从疾病诊断到精准治疗，从药物研发到健康管理，这场技术革命将如何改写人类健康的未来？3月21日，清华大学智能产业研究院（AIR）院长张亚勤教授，将对话 2005年诺贝尔生理学及医学奖得主巴里·马歇尔（Barry Marshall），共同探讨AI与医学融合的前沿趋势与无限可能

2025/03/19

重磅首发！清华AIR与亚信科技联合发布《DeepSeek赋能自智网络高阶演进评测报告》

2025年2月28日，清华大学智能产业研究院（AIR）与亚信科技联合发布《DeepSeek赋能自智网络高阶演进评测报告》中英文版。该报告为通信行业首份系统性评估DeepSeek等基础大模型对自智网络应用适配性的评测报告。报告从语义解析、意图识别、推理能力、自主规划、知识检索、文本生成等多项基模能力维度全面评估了DeepSeek及其他基模面向自智网络各应用场景的可用性与适配性。报告旨在为基础大模型赋能自智网络向高阶演进提供科学依...

2025/03/19

关于AIR

新闻中心

AIR团队

科学研究

产业交流

人才招聘

院级合作单位

新闻中心

学院新闻

大师对话

学术简报

媒体报道

祝贺！AIR获2022 IEEE Micro年度最佳论文（Top Picks）提名奖

相关新闻

AIR 科研｜LLM RL最强算法，清华AIR-字节跳动SIA-Lab联合发布

【点击预约直播】张亚勤对话诺奖得主巴里·马歇尔

重磅首发！清华AIR与亚信科技联合发布《DeepSeek赋能自智网络高阶演进评测报告》

最新动态

官方微信