*本文转载自智源研究院
上一条:AIR赛事|AXS挑战赛 Sim2Real阶段,启动! 下一条:ICLR 2024|AIR亮点论文解读
【关闭】
清华大学智能产业研究院(AIR)与字节跳动(ByteDance)联合实验室 SIA-Lab 开源了其最新研发的大规模 LLM 强化学习系统 —— Decoupled Clip and Dynamic sAmpling Policy Optimization(DAPO)。在纯 RL 端的比较下超越了 DeepSeed R1 模型所使用的 GRPO 算法,取得新的 SOTA 结果。 •作者:禹棋赢,张正,陈江捷,于鸿利,戴炜楠,宋宇轩,周浩,刘菁菁,马维英,张亚勤,严林,乔木,Yonghui Wu,王明轩等(...
人工智能(AI)正以前所未有的速度颠覆医疗领域,从疾病诊断到精准治疗,从药物研发到健康管理,这场技术革命将如何改写人类健康的未来?3月21日 ,清华大学智能产业研究院(AIR)院长张亚勤教授,将对话 2005年诺贝尔生理学及医学奖得主巴里·马歇尔(Barry Marshall) ,共同探讨AI与医学融合的前沿趋势与无限可能
2025年2月28日,清华大学智能产业研究院(AIR)与亚信科技联合发布《DeepSeek赋能自智网络高阶演进评测报告》中英文版。该报告为通信行业首份系统性评估DeepSeek等基础大模型对自智网络应用适配性的评测报告。报告从语义解析、意图识别、推理能力、自主规划、知识检索、文本生成等多项基模能力维度全面评估了DeepSeek及其他基模面向自智网络各应用场景的可用性与适配性。报告旨在为基础大模型赋能自智网络向高阶演进提供科学依...
业务合作:airoffice@air.tsinghua.edu.cn招生招聘:airhr@air.tsinghua.edu.cn 联系电话:(010)82151160
办公地点:北京市海淀区清华科技园启迪科技大厦C座12层
京ICP备15006448号 | 版权所有©清华大学智能产业研究院