新闻中心

当前位置: 首页 > 新闻中心 > 学院新闻 > 正文

水木分子发布ChatDD 新一代对话式药物研发助手,引领药物研发第四范式

来源:       发布时间:2023-09-25
9月21日,水木分子发布新一代对话式药物研发助手ChatDD (Drug Design) 和全球首个千亿参数多模态生物医药对话大模型ChatDD-FM 100B,其在C-Eval评测中达到全部医学4项专业第一,是唯一在该4项评测中平均分超过90分的模型。

undefined

清华大学智能产业研究院院长张亚勤院士在致辞中指出:“ChatDD 通过人机协作对话方式有效地将专家知识与大模型知识相联结,开拓了继传统药物研发TMDD、CADD、AIDD之后的第四代药物研发新模式。”

18FAA

张亚勤院士


ChatDD 新一代对话式药物研发助手,引领药物研发第四范式

药物研发经历了从手工制药 TMDD到计算机辅助设计CADD再到人工智能辅助设计AIDD的演进,每个阶段都带来了不同程度的效率提升和科学发展,为药物研发带来了新的机遇和挑战。 第一代手工炼药,基于经验主义,通过大量实验试错来实现。第二代CADD,通过计算机模拟建模,减少对湿实验的依赖。第三代AIDD应用人工智能技术从训练数据中挖掘药物发现和设计规律。但其面临训练数据不足,信息与知识分离,工具服务分散,处理模态单一等挑战。 水木分子提出的ChatDD,基于 大模型 能力,能够对多模态数据 进行 融合理解,与专家自然交互人机协作,将人类专家知识与大模型知识联结,重新定义药物研发模式。

16E12

AIR首席研究员、水木分子首席科学家 聂再清教授

ChatDD 基于水木分子千亿参数多模态生物医药对话大模型底座 ChatDD-FM,具备 专业知识力、认知探索力和工具调用能力。 作为生物医药研发助手Copilot 可以服务医药研发全流程场景,从立项调研,早期药物发现,临床前研究到临床试验、药物重定位等各环节。

12990

在具体应用场景方面,本次发布会展示了 ChatDD-BI 立项 场景、ChatDD-Discovery研发探索场景和ChatDD-Trail 临床试验场景应用。  

  • ChatDD-BI 数轮对话辅助立项调研

立项报告是药物研发和BD的重要决策依据。一份高质量的立项报告需要繁琐的信息收集和整理工作,涉及到大量数据的搜集、整理和分析,比如专利和文献检索,市场信息的获取,以及管线与公开信息的对比等等。对专家的依赖极高,还存在信息不全面的问题,这可能对项目的决策和发展产生负面影响。同时立项涉及企业商业秘密难以外包,这也增加了信息搜集的难度。 ChatDD-BI作为立项助手,通过与专家的数轮对话辅助立项调研,可以提升立项的效率和质量。

  • ChatDD-Discovery  启发探索灵感 对话获取识、调用工具

随着时间的推移,针对已知靶点的药物开发变的越来越挑战。药物研发的复杂性不断增加,需要更大的探索空间来发掘新的靶点、找到新的治疗方案。 大模型 的幻觉在科学研究探索性中则可能会带来“意外之喜”的灵感。 发布会现场展示了ChatDD针对渐冻症治疗方案的探索场景。
研发人员通过对话可以获得“渐冻症”疾病画像,包含疾病的描述,已有治疗方案等,帮助研究人员快速建立对渐冻症的整体认知。ChatDD通过查询外部数据库,如ClinicalTrails,给出渐冻症在研药物进展。 以“利司扑兰”为例,研发人员可通过ChatDD进一步探究其作用靶点,ChatDD找到利司扑兰的作用靶点“SMN2”,通过建立疾病、靶点、药物之间的潜在链条关系,发现并建议“SMN2是渐冻症的潜在靶点,可进行下一步探究探索”,已发表的多项研究成果均证明了ChatDD推断的合理性。 与ChatGPT在相同问题下的答案进行比较,ChatGPT未能提供准确、信息量充足且一致的答案。

18B83

ChatDD除了能够帮助研究人员扩展探索空间,还可以通过工具调用、数据查询来提升研发效率。作为生物医药研发人员,工作中涉及到大规模的文献查询和专利检索,需要在各类不同源的数据库中查询、对比和分析,还需要高频使用生信、AIDD、CADD等各种工具,使用这些工具都需要较高的学习成本,而且难以与专家知识进行有效的互动融合。 ChatDD-Discovery 通过自然语言交互的方式,将专家知识模型参数化,更好的辅助专家获取知识、查询数据库和使用工具。研究人员可以通过简单自然语言提示词 ,比如: “针对该给定 靶点 ,为我筛选与亲和力较高的小分子。” 来调用虚拟筛选功能。

109FC

ChatDD-Disc o very 研发助手可以处理生物医药多模态数据,如分子、蛋白质、基因序列以及多样的生物医药下游任务,如DDI(药物-药物相互作用计算)、亲和力计算、药物敏感性预测、单细胞类型注释等。 例如,输入分子式ChatDD-Discovery可生成该分子的完整描述信息,并支持用户针对该分子进行进一步提问。

2B63

  • ChatDD-Trial 临床试验助手

临床试验是药物研发中耗资最多、风险最大的关键阶段,如何提高临床试验的成功率一直是制药企业关注的核心问题。ChatDD-Trial凭借其知识能力和数据分析能力,可为提高临床试验的成功概率提供多重助力。
例如, ChatDD-Trial可辅助临床试验研究人员找到最适合入组的患者人群。通过发现药物敏感的生物标志物,更好地理解疾病亚型,实现精准的患者分类,确保患者与试验药物更匹配,减少不必要的变量干扰,提高临床试验成功率。

13FCB

ChatDD-Trial还可作为临床试验设计助手,帮助研究团队优化试验设计,通过分析大量的相关数据,提供有关患者选择、临床试验阶段和标准化流程的建议,确保试验的科学性和可行性,减少了不必要的误差和风险。同时,基于大模型的生成能力,ChatDD-Trial还可以用于辅助临床试验报告的撰写,以及合规检查等。

ChatDD-FM 三级淬炼,更懂生物医药的大模型

ChatDD的底座为千亿参数多模态生物医药对话 大模型 ChatDD-FM 100B,在通用语言模型基础上经过: 生物医药专业知识增强、生物医药多模态对齐、专业 领域 指令 微调和 RLHF三层淬炼,成为更懂行业的大模型底座。

10809

ChatDD-FM 100B在C-Eval 评测榜单中达到综合成绩Top10,全部医学专项4项评测排名第一,是唯一在该4项评测中平均分超过90分(93.1分)的模型。

1096D

行业专家论道生物医药大模型应用前景  

本次活动邀请到行业专家围绕“生物医药行业大模型的机遇与挑战”展开讨论。

2E99F

  • 复星医药首席数据官林锦斌表示:生物医药大模型应用需要适应药物研发项目特点,通过与清华AIR、水木分子开展生物医药基础大模型合作,依据我们应用场景进行ChatDD 模型私有化部署和应用开发,能够很好的帮助我们提升数据和知识的利用效率与价值,提升研发效能。”


  • 阿里云行业大模型首席科学家王浩表示:“ChatDD作为生物医药行业大模型在切入场景、深入了解用户需求痛点方面做的很好,行业大模型需要建立用户信任,共同迭代,才能产生真正价值,解决用户需求。”

  • 医药魔方创始人董事长周立运表示“ChatDD 能够更高效的利用海量知识与信息。医药魔方致力于高质量数据构建,结合ChatDD 大模型能力可以发挥海量非结构化数据的潜力,迅速把我们的知识拉到一个专家水平,这是令我们非常兴奋的点,很期待与水木分子的合作。

  • 华润双鹤首席科学家周宜遂表示:“公司一直在进行效率、成本、风险的平衡,我认为ChatDD有望在这三方面产生价值,提升研发效率,降低研发风险,优化研发成本。


上一条:【内附完整论文】AIR近期亮点论文解读 下一条:AIR课程|「数字经济人才培养项目」首期班开课,清华园破冰开启未来之旅

关闭

相关新闻

最新动态

业务合作:airoffice@air.tsinghua.edu.cn
招生招聘:airhr@air.tsinghua.edu.cn
联系电话:(010)82151160  

办公地点:北京市海淀区清华科技园启迪科技大厦C座12层

官方微信

京ICP备15006448号  |   版权所有©清华大学智能产业研究院