7月7日上午,中国工程院院士、清华大学讲席教授、智能产业研究院(AIR)院长张亚勤出席2023世界人工智能大会投融资主题论坛高端对话环节,与原中金公司总裁朱云来先生就大模型的发展与挑战进行了深入交流,同时展望了未来的创新方向和机会。
张亚勤院士首先阐述了目前大模型所面临的局限性和主要问题,其中包括时效性、准确性、低效率以及隐私保护等方面的挑战。特别是大模型的计算效率低下问题,与人类大脑的高效性形成了鲜明的对比。人类大脑拥有860亿个神经元和近1万个突触,却只需要20瓦的能量,重量还不到三斤;而GPT4这个万亿参数模型则需要巨大的算力和能源,与人脑相比相差1,000倍之多。此外,人脑能够根据不同的情境灵活调用不同区域的神经元,而大模型却每次输入一个问题都要激活几乎所有的参数。正是由于大模型规模庞大且计算效率低下,目前很难实现大规模商业应用。因此,如何借鉴人类大脑的计算方法,在降低计算耗能、提高效率方面进行探索和创新,是一个值得关注的方向。
此外,他还强调了行业垂直模型的重要性,并表示在实际应用中,虽然大模型很重要,但需要根据不同的行业和场景,开发相应的垂直精准模型。例如在无人驾驶领域,需要低延时、高安全性的精准模型,并不需要擅长作诗作画的模型。在生物领域,需要专注于研发能够处理蛋白质结构等生物语言的模型,而不是包含互联网上其他冗余信息的模型。只有这样才能提高模型的效率和准确性,满足用户的需求和期望。
谈到算力的挑战,张院士说:“AI发展需要人才、数据、算法、算力四个方面的支撑,其中算力会是最大的挑战。”他表示,中国在人才和数据方面有优势,近十年来很多开创性的算法都是由中国科学家提出的,但与之相比,算力挑战更加突出。目前GPU市场由英伟达主导,很多其他公司虽然也在做,但仍然不能满足大模型发展的需求。在这一点上他认为,需求是创新的源泉,如果未来算力成为了关键“卡脖子”因素,那我们就需要寻找新的模型和算法,或者新的计算平台,以降低计算成本并提高效率。
展望人工智能未来的发展方向,张亚勤院士表示,AI将对各个行业,如金融、制造业等带来生产力的大幅提升。许多工作将被取代,无论是体力劳动还是脑力劳动,只要是可重复、基于固定规则和程序的工作都有可能消失。这既带来了巨大的冲击,也提供了巨大的机会。在新时代的变革中,创业小公司常常扮演着重要的角色。尽管大型平台型技术非常重要,但他认为,未来更多的机会潜藏在基于大平台的各种“超级应用软件”中。另一方面,如何将大型知识图谱和第一性原理结合起来,探索多模态的融合统一,也是未来的一个重要发展方向。“42公里的马拉松我们现在只跑了5公里,未来还有无限可能。”
朱云来先生在讨论中积极评价了ChatGPT的突破性成果,认为它在综合能力和可解释性方面展现出了强大的潜力。然而,他也提到了一些限制,例如模型过度简化可能导致不够准确,普适性也有所降低。随着科技的高度发展,我们需要重新思考和调整人类社会的治理机制,因为这些发展可能会带来影响和挑战。尽管大型平台技术至关重要,大公司拥有一定的优势,但也存在惰性和垄断问题。而小公司平台则充满活力,但也面临困难和风险。因此,我们需要保护和鼓励小公司的创造性,使得无论大小公司都能够有各自生存的意义,并推动社会更快地进步。
两位嘉宾的对话引发了现场观众的热烈掌声和思考,大模型的发展与挑战是人工智能领域的一个重要话题,也是投融资领域的一个关注焦点。相信在未来,人工智能技术会不断创新和突破,为社会带来更多价值和影响。