大模型时代已至,发展近两年的时间后,基于大模型发展而引发的产业链变革也愈加清晰。今年,是大模型加速落地的一年,也是背后算力以及基础设施升级和竞争更为激烈的一年。
中国科学院计算技术研究所研究员张云泉指出,“我们已经进入算力经济时代了。”在水利、电力、信息时代之后,终于进入了算力时代,所有的创新都是基于算力,成为一个新的类别。
可以肯定的一点是,当下,算力已然成为数字经济社会发展的重要底座。超算、云计算、大数据、AI 的融合创新的发展,推动算力需求迅猛增长。近三年来TOP100的算力服务份额不断攀升,中国算力发展也快速步入全新阶段。
但同时也要认识到,算力领域的供需矛盾日益凸显一方面是各行业的算力需求急剧增长,另一方面则是算力资源紧缺与利用率不足的现状。如何有效缓解算力短缺与低效利用问题,实现资源的高效调度,以及推动智能算力的高质量发展,成为重要议题。
算力每投入1元,带动3-4元经济产出
“算力”这个词,到目前没有一个标准定义,有很多不同的理解。张云泉认为,算力是一种软硬件融合的方式,是软硬件上下全栈的东西,一定是融合在一起来贯穿再执行某种计算的能力,而且效率一定要高、要绿色。
算力在今天人工智能的时代是一个核心的动能,核心的基础,也是发展新质生产力的关键驱动力。伴随着AI的快速迭代演进,对算力也提出了更多的需求以及更高的要求。
当前背景下,算力发展则呈现出几大趋势:第一,算力服务异军突起,中国已进入算力经济时代。张云泉指出,“算力中每投入1元,带动3-4元经济产出;算力发展指数每提高1点,GDP增长约1293亿元。”
算力经济是数字经济衍生的一种新经济形态,其以计算为核心,已成为衡量一个地方数字经济发展程度的代表性指标和新旧动能转换的主要手段。在张云泉看来,算力服务业是一种商业模式,有四类,即算力基础设施建设、算力生产、算力服务、算力消费,基本上在这个链条上来做算力服务业,把它统称为算力经济的一个重要部分。
其次,超算与AI融合创新,智算中心列入新基建,大模型带来新的计算需求。“在2020-2026年的预测中,AI的算力需求将快速超过我们对基础算力的需求,算力需求主要来自于大模型、自动驾驶、短视频等场景。”
在大模型爆发之前,通用算力每年算力的增长是符合摩尔时代的摩尔定律的。到了2008年以后开始有了人工智能的需求,以深度学习作为发展,每年的增速已经出现了一定的高速增长,从每18个月翻一番,变成每6个月翻一番。中国信通院发布的数据指出,截至2021年底,基础算力稳定增长,规模为95EFLOPS,增速为24%,占比为47%。智能算力增长迅速,2021年规模达到104EFLOPS,增速为85%,占比为51.5%。
第三,GPT大模型崛起,AGI时代来临,催生模型作为服务MaaS商业模式。张云泉认为,模型作为服务兴起之后,对于传统的软件开发、服务部署都会有影响,此前的三层架构(IaaS、SaaS、PaaS)中间有可能加入MaaS层,并让其上下两层逐渐模糊化。
众雄争霸,算力该如何支撑新的经济
2024年将是我国算力的新起点,也将迎来一个突破之年。算力经济新形态下,整个上下游产业链也迎来了新的竞争。《算力基础设施高质量发展行动计划》提出,到2025年中国的智能算力占比将达到35%。
同时,《2023—2024年中国人工智能计算力发展评估报告》指出,随着AIGC走入各行业,重构工作和生产方式,算力基础设施平台需从互联性、扩展性、灵活性等角度出发,以先进的系统性能力满足市场应用需求,使整体性能达到最优。
在去年的中国算力大会上,联想方面曾透露,50%的研发将会投入到人工智能上面,联想所有基础算力设施100%会跟AI相关。联想中国基础设施业务群战略总监黄山指出,当前一些客户在算力市场上对算力的使用遇到了一些挑战,联想也是观察到了一些问题和趋势,这些也成为布局算力的基础。
第一,在中国市场上,国际和国产的算力都非常受到重视。从国际算力发展来说,进入了一个比较平缓阶段;但从国产算力的发展来说,核心算力即将承担越来越多主流的计算任务,国产算力会迅猛发展。在这个里面也涌现出众雄争霸态势,在此态势下作为一个算力系统厂商,需要跟国产核心算力做非常深刻的对接,能够支持他们的发展,把在芯片层的算力在系统层最大限度释放出来,支持我们国内所需要的应用。
第二,液冷的发展。此前,谈液冷的时候主要是在HPC(高性能计算)这个圈子里,除了HPC圈子,3年前液冷并不是一个非常能够去变现的技术,但最近这两年AI的大发展促进了液冷出HPC的圈。
第三,交付方式的变化。在AI智算大发展、超智融合的趋势之下,交互的方式不再是原来的比较单一的方式了,现在更多大模型的用户和算力使用者需要更多灵活的交互方式,里面包括私有云、混合云、公有云、直接的租赁和订阅式服务等,这些都是我们遇到的,整个算力作为经济的条件下,需要有这些灵活的部署与交付。
第四,不但要服务于在全球有布局的用户,也要服务于我们国内的用户。黄山表示,全球布局的用户要向他提供全球的供应链能力、全球的生产能力、全球的服务能力,把算力在全球都能支撑好。还有很多用户聚焦于国内,需要在国内有非常好的生态环境,让我们对国内软硬件生态做好非常好的支撑,包括阿里云及其他国内部件等,还要有国内的供应链安全,随时可以不会被国际环境所影响而导致断供。
基于当前算力产业的全新需求下,打造更灵活的AI导向的基础设施,为不同的行业客户提供全栈智能产品和服务,也成为各家企业布局的重点。目前,联想中国基础设施业务已经构建了“一横五纵”的战略框架。其中,“一横”是指联想万全异构智算平台,“五纵”包括服务器、存储、数据网络、软件及超融合、边缘基础设施产品和方案。
黄山介绍称,万全异构智算平台融合了算力匹配魔方、GPU内核态虚拟化、集合通信算法库、AI高效断点续训技术、AI与HPC集群超级调度器等技术,帮助客户轻松获得融合、稳定的AI基础设施,能够满足不同场景高效、稳定、多元的算力需求。
根据联想发布的最新二季度财报显示,受益于AI基础设施产品推出和GPU供应增加,ISG基础设施业务实现31.6亿美元的收入,同比增长65%。相关数据显示,,联想集团的AI服务器的订单在季度环比增长了20%。联想中国基础设施业务群服务器产品部总经理周韬透露,首款搭载AMD最新处理器的联想问天WR5225 G3即将正式发布。
当前,随着生成式AI的突飞猛进,算力越来越成为数字经济社会发展的重要底座。推进智能算力的高质量发展,已成为行业内共同推进的方向。张云泉表示,算力经济的普及需要类似电力插座一样的算力插座,如今大模型就扮演了算力插座的角色。未来也会出现类似发电厂的算力工厂,尤其是在新能源发达地区。(本文首发于钛媒体APP,作者|杜志强,编辑|钟毅)