·聚焦:人工智能、芯片等行业
欢迎各位客官关注、转发
2024年,o系列、Llama3、通义千问、R1等大模型不断升级,尤其是DeepSeek R1系列模型的发布,正是基于算法层面的极大创新,对中国乃至全球的人工智能产业带来深刻变革。
一方面DeepSeek采用了大规模强化学习、多头注意力机制等算法创新,智能水平在美国高中数学竞赛邀请赛AIME、博士水平科学问答等测试中榜单上接近甚至超过了OpenAI的o1模型。
另一方面,DeepSeek R1算法的创新也带来训练和推理阶段算力消耗的降低,训练算力只有Llama3的1/10,推理阶段缓存数据量降低了50倍,为在算力约束的条件下进行AI算法创新提供了一个全新思路,吸引了全球开发者,7天实现了活跃用户数破亿。
规模法则(Scaling law)在当前人工智能发展中仍然占主导地位,推高人工智能算力需求。
目前规模法则正在从预训练扩展到了后训练和推理阶段,基于强化学习、思维链等算法创新在后训练和推理阶段更多的算力投入,可以进一步大幅提升大模型的深度思考能力。
同时基于杰文斯悖论的现象表明,DeepSeek带来的算法效率的提升并未抑制算力需求,反而因更多的用户和场景的加入,推动大模型普及与应用落地,重构产业创新范式,带动数据中心、边缘及端侧算力建设。
IDC数据显示,2024年全球人工智能服务器市场规模预计为1,251亿美元,2025年将增至1,587亿美元,2028年有望达到2,227亿美元,其中生成式人工智能服务器占比将从2025年的29.6%提升至2028年的37.7%。
中国智能算力发展水平增速高于预期。在中国,企业加速生成式人工智能布局和投入,IDC调研结果显示,目前42%的中国企业已经开始进行大模型的初步测试和重点概念验证,17%的企业已经将技术引入生产阶段,并应用于实际业务中,在未来18个月内,硬件升级将成为企业的首要投资目标。
在旺盛的市场需求、丰富应用场景的驱动下,中国智能算力规模呈现增长态势。IDC最新预测结果显示,2025年中国智能算力规模将达到1,037.3 EFLOPS,并在2028年达到 2,781.9 EFLOPS,2023-2028年中国智能算力规模和通用算力规模的五年年复合增长率分别达46.2%和18.8%,较上一版本预期值33.9%和16.6%有显著提升。
中国人工智能算力基础设施发展呈现出多元化、服务化、场景化、绿色化等特征。大模型的开源趋势正在显著增强,成为加速AI普惠、降本增效的重要力量。开源模型,通过大幅降低训练部署成本并提供与闭源模型性能水平相当的能力,正成为推动人工智能技术普及和应用落地的重要力量。
以下是《2025年中国人工智能计算力发展评估报告》部分内容:
本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。