存力中国行北京站:共讨AI推理爆发期的“存储变革”

11月4日,由中国信息通信研究院组织召开的“存力中国行”北京站在信通院顺利举行。活动通过座谈会和实地调研的形式,深入探讨AI时代下先进存力赋能AI大模型发展的支撑作用,并围绕AI推理时代存储的技术挑战、创新路径、生态协同及行业落地等核心议题展开深度研讨,凝聚发展共识。

图片

AI推理对存储提出三重刚需

随着大模型推理向千行百业渗透,存储作为AI全生命周期的核心底座,其原有架构已难以适配新场景需求,多重痛点浮出水面。

首先,性能与容量的动态平衡难题成为行业首要挑战。中国移动云能力中心项目总师周宇指出,KVCache作为推理提速关键技术,对存储的高性能和容量弹性提出双重高要求,而传统存储架构已无法满足。

同时,多模态数据协同推理的普及,使得存储系统需同时处理文本、图像、视频等异构数据,对数据流转效率和兼容性提出更高标准。

华为数据存储产品线战略与业务发展部总裁王旭东补充道,数据量已从PB级迈向EB级,单一车企的数据集就可达200多PB,存储的规模化扩展与高效管理成为刚需。

其次,成本控制与算力协同效率是推理落地的核心制约。北京硅基流动科技有限公司解决方案总监唐安波认为,当前大模型推理存在“推不动、推得慢、推得贵”的普遍痛点,尤其是超长上下文场景下,显存占用过高导致算力浪费。

王旭东表示,不同行业对存储的性能与容量需求差异显著,如何兼顾横向性能扩展与纵向容量扩展,平衡性能需求与成本压力,是存储厂商需要破解的关键课题。

最后,数据治理与安全合规成为不可忽视的底线要求。随着语料库价值攀升,数据投毒、模型窃取、勒索攻击等风险持续加剧。王旭东表示,存储作为数据全生命周期的载体,需构建从加密、防勒索到容灾备份的全链路安全体系,同时还要解决跨区域数据汇聚、格式统一、清洗标注等高质量数据集构建难题。

多路径破解存储瓶颈

当前,面对刚性需求,产业链企业纷纷加大技术研发,从架构、协议、介质等多维度探索创新,形成一批可落地的解决方案。

周宇介绍,移动云针对KVCache优化推出分层缓存与动态调度方案,通过本地极速层、共享扩展层、冷备层三层架构,结合智能调度策略提升响应速度,同时推进“训推一体”建设,实现存量资源与新增推理需求的融合。

华为则提出UCM技术框架,通过多级记忆数据缓存将HBM数据流转至外置存储,降低首token时延的同时,以“以查代算”减少重复计算,大幅降低推理成本。

存算一体成为架构创新的核心方向。周宇透露,移动云正从软件和硬件两方面推进存算一体,软件层面用以太网协议栈替代RDMA降低成本,硬件层面自研SPU主控芯片管理多盘,避免数据传输放大。清微智能的于义强调,需探索低延迟、高带宽的存储技术,结合三维集成技术解决存储带宽问题,同时推进算网融合与存算融合的技术创新。

介质创新成为降本增效的关键抓手。周宇表示,移动云聚焦全闪存储发展,引入QLC介质并通过FDP技术优化其寿命与写入效率,同时通过去重、自适应压缩等技术缩减存储需求。

据悉,华为8月推出的高性能、大容量固态硬盘,实现对HBM的向上替代和对传统硬盘的向下替代,突破内存与容量限制。算苗科技副总裁钱小冬则带来差异化方案,其基于3D堆叠技术的AI推理芯片,带宽可达16TB/秒,能效比优于主流产品,为存储与算力的协同提供新可能。

面对复杂的技术挑战和国际形势带来的外部压力,行业普遍认为,单一企业的单点突破已难以满足需求,生态协同成为必然选择。

产业链协同破解技术“卡点”。针对国际形势下的供应链挑战,王旭东强调,AI存储的发展需要应用、算力、框架、芯片、存储厂商的端到端协同,才能打造高效、高性价比的推理系统。周宇也表示,移动云正与华为等企业在超节点等领域开展合作,通过技术整合实现优势互补。算苗科技钱小冬则呼吁与浪潮等生态伙伴合作,推动3D堆叠芯片的产业化落地。

此外,绿色节能与安全合规成为必选项。周宇透露,移动云通过自研低功耗存储服务器、缩减存储容量等方式降低能耗;华为等企业则将数据加密、防勒索等安全能力深度集成到存储系统,构建AI数据价值防线。

可见,从架构创新到介质升级,从场景适配到生态协同,产业链各方已形成共识,只有通过技术整合、标准共建、生态联动,才能破解存储“卡点”问题,降低行业智能化转型成本,推动AI推理在千行百业的深度落地。