AI驱动存储架构重构:从“数据走向AI”到“AI走向数据”
中国日均Token调用量两年增长超千倍,存储成为AI效率瓶颈。浪潮信息、IBM等厂商通过软硬件架构重构(如用户态并行架构、硬件压缩芯片)将延迟降至微秒级,并催生五层存储体系。2026年Q1 DRAM和NAND合约价分别上涨90%-95%和55%-60%,但行业共识认为效率优化比涨价更关键。存储角色正从被动容器转向主动智能枢纽。
事件概述
中国日均Token调用量从2024年的1000亿飙升至2026年3月的140万亿,AI全面进入生产应用。存储不再是被动保存数据的“容器”,而成为决定GPU算力效率的核心环节。
核心信息
-
架构“基因重组”:传统以CPU为核心的“通算架构”在GPU集群中效率低下,1%的GPU闲置即造成上亿元浪费。浪潮信息推出“全链路免锁零拷贝的用户态AI原生并行架构”,将延迟从毫秒级降至微秒级,单节点带宽达160GB/s(行业主流60-80GB/s)。IBM的Storage Scale并行文件系统支撑万卡集群高频checkpoint落盘,第五代闪存核心模块(FlashCore Module 5)嵌入专用芯片实现硬件级压缩、去重和加密,压缩比达1:5。
-
涨价与效率:2026年Q1,DRAM合约价涨90%-95%,NAND涨55%-60%,TrendForce预测Q2 NAND续涨70%-75%。但浪潮信息指出,采用高带宽方案后GPU利用率提升15%,IBM表示开启压缩功能后单位成本低于涨价前。
-
五层存储体系:新增第3.5层——专为推理场景设计的外置缓存层,放弃部分可靠性以换取效率(“数据丢了重新算,但不能牺牲效率”)。底层磁带存储回归,LTO-10单盘原始容量40TB(压缩后100TB),LTO-11/12将达70/110TB,冷数据访问等待约两分钟可接受。
-
让AI走向数据:传统“数据走向AI”模式在EB级数据、百万并发下不可持续。IBM提出内容感知存储(CAS),结合单一数据副本和即时感知变化;浪潮信息提出“AI Data Platform”,视数据为“不断流淌的河流”。产业协同方面,浪潮信息为伙伴提供全栈基础设施,IBM与英伟达深度集成,将于2026年Q2在IBM Cloud提供Blackwell Ultra GPU。
值得关注
- 存储正在进化为具备感知和计算能力的主动节点,承载KV Cache、卸载计算任务。
- 76%的CEO对IT架构“非常自信”,但43%的CIO感到焦虑,表明数据基础设施挑战被低估。
- 最终目标是让人从繁琐运维中解放,聚焦创新——存储融入业务,而非业务等待存储。
