华为前天才少年创业:以LPDDR/NAND重构显存,融资超4亿押注大模型推理降本
2026/04/17 11:33阅读量 1
北京行云集成电路有限公司宣布连续完成Pre-A及Pre-A+轮融资,总额超4亿元人民币,由五源资本、赛富投资等领投。公司创始人季宇博士提出放弃昂贵的HBM,转而采用LPDDR甚至NAND介质替代显存,旨在将显存成本降低1至2个数量级。该方案通过多通道并行架构弥补带宽短板,并已在DeepSeek本地化部署中验证了非高端硬件运行稀疏模型的可行性。
事件概述
国内全自研GPGPU创新企业「北京行云集成电路有限公司」(简称“行云”)宣布连续完成Pre-A及Pre-A+多轮融资,融资金额超过4亿元人民币。本轮融资由五源资本、赛富投资基金、春华资本联合领投,北京、江苏等地地方国资,佰维存储(688525),以及金沙江联合带动知名GPU企业创始人家办、创维资本等产业资本跟投。云岫资本担任下一轮独家融资财务顾问。
核心技术与战略
- 技术路线变革:针对大模型推理中显存成本占比过高的问题,行云选择放弃主流的高带宽内存(HBM),转而采用低成本介质如LPDDR乃至NAND(SSD颗粒)作为显存载体。据创始人季宇博士测算,通过介质替换,显存成本可降低1到2个数量级。
- 架构补偿机制:针对低成本介质单颗粒带宽较低的短板,行云采用多颗粒、多通道并行设计,通过规模化堆叠将整体带宽提升至TB级别,以满足大模型推理的数据吞吐需求。
- 系统级协同优化:面对MoE(混合专家)等稀疏模型对内存容量需求激增但绝对带宽需求下降的趋势,行云强调系统级设计能力。通过Prefill/Decode分离(PD分离)、KV Cache稀疏化等工程手段,实现成本与效率的平衡,适配从Chatbot到Agent场景的快速变化。
团队背景与产品进展
- 核心团队:
- 创始人季宇博士:清华大学计算机系博士,“华为天才少年”计划成员,曾在华为海思深度参与昇腾AI芯片编译器与架构研发。
- CTO余洪敏博士:中科院半导体所博士,曾主导百度昆仑芯、海思昇腾等多款芯片研发与量产,拥有十余款芯片成功流片经验。
- 产品验证:此前推出的“褐蚁一体机”尝试利用CPU与通用内存构建低成本推理方案,已成功在DeepSeek的本地化部署场景中落地,验证了稀疏模型在非高端硬件上的可行性。
- 未来规划:公司今年的核心目标是完成自研芯片流片并推向市场。后续计划将低成本、高质量的万亿级模型算力引入端侧设备(如Open Claw类设备),突破当前端侧仅能运行百B参数小模型的局限。
投资方观点
- 五源资本:认为行云是AI芯片领域少有的“第一性原理”思考者,其放弃HBM、以LPDDR/NAND重构显存成本的思路并非渐进优化,而是推动行业范式创新。随着AI推理需求从云端向多端迁移,高效低成本的推理能力成为刚需。
- 赛富投资基金:指出在国产算力受限背景下,降本关键在于显存和系统架构。行云团队展现了罕见的系统级工程视野,通过介质替换与并行架构设计,有望彻底重构算力成本模型。
- 春华资本:肯定季宇博士对“降本关键在显存而非算力”的判断领先行业共识半步,且每一步均被市场验证。团队兼具前瞻架构创新与扎实的量产落地能力。
- 佰维存储:认为行云通过介质挑战HBM霸权是对大模型推理成本结构的底层重构,其深厚的流片与量产经验确保了从实验室架构到商业化量产的跨越。
