华为前天才少年创业：以LPDDR/NAND重构显存，融资超4亿押注大模型推理降本

2026/04/17 11:33阅读量 141

北京行云集成电路有限公司宣布连续完成Pre-A及Pre-A+轮融资，总额超4亿元人民币，由五源资本、赛富投资等领投。公司创始人季宇博士提出放弃昂贵的HBM，转而采用LPDDR甚至NAND介质替代显存，旨在将显存成本降低1至2个数量级。该方案通过多通道并行架构弥补带宽短板，并已在DeepSeek本地化部署中验证了非高端硬件运行稀疏模型的可行性。

事件概述

国内全自研GPGPU创新企业「北京行云集成电路有限公司」（简称“行云”）宣布连续完成Pre-A及Pre-A+多轮融资，融资金额超过4亿元人民币。本轮融资由五源资本、赛富投资基金、春华资本联合领投，北京、江苏等地地方国资，佰维存储（688525），以及金沙江联合带动知名GPU企业创始人家办、创维资本等产业资本跟投。云岫资本担任下一轮独家融资财务顾问。

核心技术与战略

技术路线变革：针对大模型推理中显存成本占比过高的问题，行云选择放弃主流的高带宽内存（HBM），转而采用低成本介质如LPDDR乃至NAND（SSD颗粒）作为显存载体。据创始人季宇博士测算，通过介质替换，显存成本可降低1到2个数量级。
架构补偿机制：针对低成本介质单颗粒带宽较低的短板，行云采用多颗粒、多通道并行设计，通过规模化堆叠将整体带宽提升至TB级别，以满足大模型推理的数据吞吐需求。
系统级协同优化：面对MoE（混合专家）等稀疏模型对内存容量需求激增但绝对带宽需求下降的趋势，行云强调系统级设计能力。通过Prefill/Decode分离（PD分离）、KV Cache稀疏化等工程手段，实现成本与效率的平衡，适配从Chatbot到Agent场景的快速变化。

团队背景与产品进展

核心团队：
- 创始人季宇博士：清华大学计算机系博士，“华为天才少年”计划成员，曾在华为海思深度参与昇腾AI芯片编译器与架构研发。
- CTO余洪敏博士：中科院半导体所博士，曾主导百度昆仑芯、海思昇腾等多款芯片研发与量产，拥有十余款芯片成功流片经验。
产品验证：此前推出的“褐蚁一体机”尝试利用CPU与通用内存构建低成本推理方案，已成功在DeepSeek的本地化部署场景中落地，验证了稀疏模型在非高端硬件上的可行性。
未来规划：公司今年的核心目标是完成自研芯片流片并推向市场。后续计划将低成本、高质量的万亿级模型算力引入端侧设备（如Open Claw类设备），突破当前端侧仅能运行百B参数小模型的局限。

投资方观点

五源资本：认为行云是AI芯片领域少有的“第一性原理”思考者，其放弃HBM、以LPDDR/NAND重构显存成本的思路并非渐进优化，而是推动行业范式创新。随着AI推理需求从云端向多端迁移，高效低成本的推理能力成为刚需。
赛富投资基金：指出在国产算力受限背景下，降本关键在于显存和系统架构。行云团队展现了罕见的系统级工程视野，通过介质替换与并行架构设计，有望彻底重构算力成本模型。
春华资本：肯定季宇博士对“降本关键在显存而非算力”的判断领先行业共识半步，且每一步均被市场验证。团队兼具前瞻架构创新与扎实的量产落地能力。
佰维存储：认为行云通过介质挑战HBM霸权是对大模型推理成本结构的底层重构，其深厚的流片与量产经验确保了从实验室架构到商业化量产的跨越。

阅读原文详情

事件概述

核心技术与战略

团队背景与产品进展

投资方观点

准备好启动您的定制项目了吗？