北大系寒序科技完成数千万元融资,自研流式推理芯片直指2000 Tokens/s
专注于超快流式推理芯片的创业公司「寒序科技」宣布完成数千万元融资,由启高资本、赛意产业基金投资。该公司首颗芯片样片测试显示单位面积带宽达100 GB/s/mm²,下一代芯片目标性能为2000 Tokens/s+,显著高于主流模型30-50 Tokens/s的水平。团队源自北京大学磁学中心,采用非GPU路线,聚焦确定性流式乘加单元与片上MRAM+SRAM架构。
事件概述
国内专注超快流式推理芯片的创业公司「寒序科技」(Hanxu Technology)已完成数千万元人民币融资。本轮投资方包括启高资本和赛意产业基金,源合资本担任独家财务顾问。公司成立于2023年8月,核心团队源自北京大学磁学中心,具备从物理材料到芯片设计的全栈能力。
核心技术与性能指标
- 样片测试结果:首颗芯片样片回片测试表现理想,关键指标「单位面积带宽」达到100 GB/s/mm²,该数据与Groq LPU(Language Process Unit)披露水平一致。
- 下一代芯片规划:目前已在流片中,采用「片上MRAM+SRAM」架构及「确定性流式乘加单元」技术,目标性能指向2000 Tokens/s以上。
- 行业对比:当前主流对话模型的推理速度约为30-50 Tokens/s,寒序科技的技术路径旨在突破这一瓶颈,实现真正的“流式输出”与超高吞吐量。
战略定位与市场背景
- 差异化路线:不同于GPU厂商追求大而全或通用训练,寒序科技选择极致聚焦推理速度,核心理念为“唯快不破”。
- 技术对标:业内评价其为国内少有的沿袭Groq技术路线的团队。近期市场传闻NVIDIA已以约200亿美元估值级别锁定Groq技术合作,并计划在其新一代AI推理系统中采用相关设计,寒序方案被视为最贴近该超大带宽流式处理方案的国产替代选项之一。
- 发展阶段:公司表示关键技术与样片验证已度过最危险阶段,新一轮融资正在推进中,标志着其正式进入商业化加速期。
