算苗科技3D TokenPU芯片A4E流片,国产大模型推理芯片获突破

2026/06/17 18:16阅读量 39

算苗科技宣布其第一代3D TokenPU芯片A4E于6月15日正式流片,该芯片专为大模型推理设计,采用3D混合堆叠架构,将8层存储晶圆垂直堆叠于计算晶圆上,实现16TB/s访存带宽。芯片基于自研RISC-V架构和国产供应链打造,已与头部大模型厂商开展近一年深度合作,并获国开金融、源码资本等多方投资。

事件概述

2026年6月17日,专注3D架构AI云端大算力芯片的算苗科技(SUNMMIO)宣布,其面向大模型推理的3D TokenPU芯片A4E已于6月15日正式流片。该芯片采用3D混合堆叠架构,依托国产供应链,旨在为国内大模型产业提供自主可控的高性能算力支撑。

核心信息

  • 架构创新:A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆上,通过硅通孔(TSV)与凸点技术实现微米级互联,访存带宽达16TB/s,缓解“内存墙”瓶颈。
  • 设计理念:引入Tile-Native软硬件协同理念,以Tile为基本单元实现“一次搬运、多次复用”,硬件原生支持数据调度与多精度切换,软件适配LLVM、Triton等开源生态。
  • 自主可控:芯片基于自研RISC-V架构、自研IP和软件体系,与国内头部供应链伙伴合作,采用成熟国产工艺实现推理性能。团队核心成员曾完成万片级3D混合堆叠晶圆量产。
  • 商业化进展:核心客户为头部大模型厂商,已从芯片定义阶段开展近一年深度研发。公司已完成多轮融资,投资方包括国开金融、北京顺禧、源码资本、石溪资本、联想创投、襄禾资本等。

值得关注

算苗科技强调,3D TokenPU专为大模型Token处理而生,不依赖制程缩小即可提升算力密度和能效比。该芯片的流片标志着国产AI芯片在3D堆叠架构领域取得实质性进展,有望降低大模型推理的TCO(总拥有成本)。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。