STUN:可扩展的MoE模型剪枝新法

2025/06/05 11:30阅读量 4

先结构化剪专家,再非结构化剪权重 解决MoE专家剪枝计算爆炸问题 用专家相似性聚类,避免组合爆炸

暂无可展示正文

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。