STUN:可扩展的MoE模型剪枝新法2025/06/05 11:30阅读量 22先结构化剪专家,再非结构化剪权重 解决MoE专家剪枝计算爆炸问题 用专家相似性聚类,避免组合爆炸暂无可展示正文阅读原文详情