快手11篇论文入选ICML 2026，覆盖大模型、强化学习与CV，1篇摘得Spotlight

2026/06/29 14:58阅读量 2

快手技术团队共11篇论文被ICML 2026接收，其中1篇入选Spotlight Papers。研究覆盖大语言模型、强化学习、信息检索、计算机视觉等方向，代表性成果包括首个隐喻视频理解基准MetaphorVU、工业级端到端电商搜索框架OneSearch、以及空间推理图像编辑奖励模型SpatialReward。

事件概述

快手技术团队共11篇论文被ICML 2026（第43届国际机器学习会议）接收，其中1篇入选Spotlight Papers。ICML 2026投稿量达23,918篇，整体录用率约26.6%，会议于7月6日至11日在韩国首尔COEX举行。快手将在B101展位展示相关技术。

核心论文亮点

MetaphorVU (Spotlight)：首个面向隐喻视频理解的系统性基准，揭示多模态大模型在跨域映射上的能力不足，并提出推理阶段增强框架MetaphorBoost，显著提升隐喻理解性能。
OneSearch：首个在工业界落地部署的端到端生成式电商搜索框架。通过关键词增强层次化量化编码、多视角用户行为序列注入和偏好感知奖励系统，线上A/B实验实现商品点击率提升1.67%、买家数提升2.40%、订单量提升3.22%，同时运营支出降低75.40%，算力利用率从3.26%提升至27.32%。
SpatialReward：用于图像编辑的奖励模型，通过显式空间推理解决现有模型的“注意力坍塌”问题。在EditReward-Bench和MMRB2上较生成式基线分别提升11.3%和9.1%，作为下游Online RL信号将OmniGen2在GEdit-Bench得分提升0.90，同时实现1.5倍推理加速。
SWE-Compass：统一代码智能评估框架，覆盖8种任务类型、8类编程场景和10种编程语言，构建2000个高保真实例。实验发现模型在复杂任务上能力骤降、同一模型在不同智能体框架下表现迥异，以及Rust等新兴语言上的多语言鲁棒性鸿沟。

其他入选论文

Causal Discovery for Irregularly Time Series with Consistency Guarantees：提出ReTimeCausal框架，在不规则采样和高缺失率下实现因果关系发现的理论一致性保证。
Coloring the Noise: Adversarial Sobolev Alignment for Faithful Image Super Resolution：通过Sobolev几何对齐抑制超分辨率中的幻觉伪影，提出ASASR框架。
Large-Scale Notification Dispatch with Bundle Treatments and Multi-Outcome Uplift Optimization：提出BUOPLR两阶段通知分发方法，已全量部署于快手PMOS系统。
Learning to Rank by Directly Optimizing Full-Order Probabilities：提出全序下界（FOB）用于排序学习，在合成和基准任务上提升全列表排序指标。
Phase-Aware Mixture of Experts for Agentic Reinforcement Learning：提出阶段感知混合专家架构PA-MoE，增强强化学习在简单与复杂任务间的参数分配。
VideoTemp-o3：将视频问答与时序定位统一的Agentic框架，在长视频理解、时序定位等任务上达到最先进性能。
Weights to Code: Extracting Interpretable Algorithms from the Discrete Transformer：提出Discrete Transformer架构，从权重中提取可执行Python程序，推进模型可解释性。

阅读原文详情

事件概述

核心论文亮点

其他入选论文

准备好启动您的定制项目了吗？