快手11篇论文入选ICML 2026,覆盖大模型、强化学习与CV,1篇摘得Spotlight

2026/06/29 14:58阅读量 2

快手技术团队共11篇论文被ICML 2026接收,其中1篇入选Spotlight Papers。研究覆盖大语言模型、强化学习、信息检索、计算机视觉等方向,代表性成果包括首个隐喻视频理解基准MetaphorVU、工业级端到端电商搜索框架OneSearch、以及空间推理图像编辑奖励模型SpatialReward。

事件概述

快手技术团队共11篇论文被ICML 2026(第43届国际机器学习会议)接收,其中1篇入选Spotlight Papers。ICML 2026投稿量达23,918篇,整体录用率约26.6%,会议于7月6日至11日在韩国首尔COEX举行。快手将在B101展位展示相关技术。

核心论文亮点

  • MetaphorVU (Spotlight):首个面向隐喻视频理解的系统性基准,揭示多模态大模型在跨域映射上的能力不足,并提出推理阶段增强框架MetaphorBoost,显著提升隐喻理解性能。
  • OneSearch:首个在工业界落地部署的端到端生成式电商搜索框架。通过关键词增强层次化量化编码、多视角用户行为序列注入和偏好感知奖励系统,线上A/B实验实现商品点击率提升1.67%、买家数提升2.40%、订单量提升3.22%,同时运营支出降低75.40%,算力利用率从3.26%提升至27.32%。
  • SpatialReward:用于图像编辑的奖励模型,通过显式空间推理解决现有模型的“注意力坍塌”问题。在EditReward-Bench和MMRB2上较生成式基线分别提升11.3%和9.1%,作为下游Online RL信号将OmniGen2在GEdit-Bench得分提升0.90,同时实现1.5倍推理加速。
  • SWE-Compass:统一代码智能评估框架,覆盖8种任务类型、8类编程场景和10种编程语言,构建2000个高保真实例。实验发现模型在复杂任务上能力骤降、同一模型在不同智能体框架下表现迥异,以及Rust等新兴语言上的多语言鲁棒性鸿沟。

其他入选论文

  • Causal Discovery for Irregularly Time Series with Consistency Guarantees:提出ReTimeCausal框架,在不规则采样和高缺失率下实现因果关系发现的理论一致性保证。
  • Coloring the Noise: Adversarial Sobolev Alignment for Faithful Image Super Resolution:通过Sobolev几何对齐抑制超分辨率中的幻觉伪影,提出ASASR框架。
  • Large-Scale Notification Dispatch with Bundle Treatments and Multi-Outcome Uplift Optimization:提出BUOPLR两阶段通知分发方法,已全量部署于快手PMOS系统。
  • Learning to Rank by Directly Optimizing Full-Order Probabilities:提出全序下界(FOB)用于排序学习,在合成和基准任务上提升全列表排序指标。
  • Phase-Aware Mixture of Experts for Agentic Reinforcement Learning:提出阶段感知混合专家架构PA-MoE,增强强化学习在简单与复杂任务间的参数分配。
  • VideoTemp-o3:将视频问答与时序定位统一的Agentic框架,在长视频理解、时序定位等任务上达到最先进性能。
  • Weights to Code: Extracting Interpretable Algorithms from the Discrete Transformer:提出Discrete Transformer架构,从权重中提取可执行Python程序,推进模型可解释性。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。