滴滴五篇论文入选ICML 2026,覆盖大模型智能体与因果推断
滴滴共五篇论文被ICML 2026收录,合作高校包括中山大学、香港科技大学(广州)、北京大学、上海财经大学。研究涉及大模型长周期评估基准、GUI智能体自进化记忆系统、持续离线强化学习、LLM智能体上下文省略以及因果推断联合估计框架。ICML 2026将于2026年7月6-11日在首尔举行,本届共收到23918篇投稿,录用6352篇。
事件概述
机器学习顶级会议ICML 2026录用结果公布,滴滴共有五篇高质量论文被收录。论文分别来自滴滴L Lab团队和滴滴网约车交易市场技术团队,与中山大学、香港科技大学(广州)、北京大学、上海财经大学等高校合作完成。ICML 2026将于2026年7月6-11日在韩国首尔举行,本届共收到23918篇论文投稿,录用6352篇,其中526篇被选为Spotlight Paper。
核心论文信息
论文一:UltraHorizon: Benchmarking LLM-Agent Capabilities in Ultra Long-Horizon Scenarios
- 作者:Haotian Luo 等
- 团队:滴滴L-Lab × 中山大学
- 方向:大模型智能体评估基准、长周期任务推理、规划与工具使用
- 简介:提出跨环境探索基准测试,特征是极长的智能体交互轨迹、高Token消耗量和频繁工具调用。实验表明当前最先进智能体在这些任务中远不如人类,失败原因主要是上下文锁定和基础能力缺失。
论文二:Darwinian Memory: A Training-Free Self-Regulating Memory System for GUI Agent Evolution
- 作者:Hongze Mi 等
- 团队:滴滴L-Lab
- 方向:多模态大模型智能体、GUI自动化、自进化记忆系统
- 简介:提出达尔文记忆系统(DMS),利用效用驱动的“自然选择”机制动态分解任务并淘汰次优策略,无需额外训练即可提升MLLM智能体的任务成功率、执行稳定性与效率。
论文三:HTAC: Hierarchical Task-Aware Composition for Continual Offline Reinforcement Learning
- 作者:Qiyang Zhou 等
- 团队:滴滴L-Lab × 中山大学
- 方向:持续离线强化学习、跨任务知识迁移与隔离、层次化任务表示
- 简介:提出层次化任务感知组合方法(HTAC),通过双层任务编码与软组合机制,将任务解耦为域级与任务级嵌入,借助按需创建的专家网络与注意力式知识整合实现参数高效的知识隔离与复用,提升跨任务泛化与知识迁移能力。
论文四:Agent-Omit: Adaptive Context Omission for Efficient LLM Agents
- 作者:Yansong Ning 等
- 团队:滴滴L-Lab × 香港科技大学(广州)
- 方向:大语言模型智能体
- 简介:提出Agent-Omit框架,通过两阶段训练(冷启动微调+省略感知强化学习)实现自适应省略冗余上下文内容。理论分析表明省略策略偏差受KL散度上界约束。在五大基准测试中,Agent-Omit-8B性能比肩前沿大模型且显著降低Token开销。
论文五:Feasible Fusion: Constrained Joint Estimation under Structural Non-Overlap
- 作者:Yuxi Du 等
- 团队:滴滴网约车交易市场技术 × 北京大学、上海财经大学
- 方向:因果推断
- 简介:形式化刻画由处理机制诱发的结构性非重叠,证明在此情形下常用加权融合方法无法满足随机化识别约束。提出受约束的联合估计框架,并推导带惩罚项的原对偶算法。在滴滴大规模网约车应用场景中,该方法效果显著优于基线,可与使用更多RCT数据训练的模型相仿。
