AReaL 2.0 开源:让智能体在真实业务中持续学习,打通在线强化学习基础设施
2026/07/02 19:28阅读量 3
开源强化学习基础设施项目 AReaL 发布 2.0 版本,面向已部署的 Agent 提供在线强化学习支持。Agent 在真实任务中产生的交互轨迹可被记录并用于后续训练,使模型在安全可控的前提下持续进化。项目由蚂蚁集团、清华大学和香港科技大学发起,近期独立为开源社区并加入 PyTorch Foundation Ecosystem。
事件概述
2026 年 7 月 2 日,开源强化学习基础设施项目 AReaL 发布 2.0 版本。该版本旨在解决 Agent 在真实业务场景中上线后难以继续学习的问题,通过在线强化学习流程让 Agent 从日常任务中积累经验、持续提升能力。
核心信息
- 问题背景:Agent 进入生产环境后,会产生大量有价值的交互数据(如任务完成质量、工具调用成败、用户反馈等),但这些数据通常以日志形式保存,无法稳定、安全地转化为模型能力提升。
- 解决方案:AReaL 2.0 提供统一推理入口,Agent 原本发送给大模型的请求经过该入口后,后台即可记录关键交互过程,结合任务结束后的反馈或奖励信号,将真实轨迹用于后续训练。开发者无需重新开发 Agent,只需接入口即可启动在线强化学习。
- 安全与治理:系统引入面向 Agent 轨迹的数据代理机制,在权限控制、数据脱敏、隔离和审计等条件下,将真实业务数据接入训练流程,确保持续学习的安全可控。
- 项目背景:AReaL 由蚂蚁集团、清华大学和香港科技大学等团队于 2024 年发起。2026 年 5 月,项目从蚂蚁 InclusionAI 孵化成为独立开源社区,并加入 PyTorch Foundation Ecosystem。
- 开源资源:技术报告和代码已公开。GitHub 仓库:https://github.com/areal-project/AReaL;技术报告:https://arxiv.org/abs/2607.01120
值得关注
AReaL 2.0 指向智能体演化的新范式:Agent 不再是一次性训练和部署的工具,而是在真实环境中持续获取反馈、转化经验,并在安全边界内不断提升能力。这一架构尤其适合企业级应用,面对代码库更新、业务流程调整等动态变化,Agent 能通过在线学习保持适应力。
