AReaL 2.0 开源：让智能体在真实业务中持续学习，打通在线强化学习基础设施

2026/07/02 19:28阅读量 3

开源强化学习基础设施项目 AReaL 发布 2.0 版本，面向已部署的 Agent 提供在线强化学习支持。Agent 在真实任务中产生的交互轨迹可被记录并用于后续训练，使模型在安全可控的前提下持续进化。项目由蚂蚁集团、清华大学和香港科技大学发起，近期独立为开源社区并加入 PyTorch Foundation Ecosystem。

事件概述

2026 年 7 月 2 日，开源强化学习基础设施项目 AReaL 发布 2.0 版本。该版本旨在解决 Agent 在真实业务场景中上线后难以继续学习的问题，通过在线强化学习流程让 Agent 从日常任务中积累经验、持续提升能力。

核心信息

问题背景：Agent 进入生产环境后，会产生大量有价值的交互数据（如任务完成质量、工具调用成败、用户反馈等），但这些数据通常以日志形式保存，无法稳定、安全地转化为模型能力提升。
解决方案：AReaL 2.0 提供统一推理入口，Agent 原本发送给大模型的请求经过该入口后，后台即可记录关键交互过程，结合任务结束后的反馈或奖励信号，将真实轨迹用于后续训练。开发者无需重新开发 Agent，只需接入口即可启动在线强化学习。
安全与治理：系统引入面向 Agent 轨迹的数据代理机制，在权限控制、数据脱敏、隔离和审计等条件下，将真实业务数据接入训练流程，确保持续学习的安全可控。
项目背景：AReaL 由蚂蚁集团、清华大学和香港科技大学等团队于 2024 年发起。2026 年 5 月，项目从蚂蚁 InclusionAI 孵化成为独立开源社区，并加入 PyTorch Foundation Ecosystem。
开源资源：技术报告和代码已公开。GitHub 仓库：https://github.com/areal-project/AReaL；技术报告：https://arxiv.org/abs/2607.01120

值得关注

AReaL 2.0 指向智能体演化的新范式：Agent 不再是一次性训练和部署的工具，而是在真实环境中持续获取反馈、转化经验，并在安全边界内不断提升能力。这一架构尤其适合企业级应用，面对代码库更新、业务流程调整等动态变化，Agent 能通过在线学习保持适应力。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？