小红书开源 Relax:面向全模态 Agentic 的异步 RL 训练引擎
2026/04/15 14:50阅读量 2
小红书正式开源 Relax,这是一款专为全模态智能体(Agentic)设计的异步强化学习训练引擎。该框架旨在解决多模态场景下强化学习训练的效率与扩展性难题,支持复杂的异步计算流程。Relax 的发布标志着小红书在 AI 基础设施领域的技术沉淀进一步开放,为行业提供了新的训练工具选择。
事件概述
小红书开源了名为 Relax 的异步强化学习(RL)训练引擎。该框架专门针对全模态(All-modal)智能体(Agentic)的训练需求设计,旨在提升复杂多模态场景下的训练效率与系统稳定性。
核心特性
- 异步训练架构:Relax 采用异步机制处理强化学习任务,优化了数据采样、策略更新与环境交互的并行度,有效降低了训练延迟。
- 全模态支持:框架原生适配文本、图像、音频等多种模态数据的联合训练,满足现代智能体对多源信息处理的需求。
- 工程化落地:作为从实际业务场景中提炼出的基础设施,Relax 解决了大规模模型训练中常见的资源调度与通信瓶颈问题。
技术背景
此次开源是小红书开发者生态建设的一部分,体现了其在 AI 大模型及智能体技术领域的持续投入。Relax 的推出填补了特定领域内高效异步 RL 训练工具的空白,有助于推动相关技术的社区化发展。
