Apple ML Research 发布多语言推理环境:支持14种语言的程序化推理生成
Apple Machine Learning Research 推出了 Multilingual Reasoning Gym,这是 Reasoning Gym 的多语言扩展版本,可在14种语言中程序化生成可验证的推理问题。该环境包含94个任务的模板,经过10种语言的母语者验证及针对性代码适配,确保语言自然性并保留无限实例生成与难度可调特性。系统支持跨语言平行数据的大规模生成,旨在推动多语言推理模型的研究与评估。
事件概述
Apple Machine Learning Research 发布了 Multilingual Reasoning Gym,作为其原有 Reasoning Gym (Stojanovski et al., 2025) 的多语言扩展版本。该环境旨在通过程序化方式在14种不同语言中生成可验证的推理问题,以支持多语言推理模型的研究。
核心信息
- 任务规模与覆盖:涵盖94个任务模板,已针对10种语言完成母语者验证,并进行了针对性的代码或模板适配以确保语言的自然度。
- 技术特性:
- 保留了原 Reasoning Gym 的核心优势,包括近乎无限的实例生成能力和可调节的难度级别。
- 适用于基于可验证奖励的强化学习(Reinforcement Learning from Verifiable Rewards)及各类评估场景。
- 由于环境的程序化本质,生成的问题在不同语言间具有平行性,支持大规模跨语言平行数据的生成。
- 开源情况:研究团队已公开实现代码(GitHub),供社区用于多语言推理模型的训练与测试。
值得关注
该项目的推出标志着程序化推理环境在多语言领域的规模化扩展,为解决大语言模型(LLMs)在分布外(distribution shifts)推理鲁棒性问题提供了新的数据基础。
