Apple ML Research 发布多语言推理环境:支持14种语言的程序化推理生成

Apple Machine Learning Research 推出了 Multilingual Reasoning Gym,这是 Reasoning Gym 的多语言扩展版本,可在14种语言中程序化生成可验证的推理问题。该环境包含94个任务的模板,经过10种语言的母语者验证及针对性代码适配,确保语言自然性并保留无限实例生成与难度可调特性。系统支持跨语言平行数据的大规模生成,旨在推动多语言推理模型的研究与评估。

事件概述

Apple Machine Learning Research 发布了 Multilingual Reasoning Gym,作为其原有 Reasoning Gym (Stojanovski et al., 2025) 的多语言扩展版本。该环境旨在通过程序化方式在14种不同语言中生成可验证的推理问题,以支持多语言推理模型的研究。

核心信息

  • 任务规模与覆盖:涵盖94个任务模板,已针对10种语言完成母语者验证,并进行了针对性的代码或模板适配以确保语言的自然度。
  • 技术特性
    • 保留了原 Reasoning Gym 的核心优势,包括近乎无限的实例生成能力和可调节的难度级别。
    • 适用于基于可验证奖励的强化学习(Reinforcement Learning from Verifiable Rewards)及各类评估场景。
    • 由于环境的程序化本质,生成的问题在不同语言间具有平行性,支持大规模跨语言平行数据的生成。
  • 开源情况:研究团队已公开实现代码(GitHub),供社区用于多语言推理模型的训练与测试。

值得关注

该项目的推出标志着程序化推理环境在多语言领域的规模化扩展,为解决大语言模型(LLMs)在分布外(distribution shifts)推理鲁棒性问题提供了新的数据基础。

来源:Apple Machine Learning Research
返回列表

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。