Apple ML Research 发布多语言推理环境：支持14种语言的程序化推理生成

2026/03/13 08:00阅读量 16

Apple Machine Learning Research 推出了 Multilingual Reasoning Gym，这是 Reasoning Gym 的多语言扩展版本，可在14种语言中程序化生成可验证的推理问题。该环境包含94个任务的模板，经过10种语言的母语者验证及针对性代码适配，确保语言自然性并保留无限实例生成与难度可调特性。系统支持跨语言平行数据的大规模生成，旨在推动多语言推理模型的研究与评估。

事件概述

Apple Machine Learning Research 发布了 Multilingual Reasoning Gym，作为其原有 Reasoning Gym (Stojanovski et al., 2025) 的多语言扩展版本。该环境旨在通过程序化方式在14种不同语言中生成可验证的推理问题，以支持多语言推理模型的研究。

核心信息

任务规模与覆盖：涵盖94个任务模板，已针对10种语言完成母语者验证，并进行了针对性的代码或模板适配以确保语言的自然度。
技术特性：
- 保留了原 Reasoning Gym 的核心优势，包括近乎无限的实例生成能力和可调节的难度级别。
- 适用于基于可验证奖励的强化学习（Reinforcement Learning from Verifiable Rewards）及各类评估场景。
- 由于环境的程序化本质，生成的问题在不同语言间具有平行性，支持大规模跨语言平行数据的生成。
开源情况：研究团队已公开实现代码（GitHub），供社区用于多语言推理模型的训练与测试。

值得关注

该项目的推出标志着程序化推理环境在多语言领域的规模化扩展，为解决大语言模型（LLMs）在分布外（distribution shifts）推理鲁棒性问题提供了新的数据基础。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？