火猫 AI

核心服务定制优势系统升级 AI 智能体 Skills 定制开发

AI 工具扣子智能体

精选案例资讯中心

安全保障关于我们联系我们

每日 AI 资讯

美团开源 LongCat General 365，推出推理评测新基准

2026/05/15 16:01阅读量 4

美团开源了 LongCat General 365 基准，旨在为推理评测设立新标准。该基准聚焦于通用推理能力评估，为社区提供新的测试工具。

美团正式开源了 LongCat General 365 基准数据集/评测集。该项目被定位为推理评测的新标尺，用于评估模型的通用推理能力。开源举措旨在推动社区在推理评测领域的发展。

核心信息

项目名称: LongCat General 365
发布方: 美团
类型: 开源基准（评估集/数据集）
定位: 推理评测新标尺

值得关注

该基准的开源意味着开发者可基于此统一测试模型在多种推理任务上的表现，有助于对比不同模型的推理能力。

阅读原文详情

准备好启动您的定制项目了吗？

现在咨询，即可获得免费的业务梳理与技术架构建议方案。

联系我们查看案例