蚂蚁百灵发布Ling-2.6-flash：104B总参数量模型，API定价低至0.1美元/百万token

2026/04/22 15:32阅读量 2

蚂蚁百灵于4月22日正式推出Ling-2.6-flash指令微调模型，该模型拥有104B总参数和7.4B激活参数，在多项Agent基准测试中达到同尺寸SOTA水平。其API定价极具竞争力，输入每百万token仅需0.1美元，输出为0.3美元，并开放了一周限时免费试用。上线后模型表现强劲，日均调用量达100B级别，周增长率超过5000%。

事件概述

4月22日，蚂蚁百灵正式发布Ling-2.6-flash模型。这是一款专为高效推理设计的Instruct模型，旨在平衡性能与成本，目前API已正式向用户开放。

核心信息

模型架构：
- 总参数量：104B
- 激活参数：7.4B
性能表现：
- 在多个Agent相关基准测试中达到同尺寸SOTA（State-of-the-Art）水平，包括：BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval及PinchBench。
API定价策略：
- 输入价格：$0.1 / 百万 tokens
- 输出价格：$0.3 / 百万 tokens
- 提供为期一周的限时免费试用。
市场反馈：
- 上线以来，日均tokens调用量已达100B级别。
- 周增长率超过5000%。

值得关注

此次发布的Ling-2.6-flash通过大幅降低API调用成本（输入端低至0.1美元），结合其在智能体（Agent）任务上的SOTA表现，显示出蚂蚁百灵在提升大模型商业化落地效率方面的策略调整。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？