蚂蚁百灵发布Ling-2.6-flash:104B总参数量模型,API定价低至0.1美元/百万token
2026/04/22 15:32阅读量 2
蚂蚁百灵于4月22日正式推出Ling-2.6-flash指令微调模型,该模型拥有104B总参数和7.4B激活参数,在多项Agent基准测试中达到同尺寸SOTA水平。其API定价极具竞争力,输入每百万token仅需0.1美元,输出为0.3美元,并开放了一周限时免费试用。上线后模型表现强劲,日均调用量达100B级别,周增长率超过5000%。
事件概述
4月22日,蚂蚁百灵正式发布Ling-2.6-flash模型。这是一款专为高效推理设计的Instruct模型,旨在平衡性能与成本,目前API已正式向用户开放。
核心信息
- 模型架构:
- 总参数量:104B
- 激活参数:7.4B
- 性能表现:
- 在多个Agent相关基准测试中达到同尺寸SOTA(State-of-the-Art)水平,包括:BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval及PinchBench。
- API定价策略:
- 输入价格:$0.1 / 百万 tokens
- 输出价格:$0.3 / 百万 tokens
- 提供为期一周的限时免费试用。
- 市场反馈:
- 上线以来,日均tokens调用量已达100B级别。
- 周增长率超过5000%。
值得关注
此次发布的Ling-2.6-flash通过大幅降低API调用成本(输入端低至0.1美元),结合其在智能体(Agent)任务上的SOTA表现,显示出蚂蚁百灵在提升大模型商业化落地效率方面的策略调整。
