蚂蚁百灵发布Ling-2.6-flash:104B总参数量模型,API定价低至0.1美元/百万token

2026/04/22 15:32阅读量 2

蚂蚁百灵于4月22日正式推出Ling-2.6-flash指令微调模型,该模型拥有104B总参数和7.4B激活参数,在多项Agent基准测试中达到同尺寸SOTA水平。其API定价极具竞争力,输入每百万token仅需0.1美元,输出为0.3美元,并开放了一周限时免费试用。上线后模型表现强劲,日均调用量达100B级别,周增长率超过5000%。

事件概述

4月22日,蚂蚁百灵正式发布Ling-2.6-flash模型。这是一款专为高效推理设计的Instruct模型,旨在平衡性能与成本,目前API已正式向用户开放。

核心信息

  • 模型架构
    • 总参数量:104B
    • 激活参数:7.4B
  • 性能表现
    • 在多个Agent相关基准测试中达到同尺寸SOTA(State-of-the-Art)水平,包括:BFCL-V4TAU2-benchSWE-bench VerifiedClaw-EvalPinchBench
  • API定价策略
    • 输入价格:$0.1 / 百万 tokens
    • 输出价格:$0.3 / 百万 tokens
    • 提供为期一周的限时免费试用。
  • 市场反馈
    • 上线以来,日均tokens调用量已达100B级别。
    • 周增长率超过5000%。

值得关注

此次发布的Ling-2.6-flash通过大幅降低API调用成本(输入端低至0.1美元),结合其在智能体(Agent)任务上的SOTA表现,显示出蚂蚁百灵在提升大模型商业化落地效率方面的策略调整。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。