Cursor推出Composer 2.5:成本仅为Opus 4.7的1/10,性能接近,背后依赖Kimi基模
Cursor发布Composer 2.5模型,基于Kimi K2.5基模并进行大量后训练(85%算力),性能接近Claude Opus 4.7,但成本仅为其1/10。模型在编程任务上表现优异,训练改进包括定向反馈、合成数据扩大25倍、底层并行优化。同时,Cursor与马斯克的SpaceXAI达成算力合作,后者获得600亿美元收购优先权或100亿美元“合作费”,反映Cursor为摆脱对Anthropic依赖而加速自研。
事件概述
Cursor发布编程模型Composer 2.5,基于Kimi K2.5基模,但85%训练算力用于自家后训练与强化学习。在多项基准上接近Claude Opus 4.7:Terminal-Bench 2.0为69.3% vs 69.4%,SWE-Bench Multilingual为79.8% vs 80.5%,CursorBench v3.1为63.2% vs 64.8%。定价为每百万输入token 0.50美元、输出2.50美元,约为Opus 4.7的1/10。此外提供更快的变体(输入3美元、输出15美元)。
训练改进
- 定向反馈:在RL训练中,模型出错时直接在当前上下文插入提示(如可用工具列表),生成“教师分布”压错误概率,提升特定行为。
- 合成数据规模扩大25倍:通过“功能删除”任务动态生成更难任务,模型需要重新实现被删除的功能。同时监控防止“奖励作弊”(如逆向工程类型检查或反编译字节码)。
- 底层优化:使用异步分布式正交化Muon优化器,通信与计算重叠,在1T参数模型上每步仅需0.2秒。MoE模型将非专家与专家权重HSDP布局分离,降低并行开销。
与马斯克的合作及背景
Cursor与SpaceXAI达成算力合作,Composer 2.5部分训练在Colossus 2集群完成。协议条款显示,SpaceX获得未来以600亿美元收购Cursor的优先权,否则Cursor需支付100亿美元“合作费”。此前马斯克曾批评Cursor“套壳”,此次转变被认为是典型的“马斯克式绑定”。Cursor自研模型的动机源于其与Anthropic关系的转变——Anthropic推出Claude Code后,从上游供应商变为直接竞争对手。Cursor选择转向SpaceXAI而非OpenAI、Anthropic、Google等,避免与自家编程产品冲突。
