马斯克急推编程模型Grok Build 0.1,实测低价但被指不如免费版DeepSeek
2026/06/01 15:10阅读量 2
xAI发布编程专用模型Grok Build 0.1,定价远低于GPT-5.5等顶级模型,实测仅花1.65美元就完成复杂微服务开发,但社区质疑其价比不如国产免费模型,且存在256K上下文窗口过短、代码安全漏洞等致命短板。
事件概述
xAI今日推出编程模型Grok Build 0.1,定价输入1美元/百万token、输出2美元/百万token,不到GPT-5.5和Opus 4.8的十分之一。智能体平台Kilo Code发布实测:仅用1.65美元,模型自主完成了包含退避重试、签名验证和数据库持久化的Webhook后端微服务。马斯克亲自转发称“物超所值”。
核心信息
- 定价策略:极度低价,意图以“试错自由”吸引开发者,效仿中国大模型性价比路线。
- 实测表现:展示了架构级规划深度(先调研再反问)、自主纠错能力(修复Bun ABI不匹配和Zod类型错误),全程工具调用零失败。
- 致命缺陷:
- 上下文窗口仅256K,无法处理大型遗留项目,容易产生幻觉。
- 代码安全审查发现:签名比对未使用抗时序攻击函数、泄露加密密钥、关键业务逻辑缺少集成测试。
- 社区反应:Kilo Code评论区直言“连免费版DeepSeek Flash都能处理此规模问题”;国内技术社区Linux.do评价“干活不主动、理解能力差”。
- 营销争议:延续“拒绝跑分、纯靠晒单”策略,缺乏第三方基准测试,被质疑幸存者偏差。
值得关注
- 性价比优势有限:与国产模型(如DeepSeek Flash免费版、阿里Qwen3.7 Max等)相比,Grok Build 0.1的价格并不具备绝对代差优势,且性能已被多项基准测试压制。
- 垂直专精路线:xAI试图复制Anthropic策略,从编程垂直领域切入,但长上下文能力和安全底线是能否挑战“御三家”(OpenAI、Anthropic、Google)的关键。
- 对开发者的启示:AI生成代码仍需人工审查,零门槛编程不等于可交付商业级产品,安全漏洞可能带来成倍修复成本。
