DeepSeek永久降价V4-Pro API,对标Claude Code布局Agent编程工具
DeepSeek将V4-Pro模型API永久降价至原价四分之一,输入缓存命中价格降至0.025元/百万Tokens,输出降至6元/百万Tokens。同时密集招聘Agent岗位,从零构建Code Harness执行系统,计划推出全流程自动化编码Agent工具,目标是打造中国版Claude Code。低价策略显著降低编程与Agent高频调用成本,重构大模型API定价格局。
事件概述
DeepSeek于5月22日宣布V4-Pro模型API永久降价,此前经历预览版发布、折扣和缓存价格调整,最终将价格固定为原价的四分之一。降价后具体价格:
- 输入缓存命中:0.025元/百万Tokens
- 输入缓存未命中:3元/百万Tokens
- 输出:6元/百万Tokens
默认支持500并发,服务加速、稳定性提升。
核心信息
降价直接影响长上下文、代码分析、Agent多轮执行等高Token消耗场景,使其进入个人开发者与小团队预算。缓存命中价格(从0.1元降至0.025元)尤为关键:在100万tokens上下文、8 bit KV精度下,DeepSeek V4仅需约5.48GB HBM,远低于GLM5(60GB)和Qwen3-235B-A22B(89GB),大幅降低重复上下文调用成本。
国内API厂商(如智谱、MiniMax、月之暗面)面临定价压力;海外头部模型(Claude、OpenAI、Gemini)因市场与客户结构差异,短期影响有限。DeepSeek定价遵循“不贴钱、不赚暴利”原则,依托推理工程优化压低成本,长期目标是通过技术降低对高端硬件依赖,推动国产AI硬件生态。
值得关注:Agent布局与代码编程
DeepSeek近期密集招聘Agent相关岗位(含深度学习算法、数据策略、产品经理、研发工程师),资深研究员陈德里公开表示将从零构建Code Harness(Agent执行系统)。已吸纳曾获6次ACM亚洲区域赛金牌、在Jane Street工作9年的崔添翼等人才,其量化交易系统经验与编码Agent工程范式相通。
DeepSeek计划推出全流程自动化编码Agent工具(对标Claude Code),依托低价Token降低运行成本,搭配本地部署与企业权限控制,可满足政企、金融、制造等数据敏感行业需求。形成“低价获客-数据回流迭代-规模增长”正循环。AI编程全流程Agent化后,现有Coding Plan订阅模式与API中转站需重新定位,核心竞争力转向工程落地能力(项目理解、上下文选择、Tokens控制、企业环境管理)。
