Meta AI成本失控、Cisco终结Prompt Engineering、OpenAI Token奖池落地——AI早报6月22日
Meta因员工30天消耗73.7万亿Token导致成本超10亿美元,紧急实施三级管控;Cisco推出FAPO框架实现Prompt自动化优化,在18组基准中胜出15组,宣告传统Prompt Engineering职业转型;OpenAI在京都启动Series T创业大赛,以Token作为奖池,推动算力资本化;现代全资收购波士顿动力,计划2028年前部署2.5万台Atlas人形机器人;特斯拉Cybercab进入新西兰测试,加速Robotaxi全球化。
硅谷前沿
一、Meta内部AI成本失控:73.7万亿Token教训
Meta在2026年6月因AI使用成本激增紧急转向:此前鼓励“tokenmaxxing”导致员工30天消耗73.7万亿Token、成本超10亿美元,现已实施三层管控(AI Gateway实时监控、2027年起Token预算配额、引导使用自研MetaCode工具)。Uber、Microsoft等企业同样面临类似困境,token单价下降(GPT-5 High降至每百万token 3.63美元)反而刺激总消费量指数增长(高盛预测2030年企业token消费增长24倍)。仅26%公司对AI成本有全面可见性,Linux基金会正推动Tokenomics Foundation产业标准。
二、Cisco FAPO终结Prompt Engineering
Cisco于2026年6月发布FAPO系统,实现LLM流水线“归因-诊断-修复”闭环。在18组模型-基准对比中胜出15组,平均增益+14.1个百分点(HoVer和IFBench任务+33.8个百分点)。架构采用三层递进优化(提示级→参数级→结构级)配合四类故障归因(检索、级联、格式、推理)。FAPO以Apache 2.0协议开源,推动提示工程从“艺术”转向“工程学”,人类工程师角色升级为定义优化目标的设计师。
三、OpenAI Series T落地京都:100万美元Token奖池
OpenAI完成1100亿美元融资后,将过剩算力转化为投资货币——向Y Combinator创业公司提供价值200万美元API Token换取股权。选择日本作为亚洲首个办公室所在地,在京都举办“Series T”创业大赛,利用日本劳动力缺口和数字化转型需求。算力换股权模式面临估值难题、锁定风险以及中国大模型厂商低成本替代的竞争压力。
四、现代全资收购波士顿动力的最后9.65%
现代汽车以3.25亿美元收购软银持有的波士顿动力9.65%股份,实现100%控股,公司估值从2021年11亿美元升至33.7亿美元。现代计划2028年前部署2.5万台Atlas人形机器人至自有工厂,建立年产3万台产能和30万个执行器的供应链,形成“全资控制→大规模部署→数据迭代→对外销售”闭环。行业层面,高盛预测2035年人形机器人市场规模达380亿美元,但存在供给超需求的结构性失衡。
五、特斯拉Cybercab驶入新西兰
Cybercab获EPA认证:47.6kWh电池、整备质量1,412kg、EPA续航418英里、能耗成本$0.023/公里(比传统网约车低约80%)。得州DMV数据显示Waymo注册577辆,特斯拉仅42辆,但特斯拉赌注低价策略($4.20/趟)和成本优势(目标售价<$30,000)。在新西兰进行冬季测试验证纯视觉低温性能,并向澳新推送FSD V14收集右舵数据。面临欧洲UN R157法规、4680电池良率、充电设施等全球化关卡。
六、工业AI死于车间而非模型——Cognite CTO的见解
MIT 2025年报告显示,企业生成式AI投资300-400亿美元中95%组织零财务回报。工业AI面临数据分散(SCADA、ERP遗留系统)、上下文缺失、传感器标定差异等难题。Cognite采用确定性平台层+概率性AI代理双层架构,明确AI参与边界:推荐RCA和维护优化(助理角色)、自动化工单创建(人类审批回路内)、不参与安全连锁控制。化工企业通过统一数据平台将50多个AI用例推广到50个站点,预测到2028年未利用AI优化的公司将面临竞争劣势。
七、Prompt Engineering从玩笑到年薪12.6万美元
全球提示工程市场规模达69.5亿美元(2026年),年复合增长率超32%,美国提示工程师年薪中位数12.6万美元,92%财富500强使用ChatGPT。技能需求从日常提示转向生产级上下文工程,岗位数量2024-2026年间增长3倍。但大多数用户仍停留在基础应用,存在不了解多模态能力、默认输出讨好用户、缺乏上下文工程意识三重缺憾。
八、AI代码审查危机
AI编程时代代码生成速度远超人类审查能力,开发者角色从“写代码”转向“审代码”。SpaceX以600亿美元收购Cursor母公司(年化收入40亿美元),Claude Opus 4.6在SWE-bench Verified达80.8%。组织竞争焦点转向“谁更会管理AI写的代码”,工具供应商的“可审查性”成为关键。
九、印度法院将“信息”定义扩展至软件,升级删帖令为平台禁用令
德里高等法院裁决将《信息技术法》第69A条中的“信息”扩至“软件”和“应用程序”,允许政府以平台架构助长有害内容为由整体封禁Telegram。印度政府因NEET考试泄题首次对即时通讯应用实施全国封锁,Telegram在印度有2.2亿用户(全球最大)。VPN下载量激增113%,裁决为全球监管提供先例,开启“容器监管”时代。
十、印度关税歧视要求
印度工商部长提出“歧视性优惠”:对美出口关税须低于越南(20%)、孟加拉(20%)等竞争对手。印度面临三重关税困局(美印临时协议降至18%未全落实、美国拟征额外301关税、特朗普随时重启关税)。以承诺五年购买5000亿美元美国商品为杠杆,要求获得比欧盟(15%)、日本(15%)更低的关税,锁定“中国+1”产业转移窗口。
国内进展
十一、国产模型转向工程交付,算力景气度进入超级周期
2026年6月,智谱AI发布GLM-5.2、月之暗面开源Kimi K2.7 Code,均聚焦编程与长上下文Agent,标志行业从“拼参数”到“拼工程”。DeepSeek完成510亿元融资(投后估值4000亿元),微信AI智能体进入灰度测试。存储芯片价格创历史新高(DRAM合约价Q1环比涨93%-98%),GPU租赁价格上行。Anthropic预计2026年Q2营收109亿美元并首次盈利(85%来自企业客户),验证B端商业路径,国产模型正复制此方向。
