Edge AI Daily 早报(6月9日):苹果WWDC推免费AI服务,OpenAI与Anthropic竞速IPO,谷歌订购300万颗Gaudi3芯片
2026/06/09 08:23阅读量 20
苹果在WWDC宣布为小开发者提供Foundation Models免费使用权;OpenAI提交机密IPO申请,Anthropic估值超OpenAI;谷歌向英特尔订购300万颗Gaudi3芯片,推动AI供应链多元化;AMD五年内向英国投资20亿英镑;美国AI数据中心年耗水预计2028年达730亿加仑;Google Agentic RAG框架准确率提升34%;Claude现已编写Anthropic超80%代码。
硅谷前沿
一、OpenAI与Anthropic竞速IPO
- OpenAI提交机密IPO申请,投后估值8520亿美元,主要因数据中心巨额支出压力。
- Anthropic已提交IPO申请,估值达9650亿美元,超越OpenAI成为AI行业估值最高企业。
- 2026年科技IPO大年,SpaceX计划上市估值1.75万亿美元。
二、苹果WWDC推免费AI服务
- 苹果宣布首次下载量不足200万的开发者可零成本使用Private Cloud Compute上的Foundation Models。
- 麦肯锡报告显示68%独立开发者因云服务费用高放弃AI集成。
- 谷歌、微软、Meta、亚马逊等对手纷纷降低定价,苹果优势在于生态绑定与隐私保护。
三、谷歌订购300万颗英特尔Gaudi3芯片
- 谷歌向英特尔采购逾300万颗Gaudi3 AI芯片,旨在减少对英伟达依赖(英伟达占约80%市场份额)。
- Gaudi3采用台积电5nm制程,FP8训练算力896 TFLOPS,成本比H100低约20%,性能仍差15%。生态建设是主要挑战:CUDA平台400万开发者 vs Habana SDK不足10万。
四、AMD 20亿英镑押注英国AI
- AMD未来五年向英国投资20亿英镑(约181亿元人民币),投入AI创新研究与人才培养,与帝国理工学院合作。
- MI300X是全球首款集成HBM3e内存的AI加速卡,FP8算力达1.58 ExaFLOPS,性能较上一代提升3倍以上。
五、英伟达领涨助推美股回稳
- 2026年6月8日美股科技板块反弹,纳斯达克单日上涨2.3%,英伟达领涨5%。
- 英伟达在AI硬件市场地位稳固,IDC数据显示其全球数据中心AI加速芯片份额超80%,CUDA生态覆盖超90% AI框架。
- 竞争加剧:AMD MI300X、英特尔Gaudi3等产品可能分流份额,中美芯片出口管制带来风险。
六、美国AI数据中心年耗水将达730亿加仑
- 年耗水量预计从2023年的170亿加仑增至2028年的730亿加仑(增长超3倍),冷却系统是主因。
- 约70%新建数据中心选址干旱地区,引发居民反对。行业转向空气冷却(水耗减少80%)和循环水系统。
- 多州出台监管措施:加州限制干旱区新增项目,科罗拉多州要求水资源影响评估。
七、Google Agentic RAG登场
- Google推出“Agentic RAG”框架,采用多智能体分工协作,核心是“充分上下文智能体”判断信息完整性并引导补充检索。
- 在FramesQA测试中准确率比传统RAG提升34%,跨4个数据库检索答对率仍保持90.1%。
- 适用于多跳查询、模糊问题及高风险场景,已在Gemini Enterprise Agent Platform开放预览。
八、英伟达与SK海力士联手研发HBM4
- SK海力士以约55%市占率主导HBM市场,2026年全球HBM市场规模预计达546亿美元(同比增长58%)。
- HBM4单颗带宽达2.5TB/s(远超HBM3E的819GB/s),采用12层堆叠,为英伟达Rubin平台提供核心支撑。
- 行业存在40%供需缺口,SK海力士占英伟达HBM4订单70%,三星在带宽(3TB/s)和产能上持续追赶。
九、NAVER与英伟达联手扩建AI基础设施
- 首期在世宗GAK数据中心启动55兆瓦算力,计划扩展至吉瓦级(1000兆瓦)。
- NAVER将基于英伟达DSX平台推进升级版HyperCLOVA X,成为首家加入Nemotron联盟的韩国企业,计划2024年下半年推出AI智能体平台。
十、英伟达与现代深化AI机器人合作
- 整合英伟达边缘AI平台、仿真工具与数字孪生技术,聚焦制造、物流、出行三大场景。
- 特斯拉Optimus计划2025年量产,ABB与微软合作整合Azure AI;商业化面临硬件软件兼容性、行业用例定义、监管安全三大挑战。
十一、美光科技产能缺口凸显
- 世界半导体贸易统计组织预测2026年全球半导体市场规模达1.511万亿美元(同比增90%),存储芯片市场预计突破8000亿美元。
- 美光FY26Q2营收238.6亿美元(同比增196%),将2026财年资本支出上调至250亿美元,1γ DRAM节点良率爬坡创历史最快纪录。
- 供应短缺预计持续至2030年,三大厂商加速HBM4量产布局。
十二、美国AI初创公司转向中国大语言模型
- OpenRouter平台数据显示,2026年初中国大模型周token调用量从2025年5月的2.16T跃升至20T以上。
- 2026年5月4日至10日,中国大模型周调用量达7.941万亿词元,连续六周超过美国模型居全球首位,全球前五中占四席。
- AI模型市场从品牌忠诚转向关注原始效用。
十三、英国20亿英镑AI超算战略
- 英国政府发布《计算路线图》,计划到2030年投入20亿英镑:7.5亿英镑建爱丁堡国家超算中心,10亿英镑将AI研究资源扩大20倍。
- 美国科技巨头2026年AI基建投入合计约7250亿美元;英伟达计划未来4年投入5000亿美元;OpenAI与软银、甲骨文“Stargate”项目计划5000亿美元。
- 全球AI算力竞争呈现中美欧三足鼎立格局。
十四、Claude编写Anthropic超80%代码
- 截至2026年5月,Anthropic代码库中超过80%的合并代码由Claude编写,而2025年2月前仅为个位数。
- 2026年Q2,工程师日均合并代码量达到2024年的8倍,工程师转向指导和审查角色。
- Claude在开放式复杂任务中的成功率在2026年5月达到76%(较六个月前提升50个百分点),代码质量已与人工代码持平,预计一年内超越人工代码。
